お知らせ connpassではさらなる価値のあるデータを提供するため、2024年5月23日(木)を以ちましてイベントサーチAPIの無料での提供の廃止を決定いたしました。
2024年5月23日(木)以降より開始予定の「connpass 有料API」の料金プランにつきましてはこちらをご覧ください。

お知らせ connpassをご利用いただく全ユーザーにおいて健全で円滑なイベントの開催や参加いただけるよう、イベント参加者向け・イベント管理者向けのガイドラインページを公開しました。内容をご理解の上、イベント内での違反行為に対応する参考としていただきますようお願いいたします。

このエントリーをはてなブックマークに追加

9月

19

第5回 強化学習アーキテクチャ勉強会

主催 : 山川宏

募集内容

参加者

無料

先着順
22/40

申込者
i-shota
TomMoriyama
sinyamada
Yusuke922
Y9oshi999
KanSAKAMOTO
KeiichirouYoshida
ikeyasu
ShigeharuMukai
pollen
申込者一覧を見る
開催日時
2017/09/19(火) 18:45 ~ 21:30
募集期間

2017/09/11(月) 09:15 〜
2017/09/19(火) 21:30まで

会場

φcafe

東京都文京区本郷5丁目24-5 角川本郷ビル6F

マップで見る 会場のサイトを見る

イベントの説明

はじめに

強化学習は環境に柔軟に適応する知能エージェントにおける基本機能と考えられます。近年は深層学習などのアーキテクチャとして、認識技術と組み合わされて自動運転などの実践的な場でつかわれれはじめており、さらにロボットなどにおいても今後は適用されてゆくシーンが増えてゆくでしょう、こうした背景から、実践的な強化学習や,実世界で動かす強化学習(ロボット・自動運転),強化学習を部品として組み合わせる(アーキテクチャ),といったトピックについて重視し情報共有する場として強化学習アーキテクチャ勉強会を開始しました。

本勉強会において積極的に議論に加わっていただき、今後、論文紹介などの形で貢献いただけるかたの参加をお待ちしております。

当勉強会の運営方針などについては、https://rlarch.connpass.com/ を御覧ください。

今回は、斎藤惇さんにICML2017の論文についてご発表いただきます.

スケジュール

  • 18:50 〜18:55 オープニング
  • 18:55〜19:45 講演:論文紹介 Improving Stochastic Policy Gradients in Continuous Control with Deep Reinforcement Learning using the Beta Distribution(斎藤惇) 発表35分、質疑応答15分
  • 19:45〜20:45 フリーディスカッション

※ 19:00にビル入り口が施錠されるため、19時以前に起こしください(万が一19時を過ぎてしまった場合はインターホンにてご連絡ください)

講演概要:

発表者1:斎藤惇

  • タイトル:論文紹介 Improving Stochastic Policy Gradients in Continuous Control with Deep Reinforcement Learning using the Beta Distribution

  • アブストラクト:

行動空間が連続値のときのアルゴリズムにおいて従来は方策をガウス分布でモデル化していた。ガウス分布では、行動空間に取りうる値の制限が存在しない。しかしながら、実際的な問題設定では、自動車のハンドルの角度などが限られた範囲しか回転しないといったように行動の取りうる値の範囲が限られていることが多い。本論文では、TRPOやACERにおいて、ベータ分布に変えたところガウス分布を上回る収束速度が得られた。

  • 参考文献:

    Chou, P.-W., Maturana, D., & Scherer, S. (2017). Improving Stochastic Policy Gradients in Continuous Control with Deep Reinforcement Learning using the Beta Distribution. In Proceedings of the 34th International Conference on Machine Learning (Vol. 70, pp. 834–843).

発表者

斎藤惇 斎藤惇

資料 資料をもっと見る/編集する

資料が投稿されると、最新の3件が表示されます。

フィード

rl_architecture

rl_architecture さんが 第5回 強化学習アーキテクチャ勉強会 を公開しました。

2017/09/11 09:15

第5回 強化学習アーキテクチャ勉強会 has been published!

グループ

強化学習アーキテクチャ勉強会

イベント数 54回

メンバー数 1008人

終了

2017/09/19(火)

18:45
21:30

開催日時が重複しているイベントに申し込んでいる場合、このイベントには申し込むことができません

募集期間
2017/09/11(月) 09:15 〜
2017/09/19(火) 21:30

会場

φcafe

東京都文京区本郷5丁目24-5 角川本郷ビル6F

管理者

参加者(22人)

i-shota

i-shota

第5回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

TomMoriyama

TomMoriyama

第5回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

sinyamada

sinyamada

第5回 強化学習アーキテクチャ勉強会に参加を申し込みました!

Yusuke922

Yusuke922

第5回 強化学習アーキテクチャ勉強会に参加を申し込みました!

Y9oshi999

Y9oshi999

第5回 強化学習アーキテクチャ勉強会に参加を申し込みました!

KanSAKAMOTO

KanSAKAMOTO

第5回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

KeiichirouYoshida

KeiichirouYoshida

第5回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

ikeyasu

ikeyasu

第5回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

ShigeharuMukai

ShigeharuMukai

第5回 強化学習アーキテクチャ勉強会に参加を申し込みました!

pollen

pollen

第5回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

参加者一覧(22人)

キャンセルした人(8人)