お知らせ 現在、検索機能において不具合が出ているため、一時的に機能を閉鎖しております。改修次第、検索機能をリリースのうえ、お知らせいたしますので、ご不便をおかけしますが何卒ご了承ください。

このエントリーをはてなブックマークに追加

2月

27

第13回 強化学習アーキテクチャ勉強会

主催 : 山川宏

募集内容

参加者

無料

先着順
39/40

イベントの説明

はじめに

強化学習は環境に柔軟に適応する知能エージェントにおける基本機能と考えられます。近年は深層学習などのアーキテクチャとして、認識技術と組み合わされて自動運転などの実践的な場でつかわれれはじめており、さらにロボットなどにおいても今後は適用されてゆくシーンが増えてゆくでしょう、こうした背景から、実践的な強化学習や,実世界で動かす強化学習(ロボット・自動運転),強化学習を部品として組み合わせる(アーキテクチャ),といったトピックについて重視し情報共有する場として強化学習アーキテクチャ勉強会を開始しました。

本勉強会において積極的に議論に加わっていただき、今後、論文紹介などの形で貢献いただけるかたの参加をお待ちしております。

当勉強会の運営方針などについては、https://rlarch.connpass.com/ を御覧ください。

スケジュール

  • 18:50 〜18:55 オープニング
  • 18:55〜19:40 講演:Diversity is all You Need: Learning Skills without a Reward Function 発表・質疑応答45分

※ 19:00にビル入り口が施錠されるため、19時以前に起こしください(万が一19時を過ぎてしまった場合はインターホンにてご連絡ください)

講演概要:

発表者:森山朋美

  • タイトル: Diversity is all You Need: Learning Skills without a Reward Function

  • アブストラクト: 知的生物は環境を探索し、教示なしに有用なスキルを身につけることができる。 本論文の提案手法である「DIAYN:Diversity is All You Need(多様性こそすべて)」では、報酬関数なしにスキルを獲得できる。 この手法では、情報理論ではお馴染みの目的関数「エントロピー最大化方策」を用いてスキルを学習する。 様々なロボット制御タスクにおいて、エントロピー最大化という単純な目的関数のもと、歩行や跳躍といった多様なスキルを教示なしに獲得することができた。 数ある強化学習ベンチマークにおいても、なんら報酬を与えることなく、タスクをクリアできた。タスクごとに、タスクに見合ったスキルが獲得された。 強化学習の長年の課題である「探索とデータ効率化」問題を解決するための事前学習手法として、この「教示なし学習によるスキル獲得」は有効である。

  • 参考文献
    [1] Eysenbach, Benjamin, et al. "Diversity is All You Need: Learning Skills without a Reward Function." arXiv preprint arXiv:1802.06070 (2018).

資料 資料をもっと見る/編集する

資料が投稿されると、最新の3件が表示されます。

フィード

rl_architecture

rl_architecture さんが 第13回 強化学習アーキテクチャ勉強会 を公開しました。

2018/02/23 07:45

第13回 強化学習アーキテクチャ勉強会 has been published!

終了

2018/02/27(火)

18:45
19:40

開催日時が重複しているイベントに申し込んでいる場合、このイベントには申し込むことができません

募集期間
2018/02/23(金) 07:44 〜
2018/02/27(火) 19:40

会場

φcafe

東京都文京区本郷5丁目24-5 角川本郷ビル6F

管理者

参加者(39人)

hei4

hei4

第13回 強化学習アーキテクチャ勉強会に参加を申し込みました!

Yusuke922

Yusuke922

第13回 強化学習アーキテクチャ勉強会に参加を申し込みました!

ishizaki-yuko

ishizaki-yuko

第13回 強化学習アーキテクチャ勉強会に参加を申し込みました!

i-shota

i-shota

第13回 強化学習アーキテクチャ勉強会に参加を申し込みました!

yasunari morita

yasunari morita

第13回 強化学習アーキテクチャ勉強会に参加を申し込みました!

hiroaki

hiroaki

第13回 強化学習アーキテクチャ勉強会に参加を申し込みました!

slipstream

slipstream

第13回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

gm3d2

gm3d2

第13回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

tamaki

tamaki

第13回 強化学習アーキテクチャ勉強会に参加を申し込みました!

TomMoriyama

TomMoriyama

第13回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

参加者一覧(39人)

キャンセルした人(6人)