お知らせ connpassではさらなる価値のあるデータを提供するため、2024年5月23日(木)を以ちましてイベントサーチAPIの無料での提供の廃止を決定いたしました。
2024年5月23日(木)以降より開始予定の「connpass 有料API」の料金プランにつきましてはこちらをご覧ください。
なお有料の対象となるのはAPIのみであり、connpassのサービスにつきましては今後も無料でご利用いただけます。

このエントリーをはてなブックマークに追加

4月

23

第37回 強化学習アーキテクチャ勉強会

主催 : 山川宏

第37回 強化学習アーキテクチャ勉強会
募集内容

参加者

無料

先着順
53/50

申込者
triwave33
Kenshi Abe
MotoShin
Ayako_Shiraki
non
yosider
omuram
ryuhmd
MMM
arima
申込者一覧を見る
開催日時
2019/04/23(火) 18:50 ~ 19:45
募集期間

2019/04/17(水) 15:31 〜
2019/04/23(火) 19:45まで

会場

KERNEL HONGO

東京都文京区本郷4-1-4 ユニゾ本郷四丁目ビル 3F

マップで見る

イベントの説明

はじめに

強化学習は環境に柔軟に適応する知能エージェントにおける基本機能と考えられます。近年は深層学習などのアーキテクチャとして、認識技術と組み合わされて自動運転などの実践的な場でつかわれれはじめており、さらにロボットなどにおいても今後は適用されてゆくシーンが増えてゆくでしょう、こうした背景から、実践的な強化学習や,実世界で動かす強化学習(ロボット・自動運転),強化学習を部品として組み合わせる(アーキテクチャ),といったトピックについて重視し情報共有する場として強化学習アーキテクチャ勉強会を開始しました。

本勉強会において積極的に議論に加わっていただき、今後、論文紹介などの形で貢献いただけるかたの参加をお待ちしております。

当勉強会の運営方針などについては、https://rlarch.connpass.com/ を御覧ください。

会場の注意点

  • DEEPCORE様のご厚意により,2019年4月から会場がKERNEL HONGO(ユニゾ本郷四丁目ビル 3F)となります
  • 入室の際,参加者の把握のため,受付にて「お名前・ご所属・ご連絡先」を記入していただくことになりました(名刺をご提出いただく形でも構いません)
  • 19:00頃になると正面口(本郷通り沿い)にロックがかかりますので,なるべく遅刻しないようにお越しください.もし19:00をすぎる場合には,裏側の階段から3階に上がって頂く形になります.

ご協力の程,よろしくお願いいたします.

スケジュール

  • 18:50〜18:55 オープニング
  • 18:55〜19:45 マルチエージェント逆強化学習:相互作用する行動主体の報酬推定

講演概要:

発表者:浪越圭一(千葉大学)

  • タイトル:マルチエージェント逆強化学習:相互作用する行動主体の報酬推定

  • アブストラクト
    逆強化学習は,与えられた状態・行動の軌跡から,その軌跡を生成した報酬を推定する枠組みであり,強化学習における報酬設計や,軌跡の生成者がもつ目的推定に用いられる.しかしその多くは,シングルエージェント環境を対象とする.そのため,交通,群衆,分散ロボット,ゲームなど,複数エージェントの行動が報酬や状態遷移に影響するマルチエージェント環境への適用は容易ではない.その原因として,マルチエージェント系特有の協調・競合といったエージェント間の関係や,ゲーム理論で用いられる均衡解の考慮,もしくは緩和が必要となる点が挙げられる.
    本発表では,上記の問題に取り組むマルチエージェント逆強化学習について,文献を紹介する.

  • 参考文献
    [1] S. Natarajan, et al., "Multi-Agent Inverse Reinforcement Learning." in 2010 Ninth International Conference on Machine Learning and Applications, pp. 395–400 (2010)
    [2] T. S. Reddy, et al., "Inverse reinforcement learning for decentralized non-cooperative multiagent systems." in 2012 IEEE International Conference on Systems, pp. 1930–1935 (2012)
    [3] A. ŠoŠić, et al., "Inverse Reinforcement Learning in Swarm Systems." in Proceedings of the 16th Conference on Autonomous Agents and MultiAgent Systems, pp. 1413–1421 (2017)
    [4] K. Bogert and P. Doshi, "Multi-robot inverse reinforcement learning under occlusion with estimation of state transitions, Artificial Intelligence." vol. 263, pp. 46–73 (2018)
    [5] X. Lin, et al., "Multiagent Inverse Reinforcement Learning for Two-Person Zero-Sum Games." IEEE Transactions on Games, vol. 10, no. 1, pp. 56–68 (2018)
    [6] X. Wang and D. Klabjan, "Competitive Multi-agent Inverse Reinforcement Learning with Sub-optimal Demonstrations." in Proceedings of the 35th International Conference on Machine Learning, vol. 80, pp. 5143–5151 (2018)
    [7] Song, Jiaming, et al. "Multi-agent generative adversarial imitation learning." Advances in Neural Information Processing Systems, pp. 7461-7472 (2018)

資料 資料をもっと見る/編集する

資料が投稿されると、最新の3件が表示されます。

フィード

rl_architecture

rl_architecture さんが 第37回 強化学習アーキテクチャ勉強会 を公開しました。

2019/04/17 15:31

第37回 強化学習アーキテクチャ勉強会 has been published!

グループ

強化学習アーキテクチャ勉強会

イベント数 54回

メンバー数 1008人

終了

2019/04/23(火)

18:50
19:45

開催日時が重複しているイベントに申し込んでいる場合、このイベントには申し込むことができません

募集期間
2019/04/17(水) 15:31 〜
2019/04/23(火) 19:45

会場

KERNEL HONGO

東京都文京区本郷4-1-4 ユニゾ本郷四丁目ビル 3F

管理者

参加者(50人)

triwave33

triwave33

第37回 強化学習アーキテクチャ勉強会に参加を申し込みました!

Kenshi Abe

Kenshi Abe

第37回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

MotoShin

MotoShin

第37回 強化学習アーキテクチャ勉強会に参加を申し込みました!

Ayako_Shiraki

Ayako_Shiraki

第37回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

yosider

yosider

第37回 強化学習アーキテクチャ勉強会に参加を申し込みました!

omuram

omuram

第37回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

ryuhmd

ryuhmd

第37回 強化学習アーキテクチャ勉強会に参加を申し込みました!

MMM

MMM

第37回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

arima

arima

第37回 強化学習アーキテクチャ勉強会に参加を申し込みました!

参加者一覧(50人)

補欠者(3人)

chankiyo

chankiyo

第37回 強化学習アーキテクチャ勉強会に参加を申し込みました!

code_name_tm

code_name_tm

第37回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

totomaru

totomaru

第37回 強化学習アーキテクチャ勉強会に参加を申し込みました!

補欠者一覧(3人)

キャンセルした人(17人)