お知らせ 【技術コミュニティ運営者の皆さま】成長し続けるエンジニアを支援する「Forkwell」と「connpass」が連携し、connpass上でイベントを開催する技術コミュニティを2020年3月末まで支援いたします。詳しくはこちら by Forkwell

このエントリーをはてなブックマークに追加

4月

23

第37回 強化学習アーキテクチャ勉強会

Organizing : 山川宏

Registration info

参加者

Free

FCFS
53/50

Description

はじめに

強化学習は環境に柔軟に適応する知能エージェントにおける基本機能と考えられます。近年は深層学習などのアーキテクチャとして、認識技術と組み合わされて自動運転などの実践的な場でつかわれれはじめており、さらにロボットなどにおいても今後は適用されてゆくシーンが増えてゆくでしょう、こうした背景から、実践的な強化学習や,実世界で動かす強化学習(ロボット・自動運転),強化学習を部品として組み合わせる(アーキテクチャ),といったトピックについて重視し情報共有する場として強化学習アーキテクチャ勉強会を開始しました。

本勉強会において積極的に議論に加わっていただき、今後、論文紹介などの形で貢献いただけるかたの参加をお待ちしております。

当勉強会の運営方針などについては、https://rlarch.connpass.com/ を御覧ください。

会場の注意点

  • DEEPCORE様のご厚意により,2019年4月から会場がKERNEL HONGO(ユニゾ本郷四丁目ビル 3F)となります
  • 入室の際,参加者の把握のため,受付にて「お名前・ご所属・ご連絡先」を記入していただくことになりました(名刺をご提出いただく形でも構いません)
  • 19:00頃になると正面口(本郷通り沿い)にロックがかかりますので,なるべく遅刻しないようにお越しください.もし19:00をすぎる場合には,裏側の階段から3階に上がって頂く形になります.

ご協力の程,よろしくお願いいたします.

スケジュール

  • 18:50〜18:55 オープニング
  • 18:55〜19:45 マルチエージェント逆強化学習:相互作用する行動主体の報酬推定

講演概要:

発表者:浪越圭一(千葉大学)

  • タイトル:マルチエージェント逆強化学習:相互作用する行動主体の報酬推定

  • アブストラクト
    逆強化学習は,与えられた状態・行動の軌跡から,その軌跡を生成した報酬を推定する枠組みであり,強化学習における報酬設計や,軌跡の生成者がもつ目的推定に用いられる.しかしその多くは,シングルエージェント環境を対象とする.そのため,交通,群衆,分散ロボット,ゲームなど,複数エージェントの行動が報酬や状態遷移に影響するマルチエージェント環境への適用は容易ではない.その原因として,マルチエージェント系特有の協調・競合といったエージェント間の関係や,ゲーム理論で用いられる均衡解の考慮,もしくは緩和が必要となる点が挙げられる.
    本発表では,上記の問題に取り組むマルチエージェント逆強化学習について,文献を紹介する.

  • 参考文献
    [1] S. Natarajan, et al., "Multi-Agent Inverse Reinforcement Learning." in 2010 Ninth International Conference on Machine Learning and Applications, pp. 395–400 (2010)
    [2] T. S. Reddy, et al., "Inverse reinforcement learning for decentralized non-cooperative multiagent systems." in 2012 IEEE International Conference on Systems, pp. 1930–1935 (2012)
    [3] A. ŠoŠić, et al., "Inverse Reinforcement Learning in Swarm Systems." in Proceedings of the 16th Conference on Autonomous Agents and MultiAgent Systems, pp. 1413–1421 (2017)
    [4] K. Bogert and P. Doshi, "Multi-robot inverse reinforcement learning under occlusion with estimation of state transitions, Artificial Intelligence." vol. 263, pp. 46–73 (2018)
    [5] X. Lin, et al., "Multiagent Inverse Reinforcement Learning for Two-Person Zero-Sum Games." IEEE Transactions on Games, vol. 10, no. 1, pp. 56–68 (2018)
    [6] X. Wang and D. Klabjan, "Competitive Multi-agent Inverse Reinforcement Learning with Sub-optimal Demonstrations." in Proceedings of the 35th International Conference on Machine Learning, vol. 80, pp. 5143–5151 (2018)
    [7] Song, Jiaming, et al. "Multi-agent generative adversarial imitation learning." Advances in Neural Information Processing Systems, pp. 7461-7472 (2018)

Media View all Media

If you add event media, up to 3 items will be shown here.

Feed

rl_architecture

rl_architecture published 第37回 強化学習アーキテクチャ勉強会.

04/17/2019 15:31

第37回 強化学習アーキテクチャ勉強会 has been published!

Group

Ended

2019/04/23(Tue)

18:50
19:45

開催日時が重複しているイベントに申し込んでいる場合、このイベントには申し込むことができません

Registration Period
2019/04/17(Wed) 15:31 〜
2019/04/23(Tue) 19:45

Location

KERNEL HONGO

東京都文京区本郷4-1-4 ユニゾ本郷四丁目ビル 3F

Organizer

Attendees(50)

triwave33

triwave33

第37回 強化学習アーキテクチャ勉強会に参加を申し込みました!

Kenshi Abe

Kenshi Abe

第37回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

MotoShin

MotoShin

第37回 強化学習アーキテクチャ勉強会に参加を申し込みました!

Ayako_Shiraki

Ayako_Shiraki

第37回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

yosider

yosider

第37回 強化学習アーキテクチャ勉強会に参加を申し込みました!

omuram

omuram

第37回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

ryuhmd

ryuhmd

第37回 強化学習アーキテクチャ勉強会に参加を申し込みました!

msekine

msekine

第37回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

arima

arima

第37回 強化学習アーキテクチャ勉強会に参加を申し込みました!

Attendees (50)

Waitlist (3)

chankiyo

chankiyo

第37回 強化学習アーキテクチャ勉強会に参加を申し込みました!

code_name_tm

code_name_tm

第37回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

totomaru

totomaru

第37回 強化学習アーキテクチャ勉強会に参加を申し込みました!

Waitlist (3)

Canceled (17)