機能改善 領収データ発行機能にてインボイス制度の書式での出力に対応しました。 詳しくはこちらをご覧ください。

新機能 参加者によるイベント出席機能をリリースしました。今までは主催者による出席管理機能はありましたが、大規模イベント等での受付処理が大変とのフィードバックをいただいてました。今後はイベント作成時に発行される「出席コード」を会場現地や配信で共有してもらうことで、参加者自身でイベント出席登録を行うことができるようになります。これにより受付処理が容易になりますので、イベント主催者の皆様はぜひご活用ください。詳しくはこちらをご確認ください。

このエントリーをはてなブックマークに追加

Apr

23

第37回 強化学習アーキテクチャ勉強会

Organizing : 山川宏

Registration info

参加者

Free

FCFS
53/50

Description

はじめに

強化学習は環境に柔軟に適応する知能エージェントにおける基本機能と考えられます。近年は深層学習などのアーキテクチャとして、認識技術と組み合わされて自動運転などの実践的な場でつかわれれはじめており、さらにロボットなどにおいても今後は適用されてゆくシーンが増えてゆくでしょう、こうした背景から、実践的な強化学習や,実世界で動かす強化学習(ロボット・自動運転),強化学習を部品として組み合わせる(アーキテクチャ),といったトピックについて重視し情報共有する場として強化学習アーキテクチャ勉強会を開始しました。

本勉強会において積極的に議論に加わっていただき、今後、論文紹介などの形で貢献いただけるかたの参加をお待ちしております。

当勉強会の運営方針などについては、https://rlarch.connpass.com/ を御覧ください。

会場の注意点

  • DEEPCORE様のご厚意により,2019年4月から会場がKERNEL HONGO(ユニゾ本郷四丁目ビル 3F)となります
  • 入室の際,参加者の把握のため,受付にて「お名前・ご所属・ご連絡先」を記入していただくことになりました(名刺をご提出いただく形でも構いません)
  • 19:00頃になると正面口(本郷通り沿い)にロックがかかりますので,なるべく遅刻しないようにお越しください.もし19:00をすぎる場合には,裏側の階段から3階に上がって頂く形になります.

ご協力の程,よろしくお願いいたします.

スケジュール

  • 18:50〜18:55 オープニング
  • 18:55〜19:45 マルチエージェント逆強化学習:相互作用する行動主体の報酬推定

講演概要:

発表者:浪越圭一(千葉大学)

  • タイトル:マルチエージェント逆強化学習:相互作用する行動主体の報酬推定

  • アブストラクト
    逆強化学習は,与えられた状態・行動の軌跡から,その軌跡を生成した報酬を推定する枠組みであり,強化学習における報酬設計や,軌跡の生成者がもつ目的推定に用いられる.しかしその多くは,シングルエージェント環境を対象とする.そのため,交通,群衆,分散ロボット,ゲームなど,複数エージェントの行動が報酬や状態遷移に影響するマルチエージェント環境への適用は容易ではない.その原因として,マルチエージェント系特有の協調・競合といったエージェント間の関係や,ゲーム理論で用いられる均衡解の考慮,もしくは緩和が必要となる点が挙げられる.
    本発表では,上記の問題に取り組むマルチエージェント逆強化学習について,文献を紹介する.

  • 参考文献
    [1] S. Natarajan, et al., "Multi-Agent Inverse Reinforcement Learning." in 2010 Ninth International Conference on Machine Learning and Applications, pp. 395–400 (2010)
    [2] T. S. Reddy, et al., "Inverse reinforcement learning for decentralized non-cooperative multiagent systems." in 2012 IEEE International Conference on Systems, pp. 1930–1935 (2012)
    [3] A. ŠoŠić, et al., "Inverse Reinforcement Learning in Swarm Systems." in Proceedings of the 16th Conference on Autonomous Agents and MultiAgent Systems, pp. 1413–1421 (2017)
    [4] K. Bogert and P. Doshi, "Multi-robot inverse reinforcement learning under occlusion with estimation of state transitions, Artificial Intelligence." vol. 263, pp. 46–73 (2018)
    [5] X. Lin, et al., "Multiagent Inverse Reinforcement Learning for Two-Person Zero-Sum Games." IEEE Transactions on Games, vol. 10, no. 1, pp. 56–68 (2018)
    [6] X. Wang and D. Klabjan, "Competitive Multi-agent Inverse Reinforcement Learning with Sub-optimal Demonstrations." in Proceedings of the 35th International Conference on Machine Learning, vol. 80, pp. 5143–5151 (2018)
    [7] Song, Jiaming, et al. "Multi-agent generative adversarial imitation learning." Advances in Neural Information Processing Systems, pp. 7461-7472 (2018)

Media View all Media

If you add event media, up to 3 items will be shown here.

Feed

rl_architecture

rl_architecture published 第37回 強化学習アーキテクチャ勉強会.

04/17/2019 15:31

第37回 強化学習アーキテクチャ勉強会 has been published!

Group

Ended

2019/04/23(Tue)

18:50
19:45

You cannot RSVP if you are already participating in another event at the same date.

Registration Period
2019/04/17(Wed) 15:31 〜
2019/04/23(Tue) 19:45

Location

KERNEL HONGO

東京都文京区本郷4-1-4 ユニゾ本郷四丁目ビル 3F

Organizer

Attendees(50)

triwave33

triwave33

第37回 強化学習アーキテクチャ勉強会に参加を申し込みました!

Kenshi Abe

Kenshi Abe

第37回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

MotoShin

MotoShin

第37回 強化学習アーキテクチャ勉強会に参加を申し込みました!

Ayako_Shiraki

Ayako_Shiraki

第37回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

yosider

yosider

第37回 強化学習アーキテクチャ勉強会に参加を申し込みました!

omuram

omuram

第37回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

ryuhmd

ryuhmd

第37回 強化学習アーキテクチャ勉強会に参加を申し込みました!

MMM

MMM

第37回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

arima

arima

第37回 強化学習アーキテクチャ勉強会に参加を申し込みました!

Attendees (50)

Waitlist (3)

chankiyo

chankiyo

第37回 強化学習アーキテクチャ勉強会に参加を申し込みました!

code_name_tm

code_name_tm

第37回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

totomaru

totomaru

第37回 強化学習アーキテクチャ勉強会に参加を申し込みました!

Waitlist (3)

Canceled (17)