Description
重要なお知らせ9/3(月)
9/4(火)に予定しておりました「第25回 強化学習アーキテクチャ勉強会」ですが,台風21号の接近が予測されており,安全を考慮いたしました結果,延期とさせていただきます.イベント直前のご案内になりましたことをお詫び申し上げます.
なお,9/4(火)に予定していたイベントの内容は,9/18(火)におこなう予定です. 再来週9/18(火)に皆さまにお会いできることを楽しみにしております. ご来場お待ちしております.
はじめに
強化学習は環境に柔軟に適応する知能エージェントにおける基本機能と考えられます。近年は深層学習などのアーキテクチャとして、認識技術と組み合わされて自動運転などの実践的な場でつかわれれはじめており、さらにロボットなどにおいても今後は適用されてゆくシーンが増えてゆくでしょう、こうした背景から、実践的な強化学習や,実世界で動かす強化学習(ロボット・自動運転),強化学習を部品として組み合わせる(アーキテクチャ),といったトピックについて重視し情報共有する場として強化学習アーキテクチャ勉強会を開始しました。
本勉強会において積極的に議論に加わっていただき、今後、論文紹介などの形で貢献いただけるかたの参加をお待ちしております。
当勉強会の運営方針などについては、https://rlarch.connpass.com/ を御覧ください。
- Google Group: https://goo.gl/xznKlY (注:KlYのIは「L」の小文字です)
- Slack: https://join.slack.com/t/rlarch/shared_invite/MjM2Mzc3MDE1MzYyLTE1MDQ2MjIzNDItNjFmNmU2NWJlYg
- Twitter: #rlarch 勉強会のハッシュタグを作りました.コメントや質問等にご活用ください.
スケジュール
- 18:50 〜18:55 オープニング
- 18:55〜19:45 論文&実験結果の紹介:Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments
※ 19:00にビル入り口が施錠されるため、19時以前にお越しください(万が一19時を過ぎてしまった場合はインターホンにてご連絡ください)
講演概要:
発表者:勝田隼一郎(GMOインターネット株式会社)
-
タイトル:
論文&実験結果の紹介:Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments -
アブストラクト:
マルチエージェント強化学習では、複数のエージェントが自身の報酬を最大化するように、競合や協調といった行動を学習する。学習される行動は、設定された環境により大きく変化する。今回、発表者はゲーム環境を変化させることで、マルチエージェントの学習がどのように変化するかの実験を行った。具体的には、OpenAIが作成したマルチエージェント強化学習用の環境ライブラリを用いて、参考論文中の実験結果の再現を試みた。さらにライブラリを使い新しいゲーム(環境)を作成して、マルチエージェント強化学習の実験を行った。参考論文は本勉強会の第18回で既に紹介されているため、論文紹介は最低限にとどめ、実験の説明および得られた結果と知見の紹介をメインに発表を行う予定である。 -
参考文献:
[1] Lowe, Ryan, et al. "Multi-agent actor-critic for mixed cooperative-competitive environments." Advances in Neural Information Processing Systems. 2017. https://arxiv.org/abs/1706.02275 -
関連資料:
[1] 本発表で話す予定のスライド1: https://www.slideshare.net/JunichiroKatsuta/ss-108099238
[2] 本発表で話す予定のスライド2: https://www.slideshare.net/JunichiroKatsuta/ss-108099542
[3] 本発表で話す予定の実験のGitHub codes: https://github.com/jkatsuta/exp-18-1q
Media View all Media
If you add event media, up to 3 items will be shown here.