Description
はじめに
強化学習は環境に柔軟に適応する知能エージェントにおける基本機能と考えられます。近年は深層学習などのアーキテクチャとして、認識技術と組み合わされて自動運転などの実践的な場でつかわれれはじめており、さらにロボットなどにおいても今後は適用されてゆくシーンが増えてゆくでしょう、こうした背景から、実践的な強化学習や,実世界で動かす強化学習(ロボット・自動運転),強化学習を部品として組み合わせる(アーキテクチャ),といったトピックについて重視し情報共有する場として強化学習アーキテクチャ勉強会を開始しました。
本勉強会において積極的に議論に加わっていただき、今後、論文紹介などの形で貢献いただけるかたの参加をお待ちしております。
当勉強会の運営方針などについては、https://rlarch.connpass.com/ を御覧ください。
- Google Group: https://goo.gl/xznKlY (注:KlYのIは「L」の小文字です)
- Slack: https://join.slack.com/t/rlarch/shared_invite/MjM2Mzc3MDE1MzYyLTE1MDQ2MjIzNDItNjFmNmU2NWJlYg
- Twitter: #rlarch 勉強会のハッシュタグを作りました.コメントや質問等にご活用ください.
会場の注意点:
- DEEPCORE様のご厚意により,2019年4月から会場がKERNEL HONGO(ユニゾ本郷四丁目ビル 3F)となります.
- 入室の際,参加者の把握のため,受付にて「お名前・ご所属・ご連絡先」を記入していただくことになりました(名刺をご提出いただく形でも構いません).
- 19:00頃になると正面口(本郷通り沿い)にロックがかかりますので,もし19:00をすぎる場合には,裏側の階段から3階に上がって頂く形になります.
ご協力の程,よろしくお願いいたします.
スケジュール
- 19:15〜19:20 オープニング
- 19:20〜20:10 タイトル:最新の多様な深層強化学習モデルとその応用
講演概要:
発表者:今井翔太
-
タイトル:最新の多様な深層強化学習モデルとその応用
-
アブストラクト
本発表では,近年のトップ会議(NIPS, ICML, ICLR)の論文を中心に,マルチエージェント,ゲーム理論,内発的報酬など,多様な学習方式を利用した最新の深層強化学習の研究事例について解説する. また,最新の深層強化学習研究の応用事例としてDeepMindが開発したAlphaStar,OpenAIが開発したOpenAI Fiveなどについても,関連論文やゲーム自体の解説と共に紹介する. -
参考文献
World Discovery Models https://arxiv.org/abs/1902.07685
Social Influence as Intrinsic Motivation for Multi-Agent Deep Reinforcement Learning https://arxiv.org/abs/1810.08647
Emergent Complexity via Multi-Agent Competition https://arxiv.org/abs/1710.03748
Open-ended Learning in Symmetric Zero-sum Games https://arxiv.org/abs/1901.08106
Human-level performance in 3D multiplayer games with population-based reinforcement learning https://science.sciencemag.org/content/364/6443/859 …
Re-evaluating Evaluation https://arxiv.org/abs/1806.02643
A Unified Game-Theoretic Approach to Multiagent Reinforcement Learning https://arxiv.org/abs/1711.00832
https://deepmind.com/blog/alphastar-mastering-real-time-strategy-game-starcraft-ii/ https://openai.com/blog/openai-five/#rapid
Media View all Media
If you add event media, up to 3 items will be shown here.