お知らせ 【グループ管理者の皆さま】成長し続けるエンジニアを支援する「Forkwell」と「connpass」が連携し、connpass上でイベントを開催するグループを2020年3月末まで支援いたします。詳しくはこちら by Forkwell

このエントリーをはてなブックマークに追加

11月

28

第9回 強化学習アーキテクチャ勉強会

Organizing : 山川宏

Registration info

参加者

Free

FCFS
32/40

Description

はじめに

強化学習は環境に柔軟に適応する知能エージェントにおける基本機能と考えられます。近年は深層学習などのアーキテクチャとして、認識技術と組み合わされて自動運転などの実践的な場でつかわれれはじめており、さらにロボットなどにおいても今後は適用されてゆくシーンが増えてゆくでしょう、こうした背景から、実践的な強化学習や,実世界で動かす強化学習(ロボット・自動運転),強化学習を部品として組み合わせる(アーキテクチャ),といったトピックについて重視し情報共有する場として強化学習アーキテクチャ勉強会を開始しました。

本勉強会において積極的に議論に加わっていただき、今後、論文紹介などの形で貢献いただけるかたの参加をお待ちしております。

当勉強会の運営方針などについては、https://rlarch.connpass.com/ を御覧ください。

スケジュール

  • 18:50 〜18:55 オープニング
  • 18:55〜19:55 講演:高次行動の抽象化(甲野 佑)発表45分、質疑応答15分

※ 19:00にビル入り口が施錠されるため、19時以前に起こしください(万が一19時を過ぎてしまった場合はインターホンにてご連絡ください)

講演概要:

発表者:甲野 佑 (DeNA)

  • タイトル: 高次行動の抽象化

  • アブストラクト: スキルやオプションなど、強化学習で獲得される行動系列をより抽象度の高い表現に置き換えようとする研究分野がある。高次行動を抽象化する利点は様々あるが、プリミティブな試行錯誤では難しい長期的なアプローチでの探索が可能になる等が考えられる。また、有用なスキルを固定化、抽象化することで新規の環境に対する転用の効率化にも繋がりうる。 直感的に、人間の意思決定のレベルではプリミティブな行動から徐々に高次の行動=スキルでの意思決定に移行されていく。このようなプリミティブな行動の学習から高次の行動への抽象化に関する研究について、アプローチの異なる複数の論文を紹介する。

  • 参考文献:
    [1] Vezhnevets, A., Mnih, V., Osindero, S., Graves, A., Vinyals, O., Agapiou, J., et al.: Strategic attentive writer for learning macro-actions. In: Advances in Neural Information Processing Systems, pp. 3486–3494 (2016). [2] Saxe, A. M., Earle, A. C., & Rosman, B.: Hierarchy Through Composition with Multitask LMDPs. Proceedings of the 34th International Conference on Machine Learning, 70, 3017–3026. (2017).
    http://proceedings.mlr.press/v70/saxe17a.html
    [3] Guttenberg, N., Biehl, M., & Kanai, R.: Learning body-affordances to simplify action spaces, 1–4. (2017). http://arxiv.org/abs/1708.04391

Media View all Media

If you add event media, up to 3 items will be shown here.

Feed

rl_architecture

rl_architecture published 第9回 強化学習アーキテクチャ勉強会.

11/22/2017 17:05

第9回 強化学習アーキテクチャ勉強会 has been published!

Group

Ended

2017/11/28(Tue)

18:45
20:35

開催日時が重複しているイベントに申し込んでいる場合、このイベントには申し込むことができません

Registration Period
2017/11/22(Wed) 17:05 〜
2017/11/28(Tue) 20:35

Location

φcafe

東京都文京区本郷5丁目24-5 角川本郷ビル6F

Organizer

Attendees(32)

TakaakiKaneko

TakaakiKaneko

第9回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

Yusuke922

Yusuke922

第9回 強化学習アーキテクチャ勉強会に参加を申し込みました!

YusukeKanai

YusukeKanai

第9回 強化学習アーキテクチャ勉強会に参加を申し込みました!

3110foobar

3110foobar

第9回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

TomMoriyama

TomMoriyama

第9回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

i-shota

i-shota

第9回 強化学習アーキテクチャ勉強会に参加を申し込みました!

mabo

mabo

第9回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

JunkiYokokawa

JunkiYokokawa

第9回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

JohaneTakeuchi

JohaneTakeuchi

第9回 強化学習アーキテクチャ勉強会に参加を申し込みました!

msekine

msekine

第9回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

Attendees (32)

Canceled (5)