機能改善 イベント資料の投稿において、SlideShareやSpeakerDeckと同様に、Docswellの資料を埋め込みスライド表示できるように対応いたしました。資料の投稿機能は、資料URLを指定するだけで、URLから取得した情報を、適した形でconnpass上で表示・共有できる機能です

このエントリーをはてなブックマークに追加

Jul

20

第1回 強化学習アーキテクチャ勉強会

Organizing : 山川宏

Registration info

参加者

Free

FCFS
28/40

Description

はじめに

強化学習は環境に柔軟に適応する知能エージェントにおける基本機能と考えられます。近年は深層学習などのアーキテクチャとして、認識技術と組み合わされて自動運転などの実践的な場でつかわれれはじめており、さらにロボットなどにおいても今後は適用されてゆくシーンが増えてゆくでしょう、こうした背景から、実践的な強化学習や,実世界で動かす強化学習(ロボット・自動運転),強化学習を部品として組み合わせる(アーキテクチャ),といったトピックについて重視し情報共有する場として強化学習アーキテクチャ勉強会を開始しました。

本勉強会において積極的に議論に加わっていただき、今後、論文紹介などの形で貢献いただけるかたの参加をお待ちしております。

当勉強会の運営方針などについては、https://rlarch.connpass.com/ を御覧ください。

今回は、DeNAの甲野佑さんに、階層型強化学習において最近提案されているFeUdal Networks (FuNs)について解説頂く予定です。興味の有る方は奮ってご参加下さい。

スケジュール

  • 18:45 〜18:55 オープニング
  • 18:55〜19:55 講演: FeUdal Networks for Hierarchical Reinforcement Learning (甲野 佑) 発表45分、質疑応答15分
  • 19:55〜20:30 フリーディスカッション

講演概要:

  • 発表者: 甲野 佑 (DeNA)
  • タイトル:FeUdal Networks for Hierarchical Reinforcement Learning
  • アブストラクト:深層学習技術の導入により強化学習近分野が目覚ましい発展を遂げている.しかし環境を表現する完全な情報を得られるわけでは無い場合(e.g. Montezuma's Revenge)や,マルチエージェント性等から課題が複雑すぎる場合に対する対処については前述の発展と比較して進んでいるとは言えない.これらの問題の対処には中期的なサブ目標とそれを達成するサブ方策(Option 等),さらにサブ方策を学習するための内部報酬によって課題分解して学習する階層型強化学習のアプローチが用いられる.しかしサブ目標の自律的な分離・生成の学習は困難であり,多くは明示的に与える形式が取られる.それに対し DeepMind は feudal reinforcement learning (FRL, Dayan & Hinton,1993) という非深層強化学習アーキテクチャを微分可能なネットワーク,FuN として構築し,end-to-end な階層型強化学習の手法を提案している.本発表ではその紹介を行う.
主要参考文献:
  • Vezhnevets, A. S., Osindero, S., Schaul, T., Heess, N., Jaderberg, M., Silver, D., & Kavukcuoglu, K. (2017). FeUdal Networks for Hierarchical Reinforcement Learning. ArXiv. Retrieved from http://arxiv.org/abs/1703.01161

Media View all Media

If you add event media, up to 3 items will be shown here.

Feed

TomokazuKitamura

TomokazuKitamura wrote a comment.

2017/07/20 18:49

少し遅れます。

rl_architecture

rl_architecture published 第1回 強化学習アーキテクチャ勉強会.

07/14/2017 23:23

第1回 強化学習アーキテクチャ勉強会 has been published!

Group

Ended

2017/07/20(Thu)

18:45
20:30

You cannot RSVP if you are already participating in another event at the same date.

Registration Period
2017/07/14(Fri) 23:23 〜
2017/07/20(Thu) 20:30

Location

φcafe

東京都文京区本郷5丁目24-5 角川本郷ビル6F

Organizer

Attendees(28)

Hide_T

Hide_T

第1回 強化学習アーキテクチャ勉強会に参加を申し込みました!

AkiraUrano

AkiraUrano

第1回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

KanSAKAMOTO

KanSAKAMOTO

第1回 強化学習アーキテクチャ勉強会に参加を申し込みました!

taichi-iki

taichi-iki

第1回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

生島高裕

生島高裕

第1回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

i-shota

i-shota

第1回 強化学習アーキテクチャ勉強会に参加を申し込みました!

川村 正春

川村 正春

第1回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

TomokazuKitamura

TomokazuKitamura

第1回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

pos

pos

第1回 強化学習アーキテクチャ勉強会に参加を申し込みました!

bryutus

bryutus

第1回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

Attendees (28)

Canceled (15)