お知らせ 【グループ管理者の皆さま】成長し続けるエンジニアを支援する「Forkwell」と「connpass」が連携し、connpass上でイベントを開催するグループを2020年3月末まで支援いたします。詳しくはこちら by Forkwell

このエントリーをはてなブックマークに追加

8月

10

第2回 強化学習アーキテクチャ勉強会

Organizing : 山川宏

Registration info

参加者

Free

FCFS
26/40

Description

はじめに

強化学習は環境に柔軟に適応する知能エージェントにおける基本機能と考えられます。近年は深層学習などのアーキテクチャとして、認識技術と組み合わされて自動運転などの実践的な場でつかわれれはじめており、さらにロボットなどにおいても今後は適用されてゆくシーンが増えてゆくでしょう、こうした背景から、実践的な強化学習や,実世界で動かす強化学習(ロボット・自動運転),強化学習を部品として組み合わせる(アーキテクチャ),といったトピックについて重視し情報共有する場として強化学習アーキテクチャ勉強会を開始しました。

本勉強会において積極的に議論に加わっていただき、今後、論文紹介などの形で貢献いただけるかたの参加をお待ちしております。

当勉強会の運営方針などについては、https://rlarch.connpass.com/ を御覧ください。

今回は、東京大学の初谷さんに、連続行動空間を扱った強化学習について解説頂く予定です。興味の有る方は奮ってご参加下さい。

スケジュール

  • 18:50 〜18:55 オープニング
  • 18:55〜19:55 講演: 連続行動空間における強化学習 (初谷 怜慈) 発表45分、質疑応答15分
  • 19:55〜20:30 フリーディスカッション

※ 19:00にビル入り口が施錠されるため、19時以前に起こしください(万が一19時を過ぎてしまった場合はインターホンにてご連絡ください)

講演概要:

  • 発表者: 初谷怜慈 (東京大学)
  • タイトル:連続行動空間における強化学習
  • アブストラクト:強化学習の行動空間は離散空間か連続空間が考えられる。 Atari等のゲーム環境においては離散行動空間が用いられることが多い一方、現実世界におけるロボットの強化学習などでは連続行動空間が適している場合が多い。 連続行動空間における強化学習はいくつかの方向性に発展をしている。離散行動空間で用いられたDQNを連続空間に適用できるよう変形したNAF [0] 、微分不可能な損失関数 (hard attentionなど) において使われる方策勾配法をもちいたもの[1] とその発展手法[2,3]、さらにGANsのように異なるネットワークの勾配を方策の更新に使用するもの[4]などがある。 本発表ではまず連続行動空間の強化学習手法を基礎的なところから復習し、どのような研究の流れになっているのかについて発表する。
主要参考文献:

Media View all Media

If you add event media, up to 3 items will be shown here.

Feed

rl_architecture

rl_architecture published 第2回 強化学習アーキテクチャ勉強会.

08/09/2017 00:38

第2回 強化学習アーキテクチャ勉強会 has been published!

Group

Ended

2017/08/10(Thu)

18:45
20:30

開催日時が重複しているイベントに申し込んでいる場合、このイベントには申し込むことができません

Registration Period
2017/08/09(Wed) 00:37 〜
2017/08/10(Thu) 20:30

Location

φcafe

東京都文京区本郷5丁目24-5 角川本郷ビル6F

Organizer

Attendees(26)

gm3d2

gm3d2

第2回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

YoshiyaShibata

YoshiyaShibata

第2回 強化学習アーキテクチャ勉強会に参加を申し込みました!

i-shota

i-shota

第2回 強化学習アーキテクチャ勉強会に参加を申し込みました!

川村 正春

川村 正春

第2回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

sinyamada

sinyamada

第2回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

KSaka

KSaka

第2回 強化学習アーキテクチャ勉強会に参加を申し込みました!

ター

ター

第2回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

yukono

yukono

第2回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

KanjiTakanishi

KanjiTakanishi

第2回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

YuMurata

YuMurata

第2回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

Attendees (26)

Canceled (2)