新機能 イベントの「参加者への情報」欄に Markdown をご利用いただけるようになりました。詳しくは こちら をご確認ください

このエントリーをはてなブックマークに追加

Mar

13

第14回 強化学習アーキテクチャ勉強会

Organizing : 山川宏

Registration info

参加者

Free

FCFS
52/40

Description

はじめに

強化学習は環境に柔軟に適応する知能エージェントにおける基本機能と考えられます。近年は深層学習などのアーキテクチャとして、認識技術と組み合わされて自動運転などの実践的な場でつかわれれはじめており、さらにロボットなどにおいても今後は適用されてゆくシーンが増えてゆくでしょう、こうした背景から、実践的な強化学習や,実世界で動かす強化学習(ロボット・自動運転),強化学習を部品として組み合わせる(アーキテクチャ),といったトピックについて重視し情報共有する場として強化学習アーキテクチャ勉強会を開始しました。

本勉強会において積極的に議論に加わっていただき、今後、論文紹介などの形で貢献いただけるかたの参加をお待ちしております。

当勉強会の運営方針などについては、https://rlarch.connpass.com/ を御覧ください。

スケジュール

  • 18:50 〜18:55 オープニング
  • 18:55〜19:40 講演:IMPALA: Scalable Distributed Deep-RL with Importance Weighted Actor-Learner Architectures 発表・質疑応答45分

※ 19:00にビル入り口が施錠されるため、19時以前に起こしください(万が一19時を過ぎてしまった場合はインターホンにてご連絡ください)

講演概要:

発表者:関谷 英爾 (DeNA)

  • タイトル: IMPALA: Scalable Distributed Deep-RL with Importance Weighted Actor-Learner Architectures

  • アブストラクト: 先月(2/5)、DeepMindからIMPALAという分散強化学習のアーキテクチャに関する論文が発表された。シンプルで強力な分散アーキテクチャとその学習安定化のために新しいオフポリシー学習アルゴリズムV-traceを提案した。この分散アーキテクチャを導入することで(Atari, DeepMind Labのゲームを対象に)マルチタスクをも高速に学習し程々の成果を残せたというものだった。本講演では、強化学習に分散アーキテクチャを取り入れて学習を高速化してきた従来研究についても触れながらIMPALAについての紹介をする。

  • 参考文献 :

[1] Espeholt, Lasse, et al. "IMPALA: Scalable Distributed Deep-RL with Importance Weighted Actor-Learner Architectures"

[2] Babaeizadeh, Mohammad, et al. "GA3C: GPU-based A3C for deep reinforcement learning". NIPS Workshop, 2016.

[3] Mnih, Volodymyr, et al. "Asynchronous methods for deep reinforcement learning". Proceedings of the 33nd International Conference on Machine Learning, ICML 2016, New York City, NY, USA, June 19-24, 2016, 2016.

[4] Clemente, Alfredo V., et al. "Efficient parallel methods for deep reinforcement learning". CoRR, abs/1705.04862, 2017.

Media View all Media

If you add event media, up to 3 items will be shown here.

Feed

rl_architecture

rl_architecture published 第14回 強化学習アーキテクチャ勉強会.

03/07/2018 10:43

第14回 強化学習アーキテクチャ勉強会 has been published!

Group

Ended

2018/03/13(Tue)

18:45
20:00

You cannot RSVP if you are already participating in another event at the same date.

Registration Period
2018/03/07(Wed) 10:43 〜
2018/03/13(Tue) 20:00

Location

φcafe

東京都文京区本郷5丁目24-5 角川本郷ビル6F

Organizer

Attendees(40)

kaihatsu

kaihatsu

第14回 強化学習アーキテクチャ勉強会に参加を申し込みました!

ajk

ajk

第14回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

Yusuke922

Yusuke922

第14回 強化学習アーキテクチャ勉強会に参加を申し込みました!

Tamaki Okui

Tamaki Okui

第14回 強化学習アーキテクチャ勉強会に参加を申し込みました!

Shumpei Kobayashi

Shumpei Kobayashi

第14回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

i-shota

i-shota

第14回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

CookieBox26

CookieBox26

第14回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

ShigeharuMukai

ShigeharuMukai

第14回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

かいぬ

かいぬ

第14回 強化学習アーキテクチャ勉強会に参加を申し込みました!

yukono

yukono

第14回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

Attendees (40)

Waitlist (12)

hiro10

hiro10

第14回 強化学習アーキテクチャ勉強会に参加を申し込みました!

morinokuma33

morinokuma33

第14回 強化学習アーキテクチャ勉強会に参加を申し込みました!

dingcode

dingcode

第14回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

NorioKosaka

NorioKosaka

第14回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

yokina

yokina

第14回 強化学習アーキテクチャ勉強会に参加を申し込みました!

tomo

tomo

第14回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

tatsujit

tatsujit

I joined 第14回 強化学習アーキテクチャ勉強会!

Nori_S

Nori_S

第14回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

usagisan2020

usagisan2020

第14回 強化学習アーキテクチャ勉強会に参加を申し込みました!

masa_s

masa_s

第14回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

Waitlist (12)

Canceled (14)