お知らせ 【グループ管理者の皆さま】成長し続けるエンジニアを支援する「Forkwell」と「connpass」が連携し、connpass上でイベントを開催するグループを2020年3月末まで支援いたします。詳しくはこちら by Forkwell

このエントリーをはてなブックマークに追加

11月

27

第29回 強化学習アーキテクチャ勉強会

Organizing : 山川宏

Registration info

参加者

Free

FCFS
42/45

Description

はじめに

強化学習は環境に柔軟に適応する知能エージェントにおける基本機能と考えられます。近年は深層学習などのアーキテクチャとして、認識技術と組み合わされて自動運転などの実践的な場でつかわれれはじめており、さらにロボットなどにおいても今後は適用されてゆくシーンが増えてゆくでしょう、こうした背景から、実践的な強化学習や,実世界で動かす強化学習(ロボット・自動運転),強化学習を部品として組み合わせる(アーキテクチャ),といったトピックについて重視し情報共有する場として強化学習アーキテクチャ勉強会を開始しました。

本勉強会において積極的に議論に加わっていただき、今後、論文紹介などの形で貢献いただけるかたの参加をお待ちしております。

当勉強会の運営方針などについては、https://rlarch.connpass.com/ を御覧ください。

スケジュール

  • 18:50 〜18:55 オープニング
  • 18:55〜19:45 RNDは如何にしてモンテヅマリベンジを攻略したか

※ 19:00にビル入り口が施錠されるため、19時以前にお越しください(万が一19時を過ぎてしまった場合はインターホンにてご連絡ください)

講演概要:

発表者:向井滋春(早稲田大学)

  • タイトル:RNDは如何にしてモンテヅマリベンジを攻略したか

  • アブストラクト: 報酬が疎でATARI2600最難関と言われていたゲームであるモンテヅマリベンジにおいて、人間のプレイデータなどを必要とせず、Human expert のスコアを上回る探索手法がついに登場した。本発表では「RNDは如何にしてモンテヅマリベンジを攻略したか」と題して、話題の論文[1]を中心に、強化学習における探索の要件を再定義し、なぜ既存の方法ではできなかったのか整理した上で論文のアイデアを共有し、皆様と考察を深め議論したい。

  • 参考文献
    [1] Exploration by Random Network Distillation, https://arxiv.org/abs/1810.12894
    [2] Large-Scale Study of Curiosity-Driven Learning, https://arxiv.org/abs/1808.04355
    [3] Randomized Prior Functions for Deep Reinforcement Learning, https://arxiv.org/abs/1806.03335

Media View all Media

If you add event media, up to 3 items will be shown here.

Feed

ShigeharuMukai

ShigeharuMukai さんが書き込みました。

2018/11/25 19:51

> アブストラクトについて Human expert と書いてありますが, 論文ではDQN論文のスコア4,367をそのまま載せているわけではなく, この論文ではHuman Average 4,753が書いてあり,Human average が正確かと思われます.間違えてしまい申し訳ないです.

rl_architecture

rl_architecture published 第29回 強化学習アーキテクチャ勉強会.

11/22/2018 22:00

第29回 強化学習アーキテクチャ勉強会 has been published!

Group

Ended

2018/11/27(Tue)

18:45
19:45

開催日時が重複しているイベントに申し込んでいる場合、このイベントには申し込むことができません

Registration Period
2018/11/22(Thu) 21:34 〜
2018/11/27(Tue) 19:45

Location

φcafe

東京都文京区本郷5丁目24-5 角川本郷ビル6F

Organizer

Attendees(42)

ikeyasu

ikeyasu

第29回 強化学習アーキテクチャ勉強会に参加を申し込みました!

RHiga

RHiga

第29回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

s_ota

s_ota

第29回 強化学習アーキテクチャ勉強会に参加を申し込みました!

omuram

omuram

第29回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

kmotohas

kmotohas

第29回 強化学習アーキテクチャ勉強会に参加を申し込みました!

Yo Iida

Yo Iida

第29回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

makoto_ta

makoto_ta

I joined 第29回 強化学習アーキテクチャ勉強会!

mabo

mabo

第29回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

pfinsider_m

pfinsider_m

第29回 強化学習アーキテクチャ勉強会に参加を申し込みました!

lfs

lfs

第29回 強化学習アーキテクチャ勉強会に参加を申し込みました!

Attendees (42)

Canceled (19)