お知らせ connpassではさらなる価値のあるデータを提供するため、2024年5月23日(木)を以ちましてイベントサーチAPIの無料での提供の廃止を決定いたしました。
2024年5月23日(木)以降より開始予定の「connpass 有料API」の料金プランにつきましてはこちらをご覧ください。
なお有料の対象となるのはAPIのみであり、connpassのサービスにつきましては今後も無料でご利用いただけます。

このエントリーをはてなブックマークに追加

3月

28

第15回 強化学習アーキテクチャ勉強会

主催 : 山川宏

第15回 強化学習アーキテクチャ勉強会
募集内容

参加者

無料

先着順
39/40

申込者
GitHub30
saruta
Tamaki Okui
hiroaki
teddy14
usagisan2020
Mukusan55
pai2
hiro10
always19
申込者一覧を見る
開催日時
2018/03/28(水) 18:45 ~ 20:00
募集期間

2018/03/23(金) 23:31 〜
2018/03/28(水) 20:00まで

会場

φcafe

東京都文京区本郷5丁目24-5 角川本郷ビル6F

マップで見る 会場のサイトを見る

イベントの説明

はじめに

強化学習は環境に柔軟に適応する知能エージェントにおける基本機能と考えられます。近年は深層学習などのアーキテクチャとして、認識技術と組み合わされて自動運転などの実践的な場でつかわれれはじめており、さらにロボットなどにおいても今後は適用されてゆくシーンが増えてゆくでしょう、こうした背景から、実践的な強化学習や,実世界で動かす強化学習(ロボット・自動運転),強化学習を部品として組み合わせる(アーキテクチャ),といったトピックについて重視し情報共有する場として強化学習アーキテクチャ勉強会を開始しました。

本勉強会において積極的に議論に加わっていただき、今後、論文紹介などの形で貢献いただけるかたの参加をお待ちしております。

当勉強会の運営方針などについては、https://rlarch.connpass.com/ を御覧ください。

スケジュール

  • 18:50 〜18:55 オープニング
  • 18:55〜19:40 講演:経験強化型学習Profit Sharingを利用したdeep Q-networkの学習加速化について 発表・質疑応答45分

※ 19:00にビル入り口が施錠されるため、19時以前に起こしください(万が一19時を過ぎてしまった場合はインターホンにてご連絡ください)

講演概要:

  • 発表者: 宮崎和光(独立行政法人 大学改革支援・学位授与機構)、小玉直樹(明治大学)

  • タイトル: 経験強化型学習Profit Sharingを利用したdeep Q-networkの学習加速化について

(参考: https://goo.gl/d9k4Zi )

  • アブストラクト: 近年,Deep Q-Network(DQN)やAlphaGoなど,深層学習と強化学習を融合させた深層強化学習が注目を集めている.そこでは,強化学習手法としてQ-learningを用いていることもあり,戦略の学習には膨大な量の試行錯誤回数が必要となる.それに対し講演者らは,強化学習における試行錯誤回数の低減を指向した手法として経験強化型学習Exploitation-oriented Learning (XoL)を提唱している.本講演では,XoLについての簡単な解説を行った後に,XoLの一手法であるProfit Sharing(PS) とDQNとを組み合わせた手法であるDQNwithPSを紹介する.しかし,現在,DQNwithPSによるPS学習は、ニューラルネットワークの更新に悪影響を与える場合があることがわかっている.そこで本講演では,DQNwithPSのPS学習に用いられる目標値が行動価値関数よりも小さい場合,誤差関数を0とするLearning Acceleration DQN(LADQN)を紹介する.LADQNが,Atari2600のゲームの中のBreakout及びEnduroに対して,DQNやDQNwithPSよりも特に優れた結果を与えることを示す.

  • 参考文献 :

[1] 小玉直樹,宮崎和光,小林博明, 経験強化型学習を利用したdeep Q-networkの学習加速化手法の提案と有効性の検証 第45回知能システムシンポジウム講演論文集 (2018). http://www.sice.or.jp/org/i-sys/is45/180224_is45_program_web.html

[2] Kazuteru Miyazaki, Exploitation-Oriented Learning with Deep Learning - Introducing Profit Sharing to a Deep Q-Network -, Journal of Advanced Computational Intelligence and Intelligent Informatics, Vol.21, No.5, pp.849-855 (2017). https://www.fujipress.jp/jaciii/jc/jacii002100050849/

[3] Miyazaki, K. and Kobayashi, S., Exploitation-oriented Learning PS-r#, Journal of Advanced Computational Intelligence and Intelligent Informatics, Vol.13, No.6, pp.624-630 (2009). https://www.fujipress.jp/jaciii/jc/jacii001300060624/

[4] 宮崎和光,山村雅幸,小林重信, 強化学習における報酬割当ての理論的考察, 人工知能学会誌,Vol.9, No.4, pp.580-587 (1994). https://goo.gl/zPsDHc

資料 資料をもっと見る/編集する

資料が投稿されると、最新の3件が表示されます。

フィード

rl_architecture

rl_architecture さんが 第15回 強化学習アーキテクチャ勉強会 を公開しました。

2018/03/23 23:32

第15回 強化学習アーキテクチャ勉強会 has been published!

グループ

強化学習アーキテクチャ勉強会

イベント数 54回

メンバー数 1008人

終了

2018/03/28(水)

18:45
20:00

開催日時が重複しているイベントに申し込んでいる場合、このイベントには申し込むことができません

募集期間
2018/03/23(金) 23:31 〜
2018/03/28(水) 20:00

会場

φcafe

東京都文京区本郷5丁目24-5 角川本郷ビル6F

管理者

参加者(39人)

GitHub30

GitHub30

第15回 強化学習アーキテクチャ勉強会に参加を申し込みました!

saruta

saruta

第15回 強化学習アーキテクチャ勉強会に参加を申し込みました!

Tamaki Okui

Tamaki Okui

第15回 強化学習アーキテクチャ勉強会に参加を申し込みました!

hiroaki

hiroaki

第15回 強化学習アーキテクチャ勉強会に参加を申し込みました!

teddy14

teddy14

第15回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

usagisan2020

usagisan2020

第15回 強化学習アーキテクチャ勉強会に参加を申し込みました!

Mukusan55

Mukusan55

第15回 強化学習アーキテクチャ勉強会に参加を申し込みました!

pai2

pai2

第15回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

hiro10

hiro10

第15回 強化学習アーキテクチャ勉強会に参加を申し込みました!

always19

always19

第15回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

参加者一覧(39人)

キャンセルした人(12人)