お知らせ connpassアカウントのパスワードを設定することで、ソーシャル認証に依存しないログインも可能となります。詳しくは以下のヘルプをご確認ください。
- パスワードの設定
- ソーシャル認証ログインが出来なくなった場合の操作
イベント管理者様・グループ管理者様も上記ヘルプを 一括メッセージ機能 にて参加者・グループメンバーへ案内して、連絡がつかなくならないようご注意ください。

このエントリーをはてなブックマークに追加

Oct

16

第26回 強化学習アーキテクチャ勉強会

Organizing : 山川宏

Registration info

参加者

Free

FCFS
52/45

Description

はじめに

強化学習は環境に柔軟に適応する知能エージェントにおける基本機能と考えられます。近年は深層学習などのアーキテクチャとして、認識技術と組み合わされて自動運転などの実践的な場でつかわれれはじめており、さらにロボットなどにおいても今後は適用されてゆくシーンが増えてゆくでしょう、こうした背景から、実践的な強化学習や,実世界で動かす強化学習(ロボット・自動運転),強化学習を部品として組み合わせる(アーキテクチャ),といったトピックについて重視し情報共有する場として強化学習アーキテクチャ勉強会を開始しました。

本勉強会において積極的に議論に加わっていただき、今後、論文紹介などの形で貢献いただけるかたの参加をお待ちしております。

当勉強会の運営方針などについては、https://rlarch.connpass.com/ を御覧ください。

スケジュール

  • 18:50 〜18:55 オープニング
  • 18:55〜19:45 研究紹介:RGoal Architecture:再帰的にサブゴールを設定できる階層型強化学習アーキテクチャ

※ 19:00にビル入り口が施錠されるため、19時以前にお越しください(万が一19時を過ぎてしまった場合はインターホンにてご連絡ください)

講演概要:

発表者:一杉裕志(産総研)

  • タイトル:RGoal Architecture:再帰的にサブゴールを設定できる階層型強化学習アーキテクチャ

  • アブストラクト:
    人間は何か目的を達成するために適切なサブゴールを設定できる。さらに必要に応じてそのサブゴールを再帰的に設定することができ、その再帰の深さには制約がないように見える。この振る舞いにヒントを得た階層型強化学習の新しいアーキテクチャとして、RGoal アーキテクチャを提案する。アルゴリズムは、拡張状態行動空間上の MDP を解く形で定式化される。行動価値関数は、価値関数分解により複数のタスク間で共有可能になり、マルチタスク環境での学習を効率化する。「思考モード」における振る舞いは一種のモデルベース強化学習であり、学習済みのタスクを組み合わせることで、一度も経験したことのないタスクを少ない試行錯誤で、場合によってはゼロショットで解くことができる。アルゴリズムはスタックを用いず、フラットなテーブルとシンプルな操作の繰り返しで実現される。今後このアーキテクチャを拡張し、脳の前頭前野周辺の情報処理機構のモデルを構築する。

  • 参考文献:
    一杉裕志、高橋直人、中田秀基、佐野崇 「RGoal Architecture:再帰的にサブゴールを設定できる階層型強化学習アーキテクチャ」 第9回 人工知能学会 汎用人工知能研究会(SIG-AGI), 2018 https://jsai.ixsq.nii.ac.jp/ej/?action=repository_uri&item_id=9429

  • 関連資料:
    発表に使う予定のスライド:https://staff.aist.go.jp/y-ichisugi/besom/20180830RGoal.pdf

Media View all Media

If you add event media, up to 3 items will be shown here.

Feed

rl_architecture

rl_architecture published 第26回 強化学習アーキテクチャ勉強会.

10/02/2018 15:59

第26回 強化学習アーキテクチャ勉強会 has been published!

Group

Ended

2018/10/16(Tue)

18:45
19:45

You cannot RSVP if you are already participating in another event at the same date.

Registration Period
2018/10/02(Tue) 15:48 〜
2018/10/16(Tue) 19:45

Location

φcafe

東京都文京区本郷5丁目24-5 角川本郷ビル6F

Organizer

Attendees(45)

sinyamada

sinyamada

第26回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

millionsmile

millionsmile

I joined 第26回 強化学習アーキテクチャ勉強会!

Inumasa

Inumasa

第26回 強化学習アーキテクチャ勉強会に参加を申し込みました!

Masato Shima

Masato Shima

第26回 強化学習アーキテクチャ勉強会に参加を申し込みました!

kmdqcom

kmdqcom

第26回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

mshinoda88

mshinoda88

第26回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

yukono

yukono

第26回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

teddy14

teddy14

第26回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

yotlearning

yotlearning

第26回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

NaruakiTakano

NaruakiTakano

第26回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

Attendees (45)

Waitlist (7)

darawong_keo

darawong_keo

第26回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

MMM

MMM

第26回 強化学習アーキテクチャ勉強会に参加を申し込みました!

kurama554101

kurama554101

第26回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

omuram

omuram

第26回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

tsho

tsho

I joined 第26回 強化学習アーキテクチャ勉強会!

JohaneTakeuchi

JohaneTakeuchi

第26回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

rr32trankn

rr32trankn

第26回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

Waitlist (7)

Canceled (26)