お知らせ connpassではさらなる価値のあるデータを提供するため、2024年5月23日(木)を以ちましてイベントサーチAPIの無料での提供の廃止を決定いたしました。
2024年5月23日(木)以降より開始予定の「connpass 有料API」の料金プランにつきましてはこちらをご覧ください。

お知らせ connpassをご利用いただく全ユーザーにおいて健全で円滑なイベントの開催や参加いただけるよう、イベント参加者向け・イベント管理者向けのガイドラインページを公開しました。内容をご理解の上、イベント内での違反行為に対応する参考としていただきますようお願いいたします。

このエントリーをはてなブックマークに追加

7月

24

第21回 強化学習アーキテクチャ勉強会

主催 : 山川宏

第21回 強化学習アーキテクチャ勉強会
募集内容

参加者

無料

先着順
44/45

申込者
TomMoriyama
Seshim
i-shota
Sugasan
sat_sat
nama
uchida2106
Autoalge
a_hasimoto
hamamu
申込者一覧を見る
開催日時
2018/07/24(火) 18:45 ~ 20:35
募集期間

2018/07/20(金) 08:48 〜
2018/07/24(火) 20:35まで

会場

φcafe

東京都文京区本郷5丁目24-5 角川本郷ビル6F

マップで見る 会場のサイトを見る

イベントの説明

はじめに

強化学習は環境に柔軟に適応する知能エージェントにおける基本機能と考えられます。近年は深層学習などのアーキテクチャとして、認識技術と組み合わされて自動運転などの実践的な場でつかわれれはじめており、さらにロボットなどにおいても今後は適用されてゆくシーンが増えてゆくでしょう、こうした背景から、実践的な強化学習や,実世界で動かす強化学習(ロボット・自動運転),強化学習を部品として組み合わせる(アーキテクチャ),といったトピックについて重視し情報共有する場として強化学習アーキテクチャ勉強会を開始しました。

本勉強会において積極的に議論に加わっていただき、今後、論文紹介などの形で貢献いただけるかたの参加をお待ちしております。

当勉強会の運営方針などについては、https://rlarch.connpass.com/ を御覧ください。

スケジュール

  • 18:50 〜18:55 オープニング
  • 18:55〜19:45 論文紹介:Reinforcement Learning and Control as Probabilistic Inference: Tutorial and Review (発表35分、質疑応答15分)

※ 19:00にビル入り口が施錠されるため、19時以前にお越しください(万が一19時を過ぎてしまった場合はインターホンにてご連絡ください)

講演概要:

発表者:甲野 祐(DeNA)

  • タイトル: 論文紹介:Reinforcement Learning and Control as Probabilistic Inference: Tutorial and Review

  • アブストラクト: 強化学習は状態に対する最適な方策分布(確率)を推論する問題である.しかし強化学習を確率の推論問題だと捉える場合,その方策の良さを定義する収益概念の扱い方が問題になる. 当該論文ではまず報酬的に最適であるかの最適性変数を与えることで強化学習がその上で駆動する確率的グラフィカルモデル(PGM)を構築している.そして Maximum entropy 強化学習と呼ばれる強化学習の最適制御問題の一般化が確率的推論モデルとどのように等価であるかを PGM を用いて解説している. 強化学習の最大の問題の一つとして「現実の課題環境は基本的に POMDP 」ということが言える.観測情報のみからは真の環境の状態の推定という MDP での強化学習とは全く異なる問題を抱えている(方策勾配法であると本質的には解決できない問題).不完全観測から真の状態の推定は本来 HMM などの確率推論モデルで行われるべきものだが,慣例的,古典的には N 階マルコフ(入力する観測の履歴化),現在では LSTM などの RNN 系技術の導入で対処している.しかし本定式化により収益概念を内包した確率モデルとして強化学習を扱うことにより,部分観測性を確率推論のテクニックを用いてより直接的な方法で POMDP を扱える可能性を示している.

  • 参考文献:
    [1]Levine, Sergey. "Reinforcement Learning and Control as Probabilistic Inference: Tutorial and Review", arXiv preprint arXiv:1805.00909 (2018). https://arxiv.org/abs/1805.00909

資料 資料をもっと見る/編集する

資料が投稿されると、最新の3件が表示されます。

フィード

rl_architecture

rl_architecture さんが 第21回 強化学習アーキテクチャ勉強会 を公開しました。

2018/07/20 08:48

第21回 強化学習アーキテクチャ勉強会 has been published!

グループ

強化学習アーキテクチャ勉強会

イベント数 54回

メンバー数 1008人

終了

2018/07/24(火)

18:45
20:35

開催日時が重複しているイベントに申し込んでいる場合、このイベントには申し込むことができません

募集期間
2018/07/20(金) 08:48 〜
2018/07/24(火) 20:35

会場

φcafe

東京都文京区本郷5丁目24-5 角川本郷ビル6F

管理者

参加者(44人)

TomMoriyama

TomMoriyama

第21回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

Seshim

Seshim

第21回 強化学習アーキテクチャ勉強会に参加を申し込みました!

i-shota

i-shota

第21回 強化学習アーキテクチャ勉強会に参加を申し込みました!

Sugasan

Sugasan

第21回 強化学習アーキテクチャ勉強会に参加を申し込みました!

sat_sat

sat_sat

第21回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

nama

nama

第21回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

uchida2106

uchida2106

第21回 強化学習アーキテクチャ勉強会に参加を申し込みました!

Autoalge

Autoalge

第21回 強化学習アーキテクチャ勉強会に参加を申し込みました!

a_hasimoto

a_hasimoto

第21回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

hamamu

hamamu

第21回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

参加者一覧(44人)

キャンセルした人(18人)