このエントリーをはてなブックマークに追加

2月

19

第33回 強化学習アーキテクチャ勉強会

Organizing : 山川宏

Registration info

参加者

Free

FCFS
79/50

Description

はじめに

強化学習は環境に柔軟に適応する知能エージェントにおける基本機能と考えられます。近年は深層学習などのアーキテクチャとして、認識技術と組み合わされて自動運転などの実践的な場でつかわれれはじめており、さらにロボットなどにおいても今後は適用されてゆくシーンが増えてゆくでしょう、こうした背景から、実践的な強化学習や,実世界で動かす強化学習(ロボット・自動運転),強化学習を部品として組み合わせる(アーキテクチャ),といったトピックについて重視し情報共有する場として強化学習アーキテクチャ勉強会を開始しました。

本勉強会において積極的に議論に加わっていただき、今後、論文紹介などの形で貢献いただけるかたの参加をお待ちしております。

当勉強会の運営方針などについては、https://rlarch.connpass.com/ を御覧ください。

スケジュール

  • 18:50 〜18:55 オープニング
  • 18:55〜19:45 深層強化学習を用いたロボット制御のサーベイ

※ 19:00にビル入り口が施錠されるため、19時以前にお越しください(万が一19時を過ぎてしまった場合はインターホンにてご連絡ください)

講演概要:

発表者:島田史也(東京大学)

  • タイトル:深層強化学習を用いたロボット制御のサーベイ

  • アブストラクト
    ロボットアームなどの固定ロボットにおいて深層強化学習を適用した研究をサーベイした結果について報告する.ロボットの強化学習を難しくする要因の一つとして,現実での試行が時間的・安全性・コストの制約を受けることがあげられる.この問題に対するアプローチは二つに大別される.一つはサンプル効率の良い学習手法を用いること,もうひとつはシミュレーションを活用することである.前者については深層強化学習一般において様々な手法が考案されているが今回は実機へのデプロイに成功した研究を主に参照しモデルベース学習,教示データの活用,潜在空間の活用などのアプローチに対して実例[1][2]を交えながら紹介する.後者については シミュレーションと現実の差異reality-gapが問題になる.これを解決するアプローチとしては①シミュレータの精度自体を上げる②シミュレータを上手く現実に適合させる(Domain Adaptation)③シミュレータをランダム化してreality-gapにロバストな方策を獲得する.強化学習に際して行われるのは基本的に②,③のアプローチである.今回はDomain Randomizationを利用して直接実機へのデプロイに成功したOpen AIによる研究[3]を中心に関連研究を紹介する.

  • 参考文献
    [1]Levine, Sergey, et al. "End-to-end training of deep visuomotor policies." The Journal of Machine Learning Research 17.1 (2016): 1334-1373. [2]Zhu, Henry, et al. "Dexterous Manipulation with Deep Reinforcement Learning: Efficient, General, and Low-Cost." arXiv preprint arXiv:1810.06045 (2018). [3]Andrychowicz, Marcin, et al. "Learning dexterous in-hand manipulation." arXiv preprint arXiv:1808.00177 (2018).

Media View all Media

If you add event media, up to 3 items will be shown here.

Feed

rl_architecture

rl_architecture published 第33回 強化学習アーキテクチャ勉強会.

02/15/2019 10:43

第33回 強化学習アーキテクチャ勉強会 has been published!

Ended

2019/02/19(Tue)

18:45
20:30

開催日時が重複しているイベントに申し込んでいる場合、このイベントには申し込むことができません

Registration Period
2019/02/15(Fri) 10:42 〜
2019/02/19(Tue) 20:30

Location

φcafe

東京都文京区本郷5丁目24-5 角川本郷ビル6F

Organizer

Attendees(50)

s_ota

s_ota

第33回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

ksyundo

ksyundo

第33回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

kei_yama

kei_yama

第33回 強化学習アーキテクチャ勉強会に参加を申し込みました!

akihiro_fujii

akihiro_fujii

第33回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

yotlearning

yotlearning

第33回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

hei4

hei4

第33回 強化学習アーキテクチャ勉強会に参加を申し込みました!

TomMoriyama

TomMoriyama

第33回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

sat_sat

sat_sat

第33回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

nakamurakazuki

nakamurakazuki

第33回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

non

non

第33回 強化学習アーキテクチャ勉強会に参加を申し込みました!

Attendees (50)

Waitlist (29)

hirokuni_kawasaki

hirokuni_kawasaki

第33回 強化学習アーキテクチャ勉強会に参加を申し込みました!

MotoShin

MotoShin

第33回 強化学習アーキテクチャ勉強会に参加を申し込みました!

tken

tken

第33回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

toohsk

toohsk

第33回 強化学習アーキテクチャ勉強会に参加を申し込みました!

mabo

mabo

第33回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

uchida2106

uchida2106

第33回 強化学習アーキテクチャ勉強会に参加を申し込みました!

keijikk

keijikk

第33回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

HOSHAKU

HOSHAKU

第33回 強化学習アーキテクチャ勉強会に参加を申し込みました!

gm3d2

gm3d2

第33回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

shigejp

shigejp

第33回 強化学習アーキテクチャ勉強会に参加を申し込みました!

Waitlist (29)

Canceled (9)