お知らせ 【グループ管理者の皆さま】成長し続けるエンジニアを支援する「Forkwell」と「connpass」が連携し、connpass上でイベントを開催するグループを2020年3月末まで支援いたします。詳しくはこちら by Forkwell

このエントリーをはてなブックマークに追加

10月

3

第6回 強化学習アーキテクチャ勉強会

Organizing : 山川宏

Registration info

参加者

Free

FCFS
40/40

Description

はじめに

強化学習は環境に柔軟に適応する知能エージェントにおける基本機能と考えられます。近年は深層学習などのアーキテクチャとして、認識技術と組み合わされて自動運転などの実践的な場でつかわれれはじめており、さらにロボットなどにおいても今後は適用されてゆくシーンが増えてゆくでしょう、こうした背景から、実践的な強化学習や,実世界で動かす強化学習(ロボット・自動運転),強化学習を部品として組み合わせる(アーキテクチャ),といったトピックについて重視し情報共有する場として強化学習アーキテクチャ勉強会を開始しました。

本勉強会において積極的に議論に加わっていただき、今後、論文紹介などの形で貢献いただけるかたの参加をお待ちしております。

当勉強会の運営方針などについては、https://rlarch.connpass.com/ を御覧ください。

スケジュール

  • 18:50 〜18:55 オープニング
  • 18:55〜19:45 講演:論文紹介 Overcoming catastrophic forgetting in NeuralNetworks (山田真徳) 発表35分、質疑応答15分
  • 19:45〜20:35 講演:論文紹介 Distral: Robust Multitask Reinforcement Learning(森山朋美) 発表35分、質疑応答15分

※ 19:00にビル入り口が施錠されるため、19時以前に起こしください(万が一19時を過ぎてしまった場合はインターホンにてご連絡ください)

講演概要:

発表者1:山田真徳

  • タイトル:論文紹介 Overcoming catastrophic forgetting in NeuralNetworks

  • アブストラクト:  Catastrophic forgetting(taskAの後にtaskBを学習すると taskAを忘れてしまうこと)を回避する方法を提案

  • 参考文献: Overcoming catastrophic forgetting in NeuralNetworks, https://arxiv.org/abs/1612.00796

発表者2:森山朋美

  • タイトル:論文紹介 Distral: Robust Multitask Reinforcement Learning

  • アブストラクト:  類似タスクから転移(パラメタ共有)することでサンプル効率化を図る取り組みがうまくいかなかったのは異なるタスク間の勾配が干渉し、学習を不安定にしていたのが原因だ。本論文が提唱する新しいアプローチ「Distral=Distill(蒸留)+transfer(転移)学習」では、パラメタではなく、タスク間に共通する挙動を捉えた「蒸留した(Distilled)方策」を共有する。各ワーカーは、固有のタスクを解きつつ、全タスクの重心となる共有方策からは離れないような制約を受けている;つまり異なる(固有の vs 共有の)目的関数を同時に最適化することで学習が進む。提案手法では、3D環境における既存手法を凌ぐ転移効果を示せた。また学習プロセスも、深層強化学習に重要な資質:堅牢性と安定性を有している。

  • 参考文献: Distral: Robust Multitask Reinforcement Learning, https://arxiv.org/abs/1707.04175

Media View all Media

If you add event media, up to 3 items will be shown here.

Feed

rl_architecture

rl_architecture published 第6回 強化学習アーキテクチャ勉強会.

09/25/2017 21:41

第6回 強化学習アーキテクチャ勉強会 has been published!

Group

Ended

2017/10/03(Tue)

18:45
21:30

開催日時が重複しているイベントに申し込んでいる場合、このイベントには申し込むことができません

Registration Period
2017/09/25(Mon) 21:41 〜
2017/10/03(Tue) 21:30

Location

φcafe

東京都文京区本郷5丁目24-5 角川本郷ビル6F

Organizer

Attendees(40)

Yusuke922

Yusuke922

第6回 強化学習アーキテクチャ勉強会に参加を申し込みました!

JohaneTakeuchi

JohaneTakeuchi

第6回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

KanSAKAMOTO

KanSAKAMOTO

第6回 強化学習アーキテクチャ勉強会に参加を申し込みました!

pos

pos

第6回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

i-shota

i-shota

第6回 強化学習アーキテクチャ勉強会に参加を申し込みました!

ajk

ajk

第6回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

Kosuke Miyoshi

Kosuke Miyoshi

第6回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

hey05good

hey05good

第6回 強化学習アーキテクチャ勉強会に参加を申し込みました!

unagi_pie

unagi_pie

第6回 強化学習アーキテクチャ勉強会に参加を申し込みました!

TomMoriyama

TomMoriyama

第6回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

Attendees (40)

Canceled (9)