お知らせ 【グループ管理者の皆さま】成長し続けるエンジニアを支援する「Forkwell」と「connpass」が連携し、connpass上でイベントを開催するグループを2020年3月末まで支援いたします。詳しくはこちら by Forkwell

このエントリーをはてなブックマークに追加

10月

29

第46回 強化学習アーキテクチャ勉強会

Organizing : 山川宏

Registration info

参加者

Free

FCFS
46/50

Description

はじめに

強化学習は環境に柔軟に適応する知能エージェントにおける基本機能と考えられます。近年は深層学習などのアーキテクチャとして、認識技術と組み合わされて自動運転などの実践的な場でつかわれれはじめており、さらにロボットなどにおいても今後は適用されてゆくシーンが増えてゆくでしょう、こうした背景から、実践的な強化学習や,実世界で動かす強化学習(ロボット・自動運転),強化学習を部品として組み合わせる(アーキテクチャ),といったトピックについて重視し情報共有する場として強化学習アーキテクチャ勉強会を開始しました。

本勉強会において積極的に議論に加わっていただき、今後、論文紹介などの形で貢献いただけるかたの参加をお待ちしております。

当勉強会の運営方針などについては、https://rlarch.connpass.com/ を御覧ください。

会場の注意点

  • DEEPCORE様のご厚意により,2019年4月から会場がKERNEL HONGO(ユニゾ本郷四丁目ビル 3F)となります
  • 入室の際,参加者の把握のため,受付にて「お名前・ご所属・ご連絡先」を記入していただくことになりました(名刺をご提出いただく形でも構いません)
  • 正面口(本郷通り沿い)にロックがかかっている場合があります. 正面口がロックされている場合には,裏側の階段から3階に上がって頂く形になります.

ご協力の程,よろしくお願いいたします.

スケジュール

  • 19:15〜19:20 オープニング
  • 19:20〜20:10 タイトル:多目的強化学習 ~非凸なパレート最適方策の獲得に向けた研究~

講演概要:

発表者:山本 慶佑(千葉大学)

  • タイトル:多目的強化学習 ~非凸なパレート最適方策の獲得に向けた研究~

  • アブストラクト
    多目的強化学習(MORL)は,複数の競合する目的の最適性を考慮した手法である.複数の目的が競合しているため,最適方策は複数存在する.MORLにおける最適方策をパレート最適方策とよぶ.文献[1]でMORLの評価方法が提案されるまで,パレート最適方策についての評価はされていなかった.そこで本発表では,MORLの性能評価に着目した文献を紹介する.具体的には,できるだけ多くのパレート最適方策を獲得することを目標とした研究について述べる.

  • 参考文献
    [1]Vamplew, Peter, et al. "Empirical evaluation methods for multiobjective reinforcement learning algorithms." Machine learning 84.1-2 (2011): 51-80.
    [2]Van Moffaert, Kristof, Madalina M. Drugan, and Ann Nowé. "Scalarized multi-objective reinforcement learning: Novel design techniques." 2013 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning (ADPRL). IEEE, 2013.
    [3]Van Moffaert, Kristof, and Ann Nowé. "Multi-objective reinforcement learning using sets of pareto dominating policies." The Journal of Machine Learning Research 15.1 (2014): 3483-3512.

Media View all Media

If you add event media, up to 3 items will be shown here.

Feed

rl_architecture

rl_architecture published 第46回 強化学習アーキテクチャ勉強会.

10/23/2019 17:33

第46回 強化学習アーキテクチャ勉強会 has been published!

Group

Ended

2019/10/29(Tue)

19:15
20:30

開催日時が重複しているイベントに申し込んでいる場合、このイベントには申し込むことができません

Registration Period
2019/10/23(Wed) 17:26 〜
2019/10/29(Tue) 20:30

Location

KERNEL HONGO

東京都文京区本郷4-1-4 ユニゾ本郷四丁目ビル 3F

Organizer

Attendees(46)

TamaiShinya

TamaiShinya

第46回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

gutchbar

gutchbar

第46回 強化学習アーキテクチャ勉強会に参加を申し込みました!

temo

temo

第46回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

SuzukiA

SuzukiA

第46回 強化学習アーキテクチャ勉強会に参加を申し込みました!

RHiga

RHiga

第46回 強化学習アーキテクチャ勉強会に参加を申し込みました!

keijikk

keijikk

第46回 強化学習アーキテクチャ勉強会に参加を申し込みました!

makonchu0012

makonchu0012

第46回 強化学習アーキテクチャ勉強会に参加を申し込みました!

ken

ken

第46回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

yasu-suzuki

yasu-suzuki

第46回 強化学習アーキテクチャ勉強会 に参加を申し込みました!

bluejin55

bluejin55

第46回 強化学習アーキテクチャ勉強会に参加を申し込みました!

Attendees (46)

Canceled (14)