Description
はじめに
強化学習は環境に柔軟に適応する知能エージェントにおける基本機能と考えられます。近年は深層学習などのアーキテクチャとして、認識技術と組み合わされて自動運転などの実践的な場でつかわれれはじめており、さらにロボットなどにおいても今後は適用されてゆくシーンが増えてゆくでしょう、こうした背景から、実践的な強化学習や,実世界で動かす強化学習(ロボット・自動運転),強化学習を部品として組み合わせる(アーキテクチャ),といったトピックについて重視し情報共有する場として強化学習アーキテクチャ勉強会を開始しました。
本勉強会において積極的に議論に加わっていただき、今後、論文紹介などの形で貢献いただけるかたの参加をお待ちしております。
当勉強会の運営方針などについては、https://rlarch.connpass.com/ を御覧ください。
- Google Group: https://goo.gl/xznKlY (注:KlYのIは「L」の小文字です)
- Slack: https://join.slack.com/t/rlarch/shared_invite/MjM2Mzc3MDE1MzYyLTE1MDQ2MjIzNDItNjFmNmU2NWJlYg
- Twitter: #rlarch 勉強会のハッシュタグを作りました.コメントや質問等にご活用ください.
会場の注意点:
- DEEPCORE様のご厚意により,2019年4月から会場がKERNEL HONGO(ユニゾ本郷四丁目ビル 3F)となります.
- 入室の際,参加者の把握のため,受付にて「お名前・ご所属・ご連絡先」を記入していただくことになりました(名刺をご提出いただく形でも構いません).
- 正面口(本郷通り沿い)にロックがかかっている場合があります. 正面口がロックされている場合には,裏側の階段から3階に上がって頂く形になります.
ご協力の程,よろしくお願いいたします.
スケジュール
- 19:15〜19:20 オープニング
- 19:20〜20:10 タイトル:YouTubeの推薦アルゴリズムおける強化学習活用(奥村)
講演概要:
発表者:奥村 純
-
タイトル:YouTubeの推薦システムおける強化学習活用
-
アブストラクト
近年、YouTubeのような大規模サービスにおいて強化学習を使った推薦アルゴリズムが模索されている。既存のMatrix Factorizationベースの推薦とは異なり、強化学習を使うことで(短期的な視聴を目標とした推薦ではなく)長期的なユーザーのエンゲージメントを高めるための推薦を学習することが期待される。一方で、このような大規模システムにおける強化学習の活用では、行動空間の広さや学習時のバリアンスの大きさ、複数アイテムの推薦の必要、といった多くの困難な課題があるのも事実ではある。本講演では、YouTubeにおける推薦アルゴリズムの変遷を追う流れで、どのように上述の課題を解決しつつ強化学習を本番環境に導入しているか解説を行う。 -
参考文献
Deep Neural Networks for YouTube Recommendations (Covington et al. 2016)
https://research.google/pubs/pub45530/
Latent Cross: Making Use of Context in Recurrent Recommender Systems (Beutel et al. 2018)
https://research.google/pubs/pub46488/
Top-K Off-Policy Correction for a REINFORCE Recommender System (Chen et al. 2019)
https://research.google/pubs/pub47647/
イベントマナー:
参加にあたって、以下のイベントマナーを厳守してください。
強化学習アーキテクチャではイベントへの参加や登壇について、情報の共有とコミュニケーションを目的としています。 イベントに参加するすべての人は下記の行動規範を守ることを求められます。すべての人にとって安全な場所を提供するため、聴講者、登壇者、主催スタッフ含めたすべての方にご協力をお願いします。
私たちは下記のような事柄に関わらずすべての人にとって安全な場を提供することに努めます。
社会的あるいは法的な性、性自認、年齢、障がい、容姿、体格、人種、民族、宗教(無宗教を含む)に対するハラスメント。
そして以下のような行為をいかなる形でも決して許容しません。
脅迫、つきまとい、ストーキング、不適切な画像、動画、録音の再生(性的な画像など)、発表や他のイベントに対する妨害行為、不適切な身体的接触、これらに限らない性的嫌がらせ。
登壇者、主催スタッフもこのポリシーの対象となります。性的な言葉や画像はいかなる発表やワークショップ、懇親会、Twitterのようなオンラインメディアにおいても不適切です。
ハラスメント行為をやめるように指示された場合、直ちに従うことが求められます。ルールを守らない方は、主催者の判断により、退場処分や今後のイベントに聴講者、登壇者、スタッフとして関わることを禁止します。
Media View all Media
If you add event media, up to 3 items will be shown here.