pooneilの脳科学論文コメント: R演習補講 (2腕バンディット問題を題材に)

« 「オブリガード、蝉の声、アースジェッター」(さうして、このごろ2020年7月版) | 最新のページに戻る | 「ちのいろ、わが放浪、針尾送信所」(さうして、このごろ2020年8月版) »

■ R演習補講 (2腕バンディット問題を題材に)

北大CHAINのウィンタースクール2020では、集団的意思決定のモデリングについての講義と演習があります。そちらの準備用資料として「RとRStudioの基本について、強化学習の初歩的な例である2腕バンディット問題を題材に説明する」というものを学生向けに吉田が作成しました。

この資料はそちらを公開用に編集したものです。じつのところ私はRやRStudioを使うのも久しぶりで、強化学習についても素人ですが、この機会にこういう資料を自力で作って公開すれば、間違いも指摘してもらえるかもと期待して公開する次第です。

Sutton and Barto (2020) "Reinforcement Learning: An Introduction (2nd ed)"の2章が一応の元ネタですが、それをなるたけ単純化したところが特徴です。(apply関数使う前のところで時間切れになったので、一人分のデータを作るところまでしかたどり着けなかった。)

なお、コードについてですが、今回の講師のひとりである、独コンスタンツ大学の豊川航さんによるR markdownのコードと変数に使う文字は揃えていますが、コード自体は全部自分で書きました。

間違いなど発見しましたらぜひご指摘ください。よろしくお願いします。

R演習補講 (2腕バンディット問題を題材に) from Masatoshi Yoshida

/ ツイートする
/ 投稿日: 2020年12月26日
/ カテゴリー: [脳科学メモ]
/ Edit(管理者用)

お勧めエントリ

細胞外電極はなにを見ているか(1) 20080727 (2) リニューアル版 20081107
総説長期記憶の脳内メカニズム 20100909
駒場講義2013 「意識の科学的研究 - 盲視を起点に」20130626
駒場講義2012レジメ意識と注意の脳内メカニズム(1) 注意 20121010 (2) 意識 20121011
視覚、注意、言語で3*2の背側、腹側経路説 20140119
脳科学辞典の項目書いた「盲視」 20130407
脳科学辞典の項目書いた「気づき」 20130228
脳科学辞典の項目書いた「サリエンシー」 20121224
脳科学辞典の項目書いた「マイクロサッケード」 20121227
盲視でおこる「なにかあるかんじ」 20110126
DKL色空間についてまとめ 20090113
科学基礎論学会秋の研究例会ワークショップ「意識の神経科学と神経現象学」レジメ 20131102
ギャラガー＆ザハヴィ『現象学的な心』合評会レジメ 20130628
Marrのrepresentationとprocessをベイトソン流に解釈する (1) 20100317 (2) 20100317
半側空間無視と同名半盲とは区別できるか？(1) 20080220 (2) 半側空間無視の原因部位は？ 20080221
MarrのVisionの最初と最後だけを読む 20071213

月別過去ログ

[2025]: 6|; 5|; 4|; 3|; 2|; 1|
[2024]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2023]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2022]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2021]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2020]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2019]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2018]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2017]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2016]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2015]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2014]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2013]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2012]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2011]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2010]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2009]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2008]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2007]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2006]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2005]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2004]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2003]: 12|; 11|; 8|; 7|
[2001]: 10|; 8|; 6|; 5|; 4|; 2|
[2000]: 12|; 9|; 8|; 7|; 6|; 3|; 2|; 1|
[1999]: 9|; 8|; 7|