« 神経科学学会大会 | 最新のページに戻る | Nature 7/28 »
■ 線条体とQ-learning
20050730のエントリにmmmmさんからコメントがついています。ATRの鮫島さんのポスターに関してですが、mmmmさんは線条体がActor-CriticではなくてQ-learningであることを生理学的に証明したことを評価しています。
鮫島さんが学会で発表されたことについては大脳基底核-強化学習モデルによる線条体神経細胞活動の記録と予測(pdf)で一部公表されているようなのでこれに基づいて議論しますが、この論文ではこの点が明確に書かれています。つまり、Actor-Criticだと線条体で行動選択そのものがrepresentされていると予言するのに対して、Q-learningでは線条体で行動選択肢の報酬予測がrepresentされると予言するというわけです。なるほど。
ニューロンのデータに基づいた議論はつづきの論文が出てから、としたほうがよいでしょう。
ところで、そもそもわたしはActor-CriticとQ-learningの概念がぜんぜんわかっていないので、参考になりそうな資料をメモっておきます。
ATRの鮫島 和行さんによる関連論文:
- 大脳基底核-強化学習モデルによる線条体神経細胞活動の記録と予測(pdf)
- 強化学習と大脳基底核(pdf)(実はこの論文は以前にも20040624でリンクしてます。)
- 行動決定系列からの学習系の内部状態/パラメータ系列の推定(pdf)
- 複数の予測モデルを用いた強化学習による非線形制御(pdf)
Sutton and Bartoの"Reinforcement Learning: An Introduction"のhtml版から:
東工大の木村 元氏によるもの:
- 強化学習の基礎(pdf)
- 平成13年度 (2001年度) 7月6日講義資料(PowerPointファイル)
- 強化学習システムの設計指針
同志社大の中村 康昭氏によるもの:
- / ツイートする
- / 投稿日: 2005年08月01日
- / カテゴリー: [行動の価値 (action value)]
- / Edit(管理者用)