« 「行動の価値」を表す線条体ニューロン | 最新のページに戻る | 「行動の価値」を表す線条体ニューロン »
■ 「行動の価値」を表す線条体ニューロン
Science 11/25 "Representation of Action-Specific Reward Values in the Striatum"
大脳基底核の線条体のニューロンが"action value"=「行動の価値」をコードしているのを見つけた、という論文です。ATRの銅谷研の鮫島さんが京都府立医科大学の木村實先生のところで行った仕事です。木村研はこのあいだのScienceと併せて一年間にScienceを二連発という快挙です。すくなくともnhp single unit studyでは世界初のはずです。
ざっくり説明しましょう。被検者がする課題はモニターの前でレバーを右にするか左にするか選ぶ、というものです。たとえば、左を選ぶと50%の確率でジュースが飲めて、右を選ぶと90%の確率でジュースが飲めるという条件になります。もちろん、右を選んだ方が得です。100試行ぐらいすると、この確率が変わります。たとえばこんどは左が90%で、右が50%です。このときは左を選んだ方が得です。このような課題をやっているあいだに線条体のニューロン活動を記録します。そうすると、左でジュースが出る確率が高いときに強く活動するニューロンが見つかりました。おなじ「左を選ぶ」という行動をしていても、その価値が高いとき(ジュースの出る確率が高いとき)に活動する、つまりこのニューロンは「行動の価値」をコードしている、というわけです。
いくつかの押さえが必要です:
- (1) このニューロンは右のジュースの出る確率には影響されません。つまり、このニューロンは、左右の価値を比較した結果をコードしているのではなくて、「左を選ぶ」という行動の価値を表していることになります。
- (2) また、左でジュースが出る確率が高いときには、左を選ぼうと、右を選ぼうとニューロンは強く活動します。つまり、このニューロンは「左を選ぶ」という「行動の価値」じたいを表しているのであって、「左を選ぶ」か「右を選ぶか」という「選択された行動」じたいを表しているわけでもありません。
以下また続きます。予告編:(a) この論文の意義。とくにNewsome、Glimcher、Leeなどの論文をふまえて。また、これまでの大脳基底核からの記録論文との突き合わせも必要でしょう。(b) さらに「強化学習」の理論をふまえて、Q-learningモデルとactor-criticモデルとどちらが大脳基底核で行われていることに合致しているか、といった議論。このへんは工学系の専門家に参入してもらった方がよいのですが。 (c) 結果から結論を導く過程の妥当性について。わたしがとくに問題だと思うのは、上記の押さえ(2)に関する点です。ともあれ、また明日。
- / ツイートする
- / 投稿日: 2005年11月29日
- / カテゴリー: [行動の価値 (action value)]
- / Edit(管理者用)
# 一般法則論
ほめ言葉に反応する脳の部位があることを確かめたくて検索中にこのブログにたどり着きました。
線条体がこれでしようか・・・。
一般法則論
http://blog.goo.ne.jp/i-will-get-you/