pooneilの脳科学論文コメント: 「行動の価値」を表す線条体ニューロン

■ 「行動の価値」を表す線条体ニューロン

Science 11/25 "Representation of Action-Specific Reward Values in the Striatum"

最終回。まとめ、というか落ち穂拾いというか。

いろいろ文句を付けてきましたが、striatumにaction valueをコードしているニューロンのpopulationがある、ということに関してはじゅうぶん証拠があると思います。その根拠としては、本文でのQ_RやQ_Lのコーディングよりはsupporting materialでのinstantaneousなQ_R(i)やQ_L(i)でのregressionのほうが説得的だと私は思うのですが。

また、このストーリーの正しさは、つづいで出てくるであろう論文によって確認されることでしょう。今回のScience論文はdelay期間(レバーをホールドしてからgoシグナルが出るまで)のactivityだけに注目していましたが、今年のSFNで著者らは同じニューロン記録でmovement期間(レバーを倒している時間)やreinforcer期間(rewardをもらっている時間)の活動を解析して報告しています。それによると、delay期間でaction valueをコードしているニューロンがmovement期間にactionをコードしてたりすることはないようで、striatumのニューロンはaction value, action, reinforcerをコードするニューロンは別々の集団らしいと。(まだジャーナルには出てきていない結果なのでこのくらいあっさりめにて。)

また、Doyaモデルの検証という意味では、striatumでのaction valueの情報が、その下流のGP/SNrでselected actionに変換される、という図式を証明するために、GP/SNrからの記録データが出てくることを期待します。action valueに関してはstriatum > GP/SNr、selected actionに関してはstriatum < GP/SNrとなれば説得力があります。Science論文でもHagai BergmanのJNS '04 "Independent Coding of Movement Direction and Reward Prediction by Single Pallidal Neurons"をreferしてますが、この論文ではGPeニューロンは主にselected actionをコードしています。ただ、free-choice taskではないので(cueによってtargetの出る位置が決まっていて、reward probabilityが確率変動する)、やはりここは直接的な検証が必要です。

なお、Science論文のdiscussion部分を読んでいると、selected actionが下流のGPe/SNrでコードされるのか、それともlateral inhibitionによってstriatum内の別のニューロンによってコードされるのか、は検証の必要あり、としていて、含みを残していることがわかります。

あとついでに、discussion部分の最後の一文になっていきなりParkinson's diseaseが出てくるあたりには、とってつけた感をおぼえたり。というか前の文とつながってないし。

以上です。

Postscript: これまでのSugrue論文とかGlimcher論文とかのときにはそれなりにメイザーの教科書読んだり、ゲーム理論について勉強したり、周辺領域の勉強をして臨んだのですが、今回は強化学習まわりまで踏み込めませんでした。すくなくともactor criticモデルとQ-learningモデルとの本質的な違い(on-policy TDとoff-policy TDの違いあたり)は押さえとかないと、と思ってSutton and Bartoの教科書のhtml版とか、NISS2000のテキスト(pdf)および講義録(pdf)とか、いくつかダウンロードしておいたのですが、そのまま放置してしまいました。んで、手癖で、統計解析まわりに文句付けて流してしまった、という次第です。読んでくださった方、どうもありがとうございました。(いや、まだこのブログは続きますけど、なんかそう言って締めたいかんじ。)

/ ツイートする
/ 投稿日: 2005年12月29日
/ カテゴリー: [行動の価値 (action value)]
/ Edit(管理者用)

お勧めエントリ

細胞外電極はなにを見ているか(1) 20080727 (2) リニューアル版 20081107
総説長期記憶の脳内メカニズム 20100909
駒場講義2013 「意識の科学的研究 - 盲視を起点に」20130626
駒場講義2012レジメ意識と注意の脳内メカニズム(1) 注意 20121010 (2) 意識 20121011
視覚、注意、言語で3*2の背側、腹側経路説 20140119
脳科学辞典の項目書いた「盲視」 20130407
脳科学辞典の項目書いた「気づき」 20130228
脳科学辞典の項目書いた「サリエンシー」 20121224
脳科学辞典の項目書いた「マイクロサッケード」 20121227
盲視でおこる「なにかあるかんじ」 20110126
DKL色空間についてまとめ 20090113
科学基礎論学会秋の研究例会ワークショップ「意識の神経科学と神経現象学」レジメ 20131102
ギャラガー＆ザハヴィ『現象学的な心』合評会レジメ 20130628
Marrのrepresentationとprocessをベイトソン流に解釈する (1) 20100317 (2) 20100317
半側空間無視と同名半盲とは区別できるか？(1) 20080220 (2) 半側空間無視の原因部位は？ 20080221
MarrのVisionの最初と最後だけを読む 20071213

月別過去ログ

[2025]: 6|; 5|; 4|; 3|; 2|; 1|
[2024]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2023]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2022]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2021]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2020]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2019]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2018]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2017]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2016]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2015]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2014]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2013]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2012]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2011]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2010]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2009]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2008]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2007]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2006]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2005]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2004]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2003]: 12|; 11|; 8|; 7|
[2001]: 10|; 8|; 6|; 5|; 4|; 2|
[2000]: 12|; 9|; 8|; 7|; 6|; 3|; 2|; 1|
[1999]: 9|; 8|; 7|