[月別過去ログ] 2012年09月

« 2012年08月 | 最新のページに戻る | 2012年10月 »

2012年09月30日

こまごまとメモ。(20120521まで)

あとからピントを合わせられるlight field cameraの話に興味を持つのは、これがAdelson & Bergen 1991 (PDF)のPlenoptic Functionを記述しようとするものだから。

Adelson & Bergen 1991 はそれまでのmotion energy modelとかbinocular disparityとかいろんなものを統一的に扱えるという意味で視覚科学/コンピュータビジョン的に重要だ。

でもそれだけではなくて、わたしが重要だと思っているのは、これがギブソンの包囲光配列(ambient optic array)を数学的にcompleteに記述したものだから。これはわたしの妄想ではなくて、Adelson & Bergen 1991の本文にも書かれている。

ギブソンの本を読むとさっぱり数学が出てこないので、かえってわかりにくくて困るのだけど、しかもそれは反表象主義的な態度から来ていることも推測されるのだけれども、でもPlenoptic Functionでちゃんと「不変項の抽出」とか扱ってやればいいんじゃないのか?とか思う。

なぜかはよくわからないけど、Adelsonは1992のplenoptic camera以降はplenopticという言葉が入った論文を出してないし、このへんの問題意識を後継しているものが見つからない。見逃しているのだろうか?

アフォーダンスが脱臭されてgraspingとかの行動選択の情報として扱われるのと同じように、包囲光配列も数学的に扱うだけで脱臭され、それの含意する「直接知覚」的な立場は危うくなってしまうのだろうか? もうちょっと考えてみることにしよう。


"The Cost of Accumulating Evidence in Perceptual Decision Making" JNS2012 こういうかんじにaccumulator modelで時間が経つごとに閾値を下げてゆくというのはわたしもV1 lesionでdiffusion model使ったときに考えたけど、複雑になるだけだから避けてた。

いまだったら、deliberateである=accumulationする、reflectiveである=accumulationさせない、という感じで論じることもできそう。

つまり、normalではLIPを使ってevidenceのaccumulationができるのだけれども、blindsightでは蓄積できない(SCで積分でなくシグナルそのもので閾値を切る)=>いつまでたっても確証がない=>reflexiveになる。

サルではスピードのコストが高いので応答潜時は早くなる。ヒトではスピードのコストが低いので応答潜時はかえって遅くなる。そして、この「確証を与える」という部分こそが意識の機能であり、メタ認知との関連性に関わるとか云々。

蓄積できるということは時間をまたぐということなので、そういう意味では意識に時間の流れが必要なのはたしかで、でもそれは作業記憶みたいなものとは違うだろう、って話の流れ。

この話(deliberate=accumulation)はAndy Jacksonと議論しているときに考えた。Andyはそのときたしか、thresholdが時間で一定だってのは妥当な過程か?と聞いてきたはず。そのときは鋭いなあと感心したのだが、Andyはシアトルにいたので、Shadlenのこの仕事の話を聞いていたのかもしれない。


"Effects of Visual Experience on the Human MT+ Functional Connectivity Networks" Front. Syst. Neurosci. 2010

congenital blindでもMTはtactileとかで活動する。だから、V1スキップしてMT活動したときの感覚はvisualというよりはもっと抽象的なものかもしれない。


眼球運動の定量的な取り扱いでは網膜の座標だとspherical coordinate (radial distance, elevation, azimuth)になって、筋肉の座標だと外眼筋で三軸あって、オイラー角でroll-pitch-yawに対応する。

オイラー角なじめなかったけど、飛行機の進む向きで考えればよいのか。進行方向で上げ下げするのがpitchで、進行方向の軸で回るのがローリングで、左右に曲がろうとするのがヨーイングか。おぼえた。

そうなると、上丘での網膜依存の座標(spherical coordinate)から外転筋の座標(オイラー角)への変換となる。ただし、torsionはあんまり使わないから、pitch-yawだけでコントロールする。

眼球運動のコントロール自体にはあまり深入りせずにきたけど、軌道の議論とかをちゃんとやろうとするとこのへんを避けるわけにはいかない。

ジンバルロックとかなにその名前、かっこよすぎる。(<-老いて学び、なんだったっけ?)



2012年09月26日

”the changes I'm going through”

Donovanの名盤Sunshine Supermanの最後の曲Celesteは曲調と同様、歌詞もなんだか靄がかかったような感じなんだけど、”the changes I'm going through”というフレーズが印象に残る。

それはイギリスのディランからサイケに急展開したドノバン自身のヒストリーにも良く合致するし、 The Trip (San Franciscoのライブハウスから)とかThe Fat Angel (Jefferson Airplaneが歌詞に出てくる)とかそっち方面で「脳内革命」してしまった、その時代の熱気みたいなものが伝わる。

ドノバンのSunshine Supermanが録音されたのは1966年の1月から5月だそうだ。部分的にはLA ハリウッドのCBSスタジオで録音されている。これをクールエイド周辺と時系列をつきあわせてみよう。とある年表によると、Trip Festivalが1966年1月。それからKeseyがメキシコに逃亡している間に、残されたMerry PrankstersはLAでacid testを開催している。もしかしたらそこにドノバンはいたのかもしれない。

Jefferson Airplaneがsomebody to loveをヒットさせたのは1967年4月。つまり、ドノバンが"Sunshine Superman"のアルバムの中の"fat angel"で"fly Jefferson Airplane"と歌ったとき(1966年前半)には、Jefferson Airplaneは"somebody to love"どころか、まだファーストアルバム("takes off")すらリリースしてない。これは今回初めて知った。さすがにシッコちびった。


ドノバンのSunshine Supermanの一曲目の"through all level you've been changing" とラストの曲Ceresteの"the changes I'm going through"が対応していることに気付いた。でもってこれはドノバンがLAで脳内革命しちゃった時代の曲だから、 Slip inside the houseと同様、 これみたいなステージへの進行を想定しているのだろう。チベット死者の書が読まれたりとかそういうアレ。

"Through all levels you've been changing”はSunshine SupermanじゃなくてEpistle To Dippy(「ディピーへの書簡」)だった。"Elevator in the brain hotel"ってのも同じ含意だな。 歌詞の中で若い僧が"rhododendron"(つつじ)の森で瞑想してるんで、これは東洋なんだろう。「つつじ」だとなんということもないが、rhododendronだとなんだかオリエンタルだ。

Dippyは実在するドノバンの旧友で、当時ベトナム戦争(1967年)でマレーシアに配属されていたらしい。Wikipedia

歌詞の内容はそんなに反戦的ではないのだが、この一節だけかんじが変わる:"Rebelling against society, such a tiny speculating whether to be a hip or skip along quite merrily."


"Sunshine came softly a-through my a-window today"これの"a"って"the times they are a-changin'"の真似っこなんだろう。中学校のときに英語の石井先生に「この"a"っていったいなんですか?」って質問したんだけど、満足する答えを得られなかった。そりゃ無理だろう。こうして書いてみると、中学生のくせにディランとか聴くのか、って思われたい虚栄心を感じるが。

中学のときの卒業文集には"Sad-Eyed Lady of the Lowlands”の歌詞を書き込んだことを思い出した。そのころはサイケデリックじゃなくって、シュールレアリズム(アンドレブルドンの溶ける魚)とかダダ(中原中也経由で高橋新吉)とか私的にはそういう時代だった。そういえば、蛍光絵の具でマンダラみたいなの書いたりとかしてた。

「中学生のくせにディランとか聴くのか」というのは、それが1981年、つまりディランにとっては「欲望」と「ウィ・アー・ザ・ワールド」の間の低迷期であり、ふつうの日本人にとっては「学生街の喫茶店」と「風に吹かれて」でしかなかった時期であることを強調したい。だが強調してどうする。


2012年09月22日

エズミに捧ぐ-愛と汚辱のうちに

サリンジャーのナイン・ストーリーズに入っている「エズミに捧ぐ -愛と汚辱のうちに」("For Esmé - with Love and Squalor")の原文を読んでた。

このSqualor(汚辱)をどう訳すか、なんだけど、英語のニュアンスなんてわかりゃしないんだけど、試しにsqualorで画像検索(セーフサーチオフで)してみたらゴミ屋敷系の画像がたくさん出てきたので、なんか分かった気がしてきた。

それにしても、まだ分からないのだけど、Esmeはなんで"I prefer stories about squalor"と言ったのだろうか?

"I'd be extremely flattered if you'd write a story exclusively for me sometime. I'm an avid reader."

I told her I certainly would, if I could. I said that I wasn't terribly prolific.

"It doesn't have to be terribly prolific! Just so that it isn't childish and silly." She reflected. "I prefer stories about squalor."

"About what?" I said, leaning forward. "Squalor. I'm extremely interested in squalor."

I was about to press her for more details, but I felt Charles pinching me, hard, on my arm.

私はずっと、Esmeは背伸びをして間違った言葉を使ったのではないかと思っていた。"Make it extremely squalid and moving”とあるように、movingに近い、なんかの言葉と取り違えているのではないかということだ。

でも、解説とか探したんだけど、そういうことではないようだ。 ネット上で一つ見つけたのがこれ:

どうやら、Esmeはsqualor / squalidという言葉の意味を知ってはいるけれど、実のところ世の中のsqualorとはどんなものなのかを知らずにそう言ったという理解のようだ。その直前では、”childish and silly”ではないものを書いてほしい、と言ってるし。(とはいえ、彼女は以前戦争で父親を失っているのだが。)

"About what?" I said, leaning forward. ここを見ると、やっぱそうとうあり得ない単語が出てきたと考えるべきだ。英語のニュアンスはわからないが、主人公はギョッとしてように見える。

英会話すらおぼつかないくせに英語文学読もうなんてのがそもそも的外れなのである。でもやる。

"I told her I certainly would, if I could" ここの"if I could"は泣ける。なぜなら主人公はこのときノルマンディー上陸作戦へ出発する前日で、死を覚悟しているわけなのだから。


いちばんはじめのこの部分も味わい深い。

I thought it might just be possible for me to make the trip abroad, by plane, expenses be hanged. However, I've since discussed the matter rather extensively with my wife, a breathtakingly levelheaded girl, and we've decided against it--for one thing, I'd completely forgotten that my mother-in-law is looking forward to spending the last two weeks in April with us. I really don't get to see Mother Grencher terribly often ...

この文章の”rather extensively”という表現で、奥さんに「ちょっとぉ、うちのお母さんが来るの忘れたの? お母さんもう歳なんだからそうそう一緒にすごす機会無いんだからね?」とかこんこんと説教されて、泣く泣くEsmeの結婚式へ出席するのを断念したところまで想像できた。

それは、"breathtakingly levelheaded girl"のbreathtakinglyという大げさな表現で書くことでもそういう皮肉のニュアンスが出ているはず。少なくとも私はそういう毒電波を受信wできた。

All the same, though, wherever I happen to be I don't think I'm the type that doesn't even lift a finger to prevent a wedding from flatting.

持って回った表現すぎてどっちなんだか混乱する。よくなくなくなくなくなくない、みたいな。

そのまま読めば「俺盛り上げられずにはいられないよん?」みたいなかんじだけど、キャラ的にあり得ないからこれも皮肉的表現としかいいようがない。

つか著者病んでるから、書いてあることの意味は全部いつでも、いくらでも反転するよな。主人公がEsmeに好感を持ったかどうかすら確定してない。

というか著者は確定させないようにバランス考えて書いているんだと思うので(つか自分が著者だったらそうする<-投影しすぎ)、「Esmeはsqualorでcharleyはlove」みたいな図式的な説を見ると、ホントどうかしてると思う。

国語の問題とかで、「主人公がEsmeに好意を抱いていることを示唆している部分を書き出しなさい」なんてのが出題されるんだろうか? そんなのわたしが許さない。


次男が「おばあさんのシワは何本あるでしょう?」という昨日と同じ謎々を出すので、4*8=32で32本!と答えたら、そういえば昨日出したか、と笑っている。Charleyのように拗ねたりはしない。いいやつだ。


知らず知らずのうちに、サリンジャーとかヴォネガットとか自分の観測範囲内での「戦争」文学に目が向くところに、時代とのcoincidenceを感じる。(<-非科学的な物言い) 今夜はEve of Destructionなんだろうか?


2012年09月20日

信号検出理論の感度(d-prime)にエラーバーを付けたい!(解決編)

以前 「SDTのd'にエラーバーつけたい。」ってのを書いたことがあるけど、このときの図の軸をpではなくてnorminv(p)にしてしまえばd'が等しいところが並ぶのでCDFの計算が簡単になる。

594725645.png


これでconfidence intervalも計算できるんで、解決って思ってたんだけど、元のp(hit), p(fa)での軸も悪くないんではないかということに思い当たった。というのも、大して大きいデータではないので、N=hit+miss, M=fa+crを固定した上で、p(hit), p(fa)をそれぞれ0-1までふって尤度を計算してやれば、たかだかM*N個の尤度の計算で済む上に、もっとも重要なことは、p=0,1での尤度の計算も出来る。

norminvだとここはInf, -Infに発散してしまうのでd'が計算できないわけだけど、それはそれとしてそのデータ点の尤度が計算できるならば、たとえd'がInf, -Infになってしまっても、尤度関数の期待値から、ベイズ推定的にd'の推定値と信頼区間を計算できる。つまり、hit rateが 30/30だったとしても、d'が推定できる。これはよいんではないだろうか。

考え方としては、二項分布で20/20のときの信頼区間計算する話と同じ。

いや、d'そのものは推定できないけど、そのupperboundかloweboundが計算できる。たぶん、hit = 30/30のときに便宜的に29/30だったらd'いくつになるか計算するのと同じことを、もうちょっとまともにやったことになるのではないだろうか。

ここまで考えると、もうちょい逸脱して、d'自体の絶対値にこだわらずに、M*N個の可能なd'のランクに変換して、ノンパラメトリックd'みたいなものを定義してしまえばよい。 探せばこういうのありそうだ。

最尤法で尤度がmaxのところを推定値とするのはMAP推定と等価だけど、maxではなくて分布の重み付け平均を推定値として取るのはなんと呼べばよいのだろう。「ベイズ推定」と呼ぶのはへんな気はするが、noninformative priorでのベイズ推定と言えばウソはついていないのか。

ためしに計算してみた。p(hit) = 30/30で、p(FA) = 10/20の場合。

594770849.png


でもって、ここまできたらたぶん、dprime = norminv(p(hit)) -norminv(p(fa)) の式を使うのがアホなんだろうな。ノンパラにするのも極端な話で、二項分布かなんかを持ってきて、ノイズのシグナルの二つの分布の離れ具合はKL距離で評価とかそんなかんじか。


超分かった!d-primeのドメインではなくて、[p(hit), p(fa)] 自体のベイズ推定を行えばいいんだ。p(hit)=1だったとしても、30/30と3000/3000とでは推定されるpは違うし、それはけっして1ではない。それを使ってd-primeを計算してやればよい。しかもこれはけっこう実用的だ。

matlab関数作ってみた。たとえば[hit miss fa cr] = [10 0 5 5]の場合、p(hit)=1からはd'=Infになってしまうが、尤度からのp(hit)の推定値は0.95となる。これから計算したd'は1.69となる。妥当なかんじ。

595447647.png


[hit miss fa cr] = [30 0 15 15]の場合、尤度からのp(hit)の推定値は0.98となる。これから計算したd'は2.10となる。

595448789.png


[hit miss fa cr] = [100 0 50 50]の場合、尤度からのp(hit)の推定値は0.99となる。これから計算したd'は2.53となる。だいたい満足した。

595449356.png


[100 0 0 100]とか極端な状態でd-prime(exp) = 5で、実際にはお手つきがあるから[99 1 1 99]でd-prime(exp) = 4。妥当なかんじ。ふつうのd'では>3とかに意味がないって言われるわけだけど、よっぽどそんなにでかいところまで発散しない。

matlabコードは http://pooneil.sakura.ne.jp/dprime_lik.m にアップしておきました。無保証でどうぞ。なんか間違いがあるようならぜひ教えてください。


2012年09月16日

モティベーションのサリエンシー

Peter Redgrave以降の仕事でDAがvisual salienceに関わるという話(Nat Neurosci. 2003)があって、SNcのDAニューロンのshort-latency visual responeは上丘からのvisual salienceのシグナルを受けている。

最近の彦坂研の仕事(Neuron. 2010)でも、DAはprediction errorだけではなくて、"motivational salience"をコードしているんだという言い方をしている。

この"motivational salience"って表現が絶妙で、Kent C. Berridgeの言う"incentive salience"って言葉と微妙に変えてあって、同一視されないようにしてある。

ともあれ、visual salienceとincentive salienceを包括して考えられるんではないだろうかと考える。このことはさらに、saliencyとconsciousnessとの関係について考える際にも役に立つはずだ。

Incentive salienceの方から考えると、Liking(=pleasure)とwanting(=incentive)との分類であれば、wantingのほうは無意識のnovelty detectionだけで可能で、でもlikingのほうはかならずやconscious experienceを伴う?

Prediction errorは+と-の方向があって、salienceというのは+-極性無視して変化の大きさだけを評価している(元ネタ KatoTadafumiさんのツイート)。だからもともと両者はそんなに大きく違ったものではなくて、入力値をどう料理するかの違いでしかない。

Prediction errorは内部モデルの改変のために必要で、オフラインで使うためのもので、salienceはオンラインでの行動のトリガーとかに使うためのものでとか。

Salienceが極性気にしないということは、これはエネルギーの次元みたいな量を扱っているという可能性もある。そのことと、salienceがスピード重視で演算する必要があることとはなんか関係あるだろうか。


2012年09月13日

連合学習理論の記述のレベルってどこだ?

(20020822あたりのツイートを元にして作成。)


いまブログの準備を兼ねて、澤幸祐 動物心理学研究2012(「連合学習理論は擬鼠主義の産物か -表現論としての連合理論-」pdf)を読んでいるところなんだけど、「中間言語としての連合学習理論」ってのになるほどと思った。でもって、そのレベルの文法体系それ自体が自立した整合的な(まさに文法的な)構造を持っているのかどうかという問題はさておき、これをデビット・マーの三段階の理論と(むりやり)つなげて考える。マー的にはImplementation-アルゴリズム-計算論という階層的な構造があって、あくまで工学的な問題解決から捉えているのだけれども、これの上に中間言語としての連合学習理論もマップできないだろうか?

たとえばそれはアルゴリズムの層であって(種差よりも共通性を重視する)、いっぽうでエソロジーというのは計算理論のレベル(=エコロジカルな意義のレベル、と読み替える)であると説明できないだろうか? ってこれは井口善生 動物心理学研究2008(「連合論的学習心理学と比較認知科学の断絶と接点」pdf)の方に関わる問題か。

このエッセイでは「比較認知科学に関わる者は、古典的エソロジーが最終的にメカニズム論を生理学に任せてしまったように、ヒトの認知心理学にメカニズム論を任せてしまうのか、それとも比較認知科学独自の予測性を持った理論屋モデルを必要としているのか、再検討してみるべきだろう」と書いている。

これはさっき書いた、そのレベルの文法体系それ自体が自立した整合的な(まさに文法的な)構造を持っているのかどうかという問題にもつながるだろう。

話を戻すけど、以前ブログに書いた話で、 マーの三段階の階層構造は分断されたものではなくて、ベイトソン的に表象とプロセスの連関でもって繋がっていると考えた方がいいのではないかと思う。

ならば、それは脳と体と環境の相互関係が作るバイオロジカルなレベルでの記述(バイオロジカルセオリー=たとえばSTDPで強化しましたとかそういう記述)と心理学的理論の文法構造とは階層的に繋がっていて、両者が拘束し合う形になるはずだと思う。

神経科学の研究はこのような意味で心理学的な理論に拘束条件を与えていくというのがマーが想定したプロジェクトだろう。これはバイオロジカルセオリー(たとえば上丘のニューロンの活動の空間的平均でサッカードのベクターの向きが決まる)だけで充分ですか、って問いになる。

今平行して読んでいるBBS2009 "The propositional nature of human associative learning"(pdf)では、現象としての連合とメカニズムとしての連合を分けるべきで、メカニズムとしての連合は自動的無意識的ななlinkと認知的かつ命題的ななものとがあって、後者を強調している。

とりあえずこのへんまでは読み進めた。とりあえず自分なりの問題意識は見えてきたけど、まだ考えはまとまってない。


書いたもの見直して思ったけど、BBS2009でのlinkのようなものはほとんどimplementation(バイオロジー)のレベルを置き換えて言っているのに近いのだろうな。すると、アルゴリズムの層よりももっとimplementationの層に近いような気がする。というか両者を同一視しているのだな。


2012年09月08日

生理研研究会 予習シリーズ:ラットの因果推論と連合学習理論(5)

さて予習シリーズの最終回です。

長くなったので、第一回から最終回までつなげたPDFを作りました。ご利用ください:pdf (11MB)

[統計的因果推論]

前回の統計的因果推論の話をまとめると、もし因果モデルの知識を「観察」によって獲得しているならば、observe条件 (「介入なし」)とintervene条件(「介入あり」)とで、common-causeモデルの場合の下流のノード間の共変の程度を正確に予測できる。

ヒト心理学実験(Waldmann et al 2005)ではこれは成り立ち、赤ちゃんでも成り立つ(Gopnik et al 2004)。この論理でもってラットの因果推論を検証したのがScience 2006だった。

でも、ベイズネットのモデルの前提として、たとえばcommon-causeのモデルの場合、下流の二つのノードであるT(トーン)とF(砂糖水)では、P(T)とP(F)が独立でなくてはいけない。つまり、P(T, F) = P(T) * P(F) でないといけない。 ところがラットの実験ではすべての実験条件において、独立性の条件を満たしていない。

たとえば、Science 2006 exp1では、L->T, L->Fをinterleaveして与えている(前々回の記事を参照)。これだとP(T=1 | L=1)=0.5, P(F=1 | L=1)=0.5としたうえで、TとFとはけっして同時には出ない。つまり、

P(T=1, F=1) = 0
P(T=1) * P(F=1) = 1

となっていて、独立性の条件を満たしていない。それどころか、TとFは逆相関している。つまり、P(F=0 | T=1)=1。

つまり、もしラットが合理的に因果推測を行っているならば、observation条件ではここで想定しているモデルでの予測とは逆に、テスト試行でのTに対するnose poke (CR)は低くなるはずだ。なぜなら、Tが出た時はぜったいFは出ないのだから。

また、Science 2006 exp2a,2b および Leising et al 2008 ではトレーニング試行を二つに分けて、L->T を教えてからそのあとで L->F を与えて、それからtestを行っている。これを確率で表せば、exp1と同じことになる。つまり、因果ベイズネットという認知的モデルではこれらの実験のラットの行動をうまく説明できない。

[Minimal Rational Model]

以上の疑問を抱いてこの論文を読んだ後で、Penn and Povinelli 2007が同じことを指摘していることに気付いた。さらに関連論文を読み進めてゆくと、Waldmann et al 2008で著者は、ラットの結果がベイズネット理論よりもBuehner and Cheng (2005)の"single-effect learning" modelでよりよく説明できる、と主張している。つまり、ラットについてはベイズネット理論を引っ込めた。

"Single-effect learning" modelとはどんなものかというと、連合学習理論で使われるpower-PC theoryの延長上にある理論で、ラットはcommon-causeのモデル全体を持っているのではなくて、L->T, L->Fというべつべつのリンクのモデルを持っている。そしてラットは、observe条件とintervene条件とでL->Tという因果の強さの評価を変えている。これがScience 2006で見られたdiscounting effectであると。(この部分Waldmann et al 2008にアクセスできなかったので、Penn and Povinelli 2009に基づいて書いてる。)

これはけっきょく、わたしが第一回目のまとめのときに書いた以下のこととほぼ同じだろう。

(ラットは)「トーン(純音)が鳴る」を説明する因果モデルとして

  • 「ライトが点灯する」->「トーン(純音)が鳴る」
  • 「レバーを押す」->「トーン(純音)が鳴る」

のうち後者を選択した。ゆえに前者を選択した場合に起こる鼻をつっこむ行動が減った。つまり「トーン(純音)が鳴る」からその原因を推測した

けっきょくベイズネットまで持ってこなくても、連合学習理論そのものでは説明できないということは堅い結果なので、適切なレベルの主張にしたということのようだ。(Waldmann et al 2008ではminimal rational modelとタイトルに書いている。) つまるところ話が反転していて、ふたたび連合学習理論による説明に大きく依存したモデルとなったのだ。

そこで一つ考えたのだけれども、Science 2006 exp2a,b以降の実験では、トレーニング試行でまずL->Tのブロックがあってからその後でL->Fをやっている。これはsensory preconditioningと言われる処理だ。これは推測だけど、もし実験操作の順番を変えて、L->F を与えてから L->T を教えたとしたらたぶんまた違った結果が得られることだろう。(予想するに、chainとcommonとで差が付かなくなる)

そういう意味でも、たぶんこの実験パラダイムのラットの結果を説明するためには連合学習理論が必要なのだろう。

[ベイズネット救済の道は?]

とはいえ、ベイズネットを引っ込める必要があるのだろうか? まあ、このへんを進めてゆくのはおそらくはAaron Blaisdellのほうの仕事なんだろうと思うけど、まだベイズネットの方向でできる気はする。

前回も指摘したように、独立性の前提を満たすような実験デザインでやればいいんじゃないの?とまあこういう実験やったことのない人間としては思った。前回書いたように、トレーニング試行を L->TF (TとFが同時に出る)というふうにしてやれば、独立性の条件も満たされるわけだし。

この疑問をtwitterで書いたところ、澤さんからお返事をいただいた。

  • 「なんでもっとかんたんにP(T|L)=1, P(F|L)=1とはできないんだろう? それがいちばんcommon cause modelを素直に表現した状態だと思うのだけれども…」(pooneil)
  • 「… P(T|L)=1, P(F|L)=1にするとエサ提示がトーンを隠蔽してしまってLight-Toneの学習が不完全になると思われます…」(kosukesa)
  • 「…もちろん実験条件としてあってもいいとは思いますが,結果の解釈がクリアになるわけではないと思われます…」(kosukesa)

なるほど、ではovershadowingしすぎないように条件を変えられないだろうか? たとえば、L->TF, L->T, L->F, Lの四条件をinterleaveしてやれば、P(F=1 | L=1) = 0.5, P(T=1 | L=1) = 0.5となり、独立性の条件も満たされる。(まあ、充分にトレーニングをするのが難しそうだが。)

あと、今回のようなdeterministicなものでなくして確率振ってもいいし(P(F | L)=1ではなくて0.5とか)。Waldmann 2005が確率的であったことを考えると、たぶんいろいろやった結果ラットでできる限界はdeterministicなバージョンまでだったんだろうと予測するけど。

まあこのへんはラットではなくてサルかもしれない。サルだとovertrainしたうえで、probe testではなくて繰り返し記録しないといけないのが難点だけど、「思考」「推論」に関わるニューロン活動記録する方向でこの実験パラダイムを活用できないだろうか? そんなことを考えた。

あと逆に、ベイズネットの方をなんらか拡張して、今回の条件のデータと整合性のあるようにできないだろうか。前回ちょろっと書いたけど、P(T)とP(F)が独立でないということは、common-causeのモデルではないってことなので、すべてのjoint probabilityから実験データを正しく反映した本当のグラフ構造を作ることができる。そのうえでgraph surgery (介入による因果グラフ構造の変化)をやればいいんではないだろうか。そのうえで、L->F, L->Tの順番の違いとかはを因果モデル形成の際の履歴の効果として取り込む。このくらいでなんとかならないだろうか。

赤ちゃんでできるのにラットでできないのはなんか認知能力の限界があるわけで、それは「因果推論のモジュールがあるかないか」みたいなブラックボックスでなくて、もっと記憶容量なり刺激般化能力なり、もっと具体的なものにできないだろうか。

[結論]

Science 2006の結果はこれまでの連合学習理論では説明できないような認知的な現象を見つけたということで、この部分に関しては非常に堅い。しかし、では因果推論に連合学習理論はいらないのかというとそういう話ではない。連合学習理論が持っている実験デザインと行動説明能力は強力なので、認知的な説明をするときにもそれらを入れていかないとトップダウン的で説明能力の低いものとなってしまうようだ。それが今回の一連の話の後半で出てきた話。

連合学習理論と認知的理論との関係はどうなのかということを知りたくて、その一例としてこの論文を読んだという側面もある。なるほど簡単にすっぱり割切れるわけではないことがよく分かった。

さてこのへんからが本当に議論をしたいところだ。神経科学が思考のようなアクティブな現象を解明するとしたら、擬人化を完全に排除した心理モデルを持つ必要があって、それはどのようなものだろうか、ということについて議論したい。生理研研究会だけではなく、その後ででも。

参加者の皆さんがこのブログを読んでこのへんの分野の前提を共有してくれたら深いところまで話できないかなと期待している。

というわけでScience 2006を読み込むのが目的だったのだけれども、かなり長い話となった。話は長いが、無駄ははしょって、でも必要な部分は省略せずに書いたつもり。

予習シリーズはこれで終了です。それでは岡崎で会いましょう。

長くなったので、第一回から最終回までつなげたPDFを作りました。ご利用ください:pdf (11MB)

[参考文献]

  • Buehner, M. J. & Cheng, P. W. (2005). Causal Learning. In R. Morrison & K. J. Holyoak (Eds.) Handbook of Thinking and Reasoning. Cambridge University Press, pp143-168.
  • Penn, D. & Povinelli, D.J. (2007). Causal cognition in human and nonhuman animals: A comparative, critical review.(pdf) Annual Review of Psychology, 58, 97-118.
  • Penn, D. C. and D. J. Povinelli (2009). On Becoming Approximately Rational: The Relational Reinterpretation Hypothesis.(pdf) Rational Animals, Irrational Humans. S. Watanabe, A. P. Blaisdell and L. Huber. Tokyo, Keio University Press.
  • Waldmann, M. R., Cheng, P. W., Hagmayer, Y., & Blaisdell, A. P. (2008). Causal learning in rats and humans: a minimal rational model. In N. Chater, & M. Oaksford (Eds.), The probabilistic mind. Prospects for Bayesian Cognitive Science (pp. 453-484). Oxford: University Press. (これはpdfはないが、google booksで部分的に読める。)

2012年09月07日

生理研研究会 予習シリーズ:ラットの因果推論と連合学習理論(4)

さて、予習シリーズ前回の続き。今回は数式が多いけど、数式飛ばして日本語だけ読めば話は分かるはず。計算の方は簡単な条件を選んで、なるたけ計算手順省略しないで書いた。

(9/8追記:第一回から最終回までつなげたPDFを作りました。ご利用ください:pdf (11MB))

前回はScience 2006について、実験手順を詳しく追っていって、連合学習理論だけでは説明できない、因果推論に基づいた行動をラットがしているということを確認しました。

そのような行動は認知的理論である、ベイズネットによって説明できる、というわけですが、Science 2006の著者のWaldmann (ゲッティンゲン大学)がまさにこの論文にある実験系をヒトでのcausal knowledgeの研究に使ってきた人でした。

[統計的因果推論・観察・介入]

統計学の世界には「統計的因果推論」という分野がある。ここはまた深い世界だしわたしもよくわかってないので、ここで必要なことだけ書きます。

まずわれわれが「観察」で見ているのは相関であって、因果ではない。そこで「介入」をして何が起こったかを調べる。もしその介入がなかったらどうだったかという「反実仮想」をする。これは現実的には不可能だから、その代わりに介入をしなかった条件のグループを作る。(処置あり/なし * 介入あり/なし の2*2 で二マス分は欠損データになる。) でもって、[介入あり]-[介入なし]で因果関係を検出する、これが統計的因果推論。

このような操作をする際に「介入をする」という概念は統計学にはなかったので、それを「do演算子」というものを使って表現するようにしたのがJudea Pearl。do演算子に関しては後述する。Webで入手できる資料だとここに助けられた。

それで、Science 2006の著者のWaldmannはこのような統計的因果推論を、人間の因果推論をモデル化するために使った。ヒト心理実験によって、因果モデルの違い(common-causeかchain-causeか)によって「観察」と「介入」への効果が変わることを示した(Waldmann MR, Hagmayer Y. (2005))。つまり普通の人も、研究者みたいな因果推論をしているんだということ。

このような結果を基にして、それをラットに応用したのがScience 2006だった。

ここでは、ヒト実験(Waldmann MR, Hagmayer Y. (2005))の代わりに、肥満のたとえ話 (Hagmayer et.al., 2007) で説明してみる。

causal_reasoning4d.png

図のようにL,T,Fのcommon causeのモデルがあって、L,T,Fはそれぞれフツーかヤヴァイかの二通り。

ここでは、common-causeについてだけ説明する。まず、Common-causeでの確率は一般的な形で

P(L ,T, F) = P(T | L) * P(F | L) * P(L)

で計算できる。

Common-causeモデルでのobservation条件というのは、上記の一般的な式にT=1を入れたものになる。(Science 2006のテスト試行でトーンが鳴ったのと形式的に同じ。)

P(L, T=1, F) = P(T=1 | L) * P(F | L) * P(L)

一方で、intervention条件はどのように表記できるかというと、前述のPearlのdo演算子というのを使う。do(T=1)と書く。なにが違うかというと、

  • 観察: P(L, T=1, F) --- データの中からT=1のものを選ぶ
  • 介入: P(L, do(T=1), F) --- Tを1にセットする。

ということ。これは言葉遊びではなくて、実際の計算も変わる。というのも、P(do(T=1) | L) = 1 だから。(Lによらず、T=1にセットしたから。)

P(L, do(T=1), F)
 = P(do(T=1) | L) * P(F | L) * P(L)
 = P(F | L) * P(L)

つまり、intervene条件では、Tはこの因果グラフとは無関係になる。これはなるほど理にかなってる。

では、T=1を見た時にF=1であること(ある人が肥満だった場合に、その人の血中コレステロール量が高い確率)を推定してみよう。これはScience 2006のobservation条件で「Toneが鳴る」から「砂糖水が出る」を推測するのと形式的には同じ。

P(F=1 | T=1)
= P(F=1 | L=1) * P(L=1 | T=1) + P(F=1 | L=0) * P(L=0 | T=1)
= 0.4 * 0.9 + 0.1 * 0.1
= 0.37

P(L=1 | T=1)およびP(L=0 | T=1)はベイズの法則で計算する:
P(L=1 | T=1) = P(T=1 | L=1) * P(L=1) / { P(T=1 | L=1) * P(L=1) + P(T=1 | L=0) * P(L=0) }
P(L=0 | T=1) = P(T=1 | L=0) * P(L=0) / { P(T=1 | L=1) * P(L=1) + P(T=1 | L=0) * P(L=0) }

ではintervene条件で、T=1にセットしたときにF=1である確率を計算してみる。これはつまり重りでも持たせて体重計の目方を因果モデルとはべつのところから操作したときの血中コレステロール量が高い確率だ。

P(F=1 | do(T=1))
= P(F=1 | L=1) * P(L=1 |do(T=1)) + P(F=1 | L=0) * P(L=0 |do(T=1))
= P(F=1 | L=1) * P(L=1) + P(F=1 | L=0) * P(L=0)
= 0.4 * 0.5 + 0.1 * 0.5
= 0.25

と計算できる。さっきのobservation条件での0.37よりも小さい値になっている、つまり、介入によって、P(F=1)の確率は変わった、つまりわれわれは介入によってFの推定を変えているし、そのことが介入がFを因果的に変えたことを認知している証拠となる。

[ラットの実験に当てはめてみる]

さて、このモデルをラットの実験に当てはめてみよう。じつは実験をデザインする際に、重要な前提条件がある。このようなcommon-causeのベイズネットでモデルするためには、P(T)とP(F)が独立でなくてはいけない。つまり、P(T, F) = P(T) * P(F) でないといけない。(これを違反すると、因果の矢がループしてしまう -- と思ったけど、その場合にはニセの因果を分離できるようなだがどうなんだ?)

一方で、Science 2006、JEPG 2008、IJCP 2009 のすべての実験条件において、L->TとL->Fとは常にべつべつの時間に起こるイベントだったため、独立性の条件を満たしていない。詳しいことは次回説明します。

今回は説明のために、この因果モデルが当てはまるような実験デザインだったとして、Science 2006のような結果が得られたらどのように説明できるか、について書きます。独立性の条件を満たそうとすると、トレーニングは L->TF、つまりライト点灯の後でトーンと砂糖水とが両方同時に提示される条件となります。つまり、

P(F=1 | L=1) = 1
P(T=1 | L=1) = 1
P(F=1, T=1 | L=1) = P(F=1 | L=1) * P(T=1 | L=1) = 1 

ということ。

causal_reasoning6b.png

肥満の話との違いは完全に決定論的になっているということ。よって計算はもっとシンプルになる。これでCommon-causeでのobservation条件を計算すると、

P(F=1 | T=1)
= P(F=1 | L=1) * P(L=1 | T=1) + P(F=1 | L=0) * P(L=0 | T=1)
= 1 * 1 + 0 * 0
= 1

Intervene条件を計算すると、

P(F=1 | do(T=1))
= P(F=1 | L=1) * P(L=1 | do(T=1)) + P(F=1 | L=0) * P(L=0 | do(T=1))
= P(F=1 | L=1) * P(L=1) + P(F=1 | L=0) * P(L=0)
= 1 * p + 0 * (1-p)
= p < 1

となる。( P(L=x | do(T=1)) = P(L=x) より。あと、pはテスト期間全体のうちライトの付いている確率なので、1よりも小さい。)

よって、砂糖水が出ている確率を低いものと推測するのでnose poke(CR)が減る、というふうに説明できる。

ではchain-causeのときはどうなるか。まず、chain-causeのときの一般的な関係は、

P(L, T,  F) = P(F | L) * P(L | T) * P(T)

Chain-causeでのObservation条件, intervene条件はそれぞれ

P(L, T=1, F) = P(F | L) * P(L | T=1) * P(T=1)
P(L, do(T=1), F) 
= P(F | L) * P(L | do(T=1)) * P(do(T=1))
= P(F | L) * P(L | T=1)

となる。( P(do(T=1))=1 および P(L | do(T=1)) = P(L | T=1) より。)

Chain-ObservationでF=1(砂糖水が出ているとき)を推測すると、

P(F=1 | T=1)
= P(F=1 | L=1) * P(L=1 | T=1) + P(F=1 | L=0) * P(L=0 | T=1)
= 1 * 1 + 0 * 0
= 1

となる。Chain-InterveneでF=1(砂糖水が出ているとき)を推測すると、

P(F=1 | do(T=1))
= P(F=1 | L=1) * P(L=1 | T=1)  + P(F=1 | L=0) * P(L=0 | T=1)
= 1 * 1 + 0 * 0
= 1

つまり、observation条件とintervene条件とは等しくなる。というわけで実験データを再現できた!

しかしこれは仮想的な実験デザインでの話でした。実際のラットの実験の話については次回。次が最終回。

[参考文献]


2012年09月06日

生理研研究会 予習シリーズ:ラットの因果推論と連合学習理論(3)

さて、予習シリーズ前回の続きです。

(9/8追記:第一回から最終回までつなげたPDFを作りました。ご利用ください:pdf (11MB))

前回の連合学習理論とはどういうものか、というまとめを踏まえて、もう一度Science 2006について今度は実験手順を詳しく追いながら深掘りします。

[Science 2006 exp 1]

まず実験1ですが、前回使ったテーブルの形式でまとめます:

グループ トレーニング テスト 結果
Intervene-Common L->F
L->T
NF
P->T CR low
Observe-Common T CR high
Intervene-Direct P->N CR medium
Observe-Direct N CR medium

前々回のラットの実験の説明を思い出しながら読んでみてください。メインの比較は上の2行です。

トレーニングでcommon-causeのモデルを教え込むために、すべてのグループで、ライト点灯(L)したあとでトーンが鳴る(T)、ライト点灯(L)したあとで砂糖水が出る(F)の二つを混ぜて提示します。テストのときに、いちばん上のグループ(Intervene-Common)では、ラットがレバープレス(P)をするとトーンが鳴る(T)ようになっています。

レバーはテストの前までは隠してある。なんでラットが自発的にレバー押すかはよく分からんが、とにかくあらかじめ強化しているわけではない。

上から2番目のグループ(Observe-Common)では、ラットはトーン(T)を聞くだけ。隣の実験箱にIntervene-Commonグループのラットがいて、そいつがレバーを引いた時にトーンが鳴るようにしてあるので、トーンの鳴る回数は揃ってる。

その結果、鼻を砂糖水の出るノズルに突っ込む回数(CR)はObserve-Commonの方が多かった、というわけです。でもって、これは連合学習理論からは説明できない。なぜなら、トレーニング時の条件はまったく同じだから、Tの連合強度は二つのグループで同じになる。

二つのグループの違いはテスト時に自分でレバーを引くかどうかの違いだけだから、レバーを引くことによって、学習したことをどのように利用するかが変わる、ここまでは確実に言える。

(認知的理論としてベイズネットで考える時を正しく反映した実験になっているか、これについては次回。今回はあくまで連合学習理論からは説明できない、というところを押さえる。)

この結果を批判的な目で見てまずすぐに思いつくのは、「レバー引くのが忙しくて鼻突っ込むの忘れてるんじゃない?」「レバーに注意が向いた結果鼻突っ込む回数が減ったんじゃん?」というものだ。このような問題は、下の2列のコントロール群(Direct-cause)の結果から排除できる。

じつはトレーニング時にはすべてのグループで、もう一つの条件としてDirect-cause (NF)の条件を与えてある。これはノイズ(N)が出るのと同時に砂糖水(F)が出るというもの。これによってふつうに古典的条件付けが起きる。

Direct-cause群の二つでは、テスト時にはTの代わりにNを使う。もし上記の「忙しい説」「注意説」が正しければこの二つの間でも差が出るはずだ。だがそうではなかった。よって上記の説は排除できる。

また、この結果はラットがNとTをちゃんとべつものとして捉えていることも示している。(=ラットが刺激TとNを般化してない。)

[Science 2006 exp 2a]

もう一つの実験では、前々回説明したCommon-causeとchain-causeの二つを比較して、chain-causeでのみこの現象(レバー押させるとCR減少)が起こることを示している。

グループ トレーニング1 トレーニング2 テスト 結果
Intervene-Common L->T L->F P->T CR low
Observe-Common T CR high
Intervene-Chain T->L P->T CR medium
Observe-Chain T CR medium

上の二つのグループ(Common-cause群)はさっきのexp1と同じ。下の二つのグループではトレーニング1での順番がひっくり返っている。つまり、L->TだったのがT->Lへ。あとは全部同じ。よって、連合強度的に考えれば、Tの出てくる回数は同じなので、CommonとChainとで差はない。

だが、Chain-cause群では、レバーを押すかどうかによるCRの違いはなかった。Chain-cause群のふたつだけを説明するなら連合学習理論で足りる(Tの連合強度は二つの条件で同じ)けれども、それではCommon-cause群の差が説明できない。

[JEPG 2008 exp1]

上記実験でもうひとつ押さえておきたいのは、本当にテスト試行でレバーを自分で押したことが重要なのかということだ。そこでScience 2006 exp 2aの条件に加えて、exogenous cue条件というのを加えた。

グループ トレーニング1 トレーニング2 テスト 結果
Intervene L->T L->F P->T CR low
Observe T CR high
Exogenous cue C->T CR high

この条件では、レバー(P)の代わりにそれまで出したことのない刺激C(クリック音)を出して、そのあとにT(トーン)が出てくる。結果はobserve条件と同じくらいのCRだった。Intervene群での「自分でレバーを動かした結果として」トーンが鳴ったことこそがCRの差を生み出すらしい。つまり、exogenous cue条件では、クリック音(C)はラットが自分で出したわけではないので、そのあとでトーン(T)が出た理由としてこれまでのcommon-causeモデルを捨てる必要はない、ということらしい。

(テスト試行を繰り返していると、あらたな因果モデルC->Tができて、common-causeモデルによるL->Tを破棄しそうな気はするが。)

[IJCP 2009 exp1,2]

ラットの行動を(擬人化して)説明するために、前々回こんな書き方をした:

もしラットがcommon cause因果モデルを理解しているなら、「トーン(純音)が鳴る」ときには(ライトが点灯するかどうかは見えないのだけれども、)「砂糖水が出る」と推論して砂糖水の出るところに鼻をつっこむだろう。

でもこれはいま考えると正確でない。Science 2006の実験では、exp1のメソッド部分を読む限り、テスト時にはライト(電球)を外していない。ということはラットは「ライトが点灯するかどうかは見えないのだけれども、トーンと砂糖水とは時間的に同時に出るもんだ」と推測したのではなくて、「ライト付いてないけど、トーンと砂糖水とは時間的に同時に出るもんだ」と推測して行動していることになる。そりゃ本当か?

Science 2006のメソッド部分をよくよく読んでみると、exp2a,2bではライト(電球)を外している。そこには、ライトを外しておかないとchain-cause条件でTに反応しなくなるから(つまりchain-causeでnose pokeの回数が低くなる)、と説明がある。これをこのIJCP 2009論文で検討している。

グループ トレーニング1 トレーニング2 テスト ライト 結果
Paired-Absent T->L
T->N
L->F T Absent CR high
Unpaired-Absent N CR low
Paired-Present T Present CR medium
Unpaired-Present N CR medium

実験ではchain-causeしかやってない。知りたいのはcommon-causeの方なのだけれども。

メインの実験はテーブルのいちばん上で(Paired-Absent)、T(トーン)->L(ライト)とL(ライト)->F(砂糖水)をトレーニングでやってから、テストでTを提示してnose pokeの回数(CR)を数える。これはScience 2006のexp2aでのchain-causeでobserve条件に相当する。ラットはcausal-chainを理解しているので、Tの提示によってFを予期するのでCRが高い、と説明できる。

2番目のグループ(Unpaired-Absent)ではF(砂糖水)と連合させていないN(ノイズ)をテストで出す。これと比べていちばん上の条件(Paired-Absent)のCRが高いので、causal chainを推測した証拠となる。

この二つのグループをまんま同じで、ライトの条件だけ変えた(電球を外さずに、点灯しないままになっている)のがPresent条件。このときにはテストでTを出しても、CRはNを出した時と変わらない。つまり、T->L->Fというchainが切れたとラットが推測したらしい行動をしている。

そういうわけで、ラットは「ライトがあるけど点灯していない」ことと「ライトが取り外されて情報がない」こととを区別しているという証拠が得られた。いまの文脈ではこれはchain-causeをちゃんと理解していることの押さえとなる。

でも、もう一度書くけど、実験ではchain-causeしかやってない。知りたいのはcommon-causeの方だ。Science 2006ではExp1とexp2とではいくつか条件が違っているが、exp2のほうがobserve-interveneの差が大きい。電球外した効果もあるかもしれない。

IJCP 2009のイントロではcommon-causeについて言及している文があって、common-causeではライトの不在を思い出さなければならないけれども、chain-causeではライトの不在をperceiveしている。後者の方がライトの不在がより明瞭だろう、というのだけれども、ちとよく分からん。どっちでも思い出さないといけないと思うのだけれども。ディカッションは読んでないので、このへん掘り下げてあるのかもしれない。

[まとめ]

実験手順を詳細に追って批判的に論理の道筋を追ってみたが、ラットが連合学習理論をそのまま適用しただけでは説明できないような行動をしていることは確かなようだ。

Science 2006論文のロジックとしては、帰無仮説としての連合学習理論を棄却して、causal bayes netという認知的理論を採用する、という形式になっている。ではこの結果はcausal bayes netの理論と合致しているのだろうか? これが次回のメイントピックとなる。


2012年09月05日

生理研研究会 予習シリーズ:ラットの因果推論と連合学習理論(2)

さて、予習シリーズ前回の続きです。連合学習理論とはどういうものか説明しようというわけですが、網羅的にやるのは無理なんで、ここではいまの文脈に沿って「連合学習では因果推論をどのように説明するか」という感じでコンパクトにまとめるという方針で。

(9/8追記:第一回から最終回までつなげたPDFを作りました。ご利用ください:pdf (11MB))

[古典的条件づけ]

まず超基本のパブロフの古典的条件づけ(レスポンデント条件づけ)ですが、イヌをベルを鳴らすとえさが出るようにトレーニングしたら、ベルを鳴らすだけで唾液が出るようになった、という話でした。

これをテーブルで表現するとこうなる:

グループ トレーニング テスト 結果
テスト群 B->F B CR high
コントロール群 B
F
CR low

(なお、実験デザインを日常言語で説明するとややこしいので、こういう表記に慣れておくと便利。連合学習の世界はこのへんがよく形式化されていて美しい。)

ベル(B)を提示してから餌(F)がでるのを矢印で表現。唾液の分泌量(CR=conditioned response)の大小でBが条件づけられたことを示すことができる。

この現象はむりやり認知的に説明しようとするならば、「ベルによって餌が出ると推論したことによって唾液が出た」と言えなくもない。でも、連合学習理論では「ベルBと餌Fとが時間的接近によって連合した」で説明が付くので、オッカムの剃刀もしくはモーガンの公準によって、認知的説明は排除される。(S-SかS-Rかの議論は省略。)

(なお、これは認知的メカニズムをまったく使っていないという証明ではない。じっさい、ヒトでの実験では、トレーニング試行と同じ内容を口頭でインストラクションするだけでCRが出るようになるって話がある(Cook and Harris 1937など)。)

コントロールどんな感じがいいかと考えてみたが、教科書には載ってなかった。自分で考えるとしたら、刺激は提示されているが、カップルしていないという状況か。ということで、BとFとが独立して出ている条件というのをコントロールに入れておいた。オリジナルの実験がどうかは知らないが、いまやるならこれが最適のはず。

[ブロッキング]

時間的接近だけで連合学習の強度が決まるわけではないということが「ブロッキング」という条件から分かる。

グループ トレーニング1 トレーニング2 テスト 結果
テスト群 L->F LT->F T CR low
コントロール群 - CR high

たとえばラットで、コントロール群ではトレーニング2でL(ライトの点灯)とT(トーンが鳴る)を同時に提示したあとに砂糖水(F)が出る。テスト試行でTを出すと砂糖水のバルブに頭を突っ込む行動(CR)が見られる。テスト群ではそれに加えてトレーニング1でL(ライトの点灯)に提示したあとに砂糖水(F)が出る。そうするとTへの反応(CR)が減る。

たとえ話としては、エビと枝豆を食べて腹を下した人はエビを食わなくなる。でももしそのまえに枝豆を食べて腹を下した経験がある場合はエビはふつうに食うだろう、ということ。これは必ずしも合理的判断ではないことに注意。

この現象のポイントは、テストしているTはトレーニングの段階ではテスト群もグループ群もトレーニング2でしか提示していないのだから、「時間的接近」だけでは説明できないということ。

これを説明するためにRWモデルというのが考えられた。式は出さない。ポイントは、連合学習の強度が予測誤差によって更新されるということ。

ブロッキングでは、トレーニング1のときにLに対する連合学習が進んで、LはFを予測するようになる(=予測誤差が0に近くなる)。このあとでトレーニング2でLTを提示しても、LはもうFを予測するようになっているので、LTによってはもう連合学習の強度は変化しない。このようにRWモデルによって説明できる。

ブロッキングは古典的条件づけよりも高次な現象だが、それでも連合学習期論によって十分説明できるため、認知的な過程を要請しない。「予測誤差」を持つためには「予測」が必要だが、これは「現在の連合強度」そのものなので、それを現在の状態とを比較することさえできればよい。

[逆行ブロッキング]

トレーニング1とトレーニング2とをひっくり返しただけの「逆行ブロッキング」という条件を作ることができる。ヒトの場合にはブロッキングと同様な効果が見られる。

グループ トレーニング1 トレーニング2 テスト 結果
テスト群 LT->F L->F T CR low
コントロール群 - CR high

しかしこの現象はRWモデルでは説明できない。なぜなら、トレーニング2ではLが提示されているだけなので、Tについての予測誤差が変わるわけではないから。

これを説明するためにコンパレーター仮説では、RWモデル(とその仲間)のようにテストの結果がトレーニング時の連合強度の変化によって決まるのではなくて、テスト時にそれを読み出す時にいまテストされているTの強度だけではなくて以前提示されたLの強度と比較する過程がある、として説明する。このアイデアはベイズ決定に通じるものがあり、かなり「認知」寄りのモデルであると思う。

RWモデル自体もトレーニング2では、Tが出ていないということが連合強度を下げる、というふうにモデルを改変することによってこ逆行ブロッキングの結果を説明できる(Van Hamme and Wasserman (1994))。このような改変は刺激のある(=1)なし(=0)としたときのpriorを0.5として置くような操作なので、これも一段階「認知」寄りになっていると考えられる。

(このような現象はretrospective reavulationという範疇に入るのだけれども、ratでこれをテーブルにあるような形式のまんま誘導しようとすると難しいらしい。Miller and Mature 1996みたいにsensory preconditioningとか入れる必要がある。このへん重要そうだが今回の話ではスキップ。)

[まとめ]

そんなこんなで、連合学習理論はその根本の「連合強度の更新」というアイデアを保存しながら、より複雑な現象を説明するためにどんどん理論を拡張している。このため、連合学習理論と認知的理論との境界はかなり曖昧になっているように私には思える。

今回読んでいるScience 2006では「連合学習理論では説明できないような現象を見つけたから、これは認知的な過程(因果推論)である」という論法を使っている。(帰無仮説としての連合学習理論。) だから当然、今回見た流れのように、「それ連合学習理論で説明できるよ、ただし理論を拡張すればだけど」ということは起こるのではないかと思う。

これはきっと、澤(2012)にあった、

次のような反論も人口に膾炙している。すなわち,「たった一つの“高次機能”を仮定することと,“百通りの連合経路”を仮定することはどちらが節約的で単純な説明であろうか?」という反論である。

という問題意識に繋がるだろう。

[参考文献]


2012年09月03日

生理研研究会 予習シリーズ:ラットの因果推論と連合学習理論(1)

生理研研究会「認知神経科学の先端 推論の脳内メカニズム」参加登録受付中です。

若手運営手伝い(旅費援助付き)のほうは締め切りを過ぎましたので受け付けを終了しました。合計でちょうど10名となりましたので、抽選は行わず、申し込みいただいた方全員採用となりました。お申し込みありがとうございました。


さて、生理研研究会 予習シリーズ、前回の続きです。講演者の澤 幸祐さんの仕事の紹介を兼ねながら、動物で「因果推論」の証拠を得るためにはどのような手続きが必要か、連合学習理論とはどういうものか、といったことをまとめておきたいと思います。

(9/8追記:第一回から最終回までつなげたPDFを作りました。ご利用ください:pdf (11MB))

今回メインで読むのは澤さんがUCLAに居られた時の仕事のうちのひとつで、「ラットが因果推論をする」というものです。

さらに補足的にこの論文の続編的な二つの論文にも言及します。


Science 2006では「ラットが因果推論をする」ということを見つけました。「因果推論をする」ってことを証明するにはどうすればよいか。この論文のNews and ViewsをClayton and Dickinsonが書いてますので、そこにある例を引いてみます。

  • Clayton N, Dickinson A. (2006) Rational rats. Nat Neurosci.9(4):472-4.

つまり、「あなたは裏庭に洗濯物を干しました。居間に戻ってきてしばらくしたところで、表門側の窓に水滴が付いていることに気付きました。あなたは雨が降り始めたなと推測して、あわてて洗濯物を取り込みに行きます。

いっぽうで、もしあなたが洗濯物を干した後で、表門側の庭の芝生でスプリンクラーのスイッチを入れていたとしたら、表門側の窓に付いた水滴はスプリンクラーによるものだと判断するので、洗濯物を取り込みに行こうとは思わないでしょう。」

このたとえ話の前半部分の行動は以下のような因果モデルに基づいています。

  • 「雨が降る」->「表門の窓に水滴が付く」
  • 「雨が降る」->「洗濯物が濡れる」(->「洗濯物を取り込む」という行動を引き起こす)

さらに後者では

  • (自分が)「スプリンクラーを起動した」->「表門の窓に水滴が付く」

という知識を元にして、「表門の窓に水滴が付く」を説明する因果モデルとして

  • 「雨が降る」->「表門の窓に水滴が付く」
  • (自分が)「スプリンクラーを起動した」->「表門の窓に水滴が付く」

のうち後者を選択した、つまり「表門の窓に水滴が付く」からその原因を推測したわけです。

というわけで、スプリンクラーを起動したかどうかの違いで洗濯物を取り込むかどうか行動が変わることが「因果推論」をしたことの証拠となるわけです。

causal_reasoning1.png

確率表現にするならば、これはベイズネットで表現できて、洗濯物を取り込みに行くかどうかは以下の確率に基づいて行動選択することになるでしょう。

  • P(洗濯物が濡れる|表門の窓に水滴あり, スプリンクラー起動してない)
  • P(洗濯物が濡れる|表門の窓に水滴あり, スプリンクラー起動した)

いったん脇道にそれますが、ポイントとしては、人は今示したようなcommon causeの因果モデルから因果の向きをひとつ逆向きにしたchain modelの因果モデルとを混同しません。

Common cause

  • 「雨が降る」->「表門の窓に水滴が付く」
  • 「雨が降る」->「洗濯物が濡れる」(->「洗濯物を取り込む」という行動を引き起こす)

Chain cause

  • 「表門の窓に水滴が付く」->「雨が降る」
  • 「雨が降る」->「洗濯物が濡れる」(->「洗濯物を取り込む」という行動を引き起こす)
causal_reasoning2.png

もしchain causeを信じていたら、スプリンクラーを起動するたびに洗濯物を取りに行くことになります。これは不合理。

  • 「スプリンクラー起動する」-> 「表門の窓に水滴が付く」->「雨が降る」->「洗濯物が濡れる」

不合理だけど、そんな論理的誤謬のケースを考えてみた。

  • 「夏休みが終わる」->「カレンダーが9/3になる」
  • 「夏休みが終わる」->「宿題提出の期限が来る」

こういうcommon causeの因果モデルを我々は理解しているのだけれども、宿題提出の期限が来ないようにカレンダーの日付を一日戻す。

  • 「カレンダーが9/3ではない」->「宿題提出の期限が来ない」

これは誤ってchain causeに基づいたという論理的誤謬なのだけど、その気持ちわかるなー。

もうひとつの例として「カーゴカルト」で当てはめてみた。(なお、これじたいの信憑性などについてはwikipediaへ。)

  • 「アメリカ人がやってくる」->「飛行機がやってくる」
  • 「アメリカ人がやってくる」->「食べ物が投下される」

こういうcommon causeの因果モデルがあるはずなのに、chain modelと誤解して、

  • 「飛行機や軍服のパチものを作る」->「食べ物が投下される」

と理解できるわけ。こうしてみるとじつのところどのくらい非合理化だと言えるだろう?


話を戻すと、これと同等のものをラット用にデザインしてやれば、因果推測のテストとなるわけです。そこでScience 2006で使ったのは以下の条件です。

causal_reasoning3.png

  • 「ライトが点灯する」->「砂糖水が出る」
  • 「ライトが点灯する」->「トーン(純音)が鳴る」

こういうcommon cause因果モデルを学習させる。テスト段階では、

  • 「トーン(純音)が鳴る」

もしラットがcommon cause因果モデルを理解しているなら、「トーン(純音)が鳴る」ときには(ライトが点灯するかどうかは見えないのだけれども、)「砂糖水が出る」と推論して砂糖水の出るところに鼻をつっこむだろう。実際そうだった。

(なお、テスト条件では砂糖水は出ない。もし砂糖水が出てしまうとそれだけで強化されてしまうので、そのまえに学習したことのテストにならない。これはこの種の実験での基本的な手続き。)

テスト段階にはもう一つの条件があって、レバーを押したときだけトーン(純音)が鳴る。

  • 「レバーを押す」->「トーン(純音)が鳴る」

ではこの条件のときにラットは砂糖水の出るところに鼻をつっこむかというと、さっきの条件よりも減った。

これはどういうことかというと、洗濯物の話のときと同じ。「トーン(純音)が鳴る」を説明する因果モデルとして

  • 「ライトが点灯する」->「トーン(純音)が鳴る」
  • 「レバーを押す」->「トーン(純音)が鳴る」

のうち後者を選択した。ゆえに前者を選択した場合に起こる鼻をつっこむ行動が減った。つまり「トーン(純音)が鳴る」からその原因を推測したわけです。

というわけで、レバーを押したかどうかの違いで鼻をつっこむ回数が変わることが「因果推論」をしたことの証拠となるわけです。なるほどね!


でも思うに、どうしてこんなに複雑な条件を使わないと「因果推論」を証明することが出来ないんだろう? われわれはもっとシンプルな条件でも因果推論をしていると思うのだけれども。

なんでかというと、もっとシンプルな条件のものは連合学習理論で充分説明できるからです。連合学習理論ではこれまでに説明したような「因果モデルを元に推論する」というような認知的なプロセスを仮定する必要がありません。

では連合学習理論とはどういうものか、これについては次回まとめてみます。


お勧めエントリ

  • 細胞外電極はなにを見ているか(1) 20080727 (2) リニューアル版 20081107
  • 総説 長期記憶の脳内メカニズム 20100909
  • 駒場講義2013 「意識の科学的研究 - 盲視を起点に」20130626
  • 駒場講義2012レジメ 意識と注意の脳内メカニズム(1) 注意 20121010 (2) 意識 20121011
  • 視覚、注意、言語で3*2の背側、腹側経路説 20140119
  • 脳科学辞典の項目書いた 「盲視」 20130407
  • 脳科学辞典の項目書いた 「気づき」 20130228
  • 脳科学辞典の項目書いた 「サリエンシー」 20121224
  • 脳科学辞典の項目書いた 「マイクロサッケード」 20121227
  • 盲視でおこる「なにかあるかんじ」 20110126
  • DKL色空間についてまとめ 20090113
  • 科学基礎論学会 秋の研究例会 ワークショップ「意識の神経科学と神経現象学」レジメ 20131102
  • ギャラガー&ザハヴィ『現象学的な心』合評会レジメ 20130628
  • Marrのrepresentationとprocessをベイトソン流に解釈する (1) 20100317 (2) 20100317
  • 半側空間無視と同名半盲とは区別できるか?(1) 20080220 (2) 半側空間無視の原因部位は? 20080221
  • MarrのVisionの最初と最後だけを読む 20071213

月別過去ログ


« 2012年08月 | 最新のページに戻る | 2012年10月 »