« 生理研研究会 予習シリーズ:ラットの因果推論と連合学習理論(2) | 最新のページに戻る | 生理研研究会 予習シリーズ:ラットの因果推論と連合学習理論(4) »

■ 生理研研究会 予習シリーズ:ラットの因果推論と連合学習理論(3)

さて、予習シリーズ前回の続きです。

(9/8追記:第一回から最終回までつなげたPDFを作りました。ご利用ください:pdf (11MB))

前回の連合学習理論とはどういうものか、というまとめを踏まえて、もう一度Science 2006について今度は実験手順を詳しく追いながら深掘りします。

[Science 2006 exp 1]

まず実験1ですが、前回使ったテーブルの形式でまとめます:

グループ トレーニング テスト 結果
Intervene-Common L->F
L->T
NF
P->T CR low
Observe-Common T CR high
Intervene-Direct P->N CR medium
Observe-Direct N CR medium

前々回のラットの実験の説明を思い出しながら読んでみてください。メインの比較は上の2行です。

トレーニングでcommon-causeのモデルを教え込むために、すべてのグループで、ライト点灯(L)したあとでトーンが鳴る(T)、ライト点灯(L)したあとで砂糖水が出る(F)の二つを混ぜて提示します。テストのときに、いちばん上のグループ(Intervene-Common)では、ラットがレバープレス(P)をするとトーンが鳴る(T)ようになっています。

レバーはテストの前までは隠してある。なんでラットが自発的にレバー押すかはよく分からんが、とにかくあらかじめ強化しているわけではない。

上から2番目のグループ(Observe-Common)では、ラットはトーン(T)を聞くだけ。隣の実験箱にIntervene-Commonグループのラットがいて、そいつがレバーを引いた時にトーンが鳴るようにしてあるので、トーンの鳴る回数は揃ってる。

その結果、鼻を砂糖水の出るノズルに突っ込む回数(CR)はObserve-Commonの方が多かった、というわけです。でもって、これは連合学習理論からは説明できない。なぜなら、トレーニング時の条件はまったく同じだから、Tの連合強度は二つのグループで同じになる。

二つのグループの違いはテスト時に自分でレバーを引くかどうかの違いだけだから、レバーを引くことによって、学習したことをどのように利用するかが変わる、ここまでは確実に言える。

(認知的理論としてベイズネットで考える時を正しく反映した実験になっているか、これについては次回。今回はあくまで連合学習理論からは説明できない、というところを押さえる。)

この結果を批判的な目で見てまずすぐに思いつくのは、「レバー引くのが忙しくて鼻突っ込むの忘れてるんじゃない?」「レバーに注意が向いた結果鼻突っ込む回数が減ったんじゃん?」というものだ。このような問題は、下の2列のコントロール群(Direct-cause)の結果から排除できる。

じつはトレーニング時にはすべてのグループで、もう一つの条件としてDirect-cause (NF)の条件を与えてある。これはノイズ(N)が出るのと同時に砂糖水(F)が出るというもの。これによってふつうに古典的条件付けが起きる。

Direct-cause群の二つでは、テスト時にはTの代わりにNを使う。もし上記の「忙しい説」「注意説」が正しければこの二つの間でも差が出るはずだ。だがそうではなかった。よって上記の説は排除できる。

また、この結果はラットがNとTをちゃんとべつものとして捉えていることも示している。(=ラットが刺激TとNを般化してない。)

[Science 2006 exp 2a]

もう一つの実験では、前々回説明したCommon-causeとchain-causeの二つを比較して、chain-causeでのみこの現象(レバー押させるとCR減少)が起こることを示している。

グループ トレーニング1 トレーニング2 テスト 結果
Intervene-Common L->T L->F P->T CR low
Observe-Common T CR high
Intervene-Chain T->L P->T CR medium
Observe-Chain T CR medium

上の二つのグループ(Common-cause群)はさっきのexp1と同じ。下の二つのグループではトレーニング1での順番がひっくり返っている。つまり、L->TだったのがT->Lへ。あとは全部同じ。よって、連合強度的に考えれば、Tの出てくる回数は同じなので、CommonとChainとで差はない。

だが、Chain-cause群では、レバーを押すかどうかによるCRの違いはなかった。Chain-cause群のふたつだけを説明するなら連合学習理論で足りる(Tの連合強度は二つの条件で同じ)けれども、それではCommon-cause群の差が説明できない。

[JEPG 2008 exp1]

上記実験でもうひとつ押さえておきたいのは、本当にテスト試行でレバーを自分で押したことが重要なのかということだ。そこでScience 2006 exp 2aの条件に加えて、exogenous cue条件というのを加えた。

グループ トレーニング1 トレーニング2 テスト 結果
Intervene L->T L->F P->T CR low
Observe T CR high
Exogenous cue C->T CR high

この条件では、レバー(P)の代わりにそれまで出したことのない刺激C(クリック音)を出して、そのあとにT(トーン)が出てくる。結果はobserve条件と同じくらいのCRだった。Intervene群での「自分でレバーを動かした結果として」トーンが鳴ったことこそがCRの差を生み出すらしい。つまり、exogenous cue条件では、クリック音(C)はラットが自分で出したわけではないので、そのあとでトーン(T)が出た理由としてこれまでのcommon-causeモデルを捨てる必要はない、ということらしい。

(テスト試行を繰り返していると、あらたな因果モデルC->Tができて、common-causeモデルによるL->Tを破棄しそうな気はするが。)

[IJCP 2009 exp1,2]

ラットの行動を(擬人化して)説明するために、前々回こんな書き方をした:

もしラットがcommon cause因果モデルを理解しているなら、「トーン(純音)が鳴る」ときには(ライトが点灯するかどうかは見えないのだけれども、)「砂糖水が出る」と推論して砂糖水の出るところに鼻をつっこむだろう。

でもこれはいま考えると正確でない。Science 2006の実験では、exp1のメソッド部分を読む限り、テスト時にはライト(電球)を外していない。ということはラットは「ライトが点灯するかどうかは見えないのだけれども、トーンと砂糖水とは時間的に同時に出るもんだ」と推測したのではなくて、「ライト付いてないけど、トーンと砂糖水とは時間的に同時に出るもんだ」と推測して行動していることになる。そりゃ本当か?

Science 2006のメソッド部分をよくよく読んでみると、exp2a,2bではライト(電球)を外している。そこには、ライトを外しておかないとchain-cause条件でTに反応しなくなるから(つまりchain-causeでnose pokeの回数が低くなる)、と説明がある。これをこのIJCP 2009論文で検討している。

グループ トレーニング1 トレーニング2 テスト ライト 結果
Paired-Absent T->L
T->N
L->F T Absent CR high
Unpaired-Absent N CR low
Paired-Present T Present CR medium
Unpaired-Present N CR medium

実験ではchain-causeしかやってない。知りたいのはcommon-causeの方なのだけれども。

メインの実験はテーブルのいちばん上で(Paired-Absent)、T(トーン)->L(ライト)とL(ライト)->F(砂糖水)をトレーニングでやってから、テストでTを提示してnose pokeの回数(CR)を数える。これはScience 2006のexp2aでのchain-causeでobserve条件に相当する。ラットはcausal-chainを理解しているので、Tの提示によってFを予期するのでCRが高い、と説明できる。

2番目のグループ(Unpaired-Absent)ではF(砂糖水)と連合させていないN(ノイズ)をテストで出す。これと比べていちばん上の条件(Paired-Absent)のCRが高いので、causal chainを推測した証拠となる。

この二つのグループをまんま同じで、ライトの条件だけ変えた(電球を外さずに、点灯しないままになっている)のがPresent条件。このときにはテストでTを出しても、CRはNを出した時と変わらない。つまり、T->L->Fというchainが切れたとラットが推測したらしい行動をしている。

そういうわけで、ラットは「ライトがあるけど点灯していない」ことと「ライトが取り外されて情報がない」こととを区別しているという証拠が得られた。いまの文脈ではこれはchain-causeをちゃんと理解していることの押さえとなる。

でも、もう一度書くけど、実験ではchain-causeしかやってない。知りたいのはcommon-causeの方だ。Science 2006ではExp1とexp2とではいくつか条件が違っているが、exp2のほうがobserve-interveneの差が大きい。電球外した効果もあるかもしれない。

IJCP 2009のイントロではcommon-causeについて言及している文があって、common-causeではライトの不在を思い出さなければならないけれども、chain-causeではライトの不在をperceiveしている。後者の方がライトの不在がより明瞭だろう、というのだけれども、ちとよく分からん。どっちでも思い出さないといけないと思うのだけれども。ディカッションは読んでないので、このへん掘り下げてあるのかもしれない。

[まとめ]

実験手順を詳細に追って批判的に論理の道筋を追ってみたが、ラットが連合学習理論をそのまま適用しただけでは説明できないような行動をしていることは確かなようだ。

Science 2006論文のロジックとしては、帰無仮説としての連合学習理論を棄却して、causal bayes netという認知的理論を採用する、という形式になっている。ではこの結果はcausal bayes netの理論と合致しているのだろうか? これが次回のメイントピックとなる。


お勧めエントリ


月別過去ログ