« 生理研研究会 予習シリーズ:ラットの因果推論と連合学習理論(1) | 最新のページに戻る | 生理研研究会 予習シリーズ:ラットの因果推論と連合学習理論(3) »

■ 生理研研究会 予習シリーズ:ラットの因果推論と連合学習理論(2)

さて、予習シリーズ前回の続きです。連合学習理論とはどういうものか説明しようというわけですが、網羅的にやるのは無理なんで、ここではいまの文脈に沿って「連合学習では因果推論をどのように説明するか」という感じでコンパクトにまとめるという方針で。

(9/8追記:第一回から最終回までつなげたPDFを作りました。ご利用ください:pdf (11MB))

[古典的条件づけ]

まず超基本のパブロフの古典的条件づけ(レスポンデント条件づけ)ですが、イヌをベルを鳴らすとえさが出るようにトレーニングしたら、ベルを鳴らすだけで唾液が出るようになった、という話でした。

これをテーブルで表現するとこうなる:

グループ トレーニング テスト 結果
テスト群 B->F B CR high
コントロール群 B
F
CR low

(なお、実験デザインを日常言語で説明するとややこしいので、こういう表記に慣れておくと便利。連合学習の世界はこのへんがよく形式化されていて美しい。)

ベル(B)を提示してから餌(F)がでるのを矢印で表現。唾液の分泌量(CR=conditioned response)の大小でBが条件づけられたことを示すことができる。

この現象はむりやり認知的に説明しようとするならば、「ベルによって餌が出ると推論したことによって唾液が出た」と言えなくもない。でも、連合学習理論では「ベルBと餌Fとが時間的接近によって連合した」で説明が付くので、オッカムの剃刀もしくはモーガンの公準によって、認知的説明は排除される。(S-SかS-Rかの議論は省略。)

(なお、これは認知的メカニズムをまったく使っていないという証明ではない。じっさい、ヒトでの実験では、トレーニング試行と同じ内容を口頭でインストラクションするだけでCRが出るようになるって話がある(Cook and Harris 1937など)。)

コントロールどんな感じがいいかと考えてみたが、教科書には載ってなかった。自分で考えるとしたら、刺激は提示されているが、カップルしていないという状況か。ということで、BとFとが独立して出ている条件というのをコントロールに入れておいた。オリジナルの実験がどうかは知らないが、いまやるならこれが最適のはず。

[ブロッキング]

時間的接近だけで連合学習の強度が決まるわけではないということが「ブロッキング」という条件から分かる。

グループ トレーニング1 トレーニング2 テスト 結果
テスト群 L->F LT->F T CR low
コントロール群 - CR high

たとえばラットで、コントロール群ではトレーニング2でL(ライトの点灯)とT(トーンが鳴る)を同時に提示したあとに砂糖水(F)が出る。テスト試行でTを出すと砂糖水のバルブに頭を突っ込む行動(CR)が見られる。テスト群ではそれに加えてトレーニング1でL(ライトの点灯)に提示したあとに砂糖水(F)が出る。そうするとTへの反応(CR)が減る。

たとえ話としては、エビと枝豆を食べて腹を下した人はエビを食わなくなる。でももしそのまえに枝豆を食べて腹を下した経験がある場合はエビはふつうに食うだろう、ということ。これは必ずしも合理的判断ではないことに注意。

この現象のポイントは、テストしているTはトレーニングの段階ではテスト群もグループ群もトレーニング2でしか提示していないのだから、「時間的接近」だけでは説明できないということ。

これを説明するためにRWモデルというのが考えられた。式は出さない。ポイントは、連合学習の強度が予測誤差によって更新されるということ。

ブロッキングでは、トレーニング1のときにLに対する連合学習が進んで、LはFを予測するようになる(=予測誤差が0に近くなる)。このあとでトレーニング2でLTを提示しても、LはもうFを予測するようになっているので、LTによってはもう連合学習の強度は変化しない。このようにRWモデルによって説明できる。

ブロッキングは古典的条件づけよりも高次な現象だが、それでも連合学習期論によって十分説明できるため、認知的な過程を要請しない。「予測誤差」を持つためには「予測」が必要だが、これは「現在の連合強度」そのものなので、それを現在の状態とを比較することさえできればよい。

[逆行ブロッキング]

トレーニング1とトレーニング2とをひっくり返しただけの「逆行ブロッキング」という条件を作ることができる。ヒトの場合にはブロッキングと同様な効果が見られる。

グループ トレーニング1 トレーニング2 テスト 結果
テスト群 LT->F L->F T CR low
コントロール群 - CR high

しかしこの現象はRWモデルでは説明できない。なぜなら、トレーニング2ではLが提示されているだけなので、Tについての予測誤差が変わるわけではないから。

これを説明するためにコンパレーター仮説では、RWモデル(とその仲間)のようにテストの結果がトレーニング時の連合強度の変化によって決まるのではなくて、テスト時にそれを読み出す時にいまテストされているTの強度だけではなくて以前提示されたLの強度と比較する過程がある、として説明する。このアイデアはベイズ決定に通じるものがあり、かなり「認知」寄りのモデルであると思う。

RWモデル自体もトレーニング2では、Tが出ていないということが連合強度を下げる、というふうにモデルを改変することによってこ逆行ブロッキングの結果を説明できる(Van Hamme and Wasserman (1994))。このような改変は刺激のある(=1)なし(=0)としたときのpriorを0.5として置くような操作なので、これも一段階「認知」寄りになっていると考えられる。

(このような現象はretrospective reavulationという範疇に入るのだけれども、ratでこれをテーブルにあるような形式のまんま誘導しようとすると難しいらしい。Miller and Mature 1996みたいにsensory preconditioningとか入れる必要がある。このへん重要そうだが今回の話ではスキップ。)

[まとめ]

そんなこんなで、連合学習理論はその根本の「連合強度の更新」というアイデアを保存しながら、より複雑な現象を説明するためにどんどん理論を拡張している。このため、連合学習理論と認知的理論との境界はかなり曖昧になっているように私には思える。

今回読んでいるScience 2006では「連合学習理論では説明できないような現象を見つけたから、これは認知的な過程(因果推論)である」という論法を使っている。(帰無仮説としての連合学習理論。) だから当然、今回見た流れのように、「それ連合学習理論で説明できるよ、ただし理論を拡張すればだけど」ということは起こるのではないかと思う。

これはきっと、澤(2012)にあった、

次のような反論も人口に膾炙している。すなわち,「たった一つの“高次機能”を仮定することと,“百通りの連合経路”を仮定することはどちらが節約的で単純な説明であろうか?」という反論である。

という問題意識に繋がるだろう。

[参考文献]


お勧めエントリ


月別過去ログ