トップページへ

スライド「自由エネルギー原理と視覚的意識」をアップロードしました

pooneilの脳科学論文コメント » 視覚的意識 (visual awareness) » スライド「自由エネルギー原理と視覚的意識」をアップロードしました

先日クローズドの研究会(I-URIC研究会)で発表した「自由エネルギー原理と視覚」にアップデートを加えたものを作成しました。内容としては以前SlideShareにアップロードした「感覚運動随伴性、予測符号化、そして自由エネルギー原理」のアップデート版ですが、この内容を神経回路学会誌に田口茂さんとの共著で「自由エネルギー原理と視覚的意識」として発表する際にいろいろ変わっています。こちらを最新版としてご利用ください。

今回からスライドはspeaker deckにアップロードすることにしました。「自由エネルギー原理と視覚的意識」 SlideShareは日本語は化けるし、スライドの差し替えはできないし、それを放置したままなので、speaker deckに乗り換えました。

これに併せてさいきんtwitterでつぶやいたことを編集した上でまとめておきましょう。


(1/30) 変分ベイズってあくまでもベイズの式で事後分布を計算したいけどできないからそのための近似法として行われるわけだけど、FEPにおいてはベイズをすることよりもFを下げることのほうが根本的であるはずだ。FEPとは「ベイズ脳仮説の近似的実装」ではないわけで。

つまり機械学習での説明での変分ベイズの立ち位置と、FEPにおける変分ベイズの立ち位置になんかずれがあるかんじで、FEPはかならずしも変分ベイズでなくても、MCMC的なサンプリング法でも、明示的にposteriorを計算するものでも、そこはどれでもいいはずではないのかなあ?

いや、この書き方は変か。とにかく脳が各段階でFを下げる方向に変化してゆく、というのがあって、その結果として実現しているものが何なのか、という言い方ならいいのかな。

(2/8) 来週クローズドな集まりでFEPについてのトークをすることになっているのでスライドを見直している。前から気になっていたことだけど、感覚入力sとその原因xについて、agentはq(x)は持っているけど、posterior p(x|s)は持ってないということを明示しておく必要がある。このことは神経回路学会誌ではまったく書かれてない。

Agentはprior p(x)と生成モデル p(s|x)だけを持っていて、posterior p(x|s)を計算するのは積分が必要になるからposteriorを直接計算する代わりに、それの近似q(x)を持ってきて、自由エネルギーFを下げる方向にq(の形を決めるパラメーター)を変化させるってのがFEPなので。これまでのスライドではagentがそれまでの経験としてp(x,s)を持つと書いたけど、正確にはp(x)とp(s|x)を持っていると書くべきだろう。

(2/16) 木曜日にI-URIC研究会というのでトークをしてきた。タイトルは「自由エネルギー原理FEPと視覚」で、神経回路学会誌の解説論文の話を用意していったのだけど、予定60分のところを、途中質問ありで前半部(FEPについての概説)だけで80分かけて終了ということになった(後半の「現象学とFEP」は省略)。

議論自体はたいへん盛り上がったし、私もいろいろ得るものはあったので良かったのだけど、スライドの構成は今後再考が必要だと思った。今回の集まりは脳の専門家だけではなかったので、いきなりFEPの話をするのは前提の共有が足りなかった。まず予測符号化やベイズ脳について概説しておくべきだった。

つまり、FEPについて説明するためには予測符号化とベイズ脳仮説をまず説明してから、FEPというのは「ベイズ脳->(一つの方策としての)Fの最小化->予測符号化による実装」というよりは「(原理としての)Fの最小化->(ひとつの方策としての)予測符号化->(その結果としての)ベイズ脳」である、とまとめる。

次回の駒場講義ではこの方向性でスライドを構成してみよう。つまり、前半100分の統合失調症パートで、ベイズ脳(Adams et al)および予測符号化(MMNおよびagency)を導入しておいて、後半100分のFEPパートでは、PI+AIの説明をして、FEPがベイズ脳+予測符号化以上のものであることが伝わるようにする。

次年度の駒場オムニバス講義の日程は6/19ですでに確定してる。あと4ヶ月だが、どこまで準備できるか。

自分の経験では、初めてフリストンが書いたものを読んだときはさっぱりわからなかった。その理由の一つは、ベイズ脳と予測符号化と変分ベイズの関係が明確でなく、原理と実装がごちゃまぜになってるからだと思う。自分としてはそれを解きほぐすことが理解だけでなく批判としても機能すると思ってる。

(2/17) @tani1216jp 谷さんに同意してもらえると自信が持てます。FEPによれば、ニューラルネットは(Fの最小化というある種の変分原理で規定される)微分方程式で作動する力学系なのに、その結果としてベイズ推定のような統計的な振る舞いを進化によるデザインの結果として獲得しているということが重要だと思います。

(2/27) @shigepong @ShigeruTaguchi “Bayesian model evidence”の話は「暗い部屋問題」に関わってくる話です。私のスライドでのp.26のマゼンタで囲った式にある-log p(s)というのがBayesian model evidence =p(s)のlogを取ったもので、log evidenceまたはsurprisalと呼ばれます。

Perceptual inferenceでは推測q(x)を変化させてFを下げようとしますが、もしq(x)をp(x|s)に完全に一致させることができた場合relative entropy=0になるので、F = log evidenceになる、これが大羽さんの「自由エネルギーという量は Bayesian model evidence という量の近似です」の意味です。

そうすると、「モデルのエビデンスを集める」というのは-log p(s)を最大化する、つまりもっともありふれた感覚入力をサンプルする、という意味になって、これが「暗い部屋問題」として突っ込まれたわけです。

しかし、p(s)のsというのは好き勝手に選べるわけではなくて、持っている生成モデルに依存している、つまり というxについての総和(もしくは積分)を経ないと得られないものなので、「最もありふれた感覚入力を選ぶ」なんてことはできない。

(2/28) 言い方を変えるならば、relative entropy = 0のときにq(x)~p(x|s)の近似ができて、VFE = -log p(s) が成り立つけど、次にこれのsだけを変えようとしても、こんどはrelative entropy = 0が成り立たなくなるからFは小さくできない。だからVFE = complexity - accuracy の式を使うのだ、って説明すれば暗い部屋問題への数式上の反論はそれで終わる。

FEPをエナクティビズム的にとらえるには、そもそもagentが推測q(x)を明示的に持つことがおかしいので、そうではなく「Fを減らすように変動していくagentを第三者から見ると推測q(x)を変動させているように見える」のだろう。これがこのスライドのp.25の含意すること。

FEPが目的論だ、っていう批判も同じような対処になる。つまり、Fを下げるという統制原理があって、進化という見えざる手によって、「あたかもデザインされたかのように」合目的に動作するけれども、それは第三者から見たときであって、agent自体にこっそりホムンクルスを導入しているわけではない。

それよりもエナクティビズムにとってFEPががっかりなのは、認識と行動を統一する原理だったはずが、2015以降のMDPで定式化されたFEPでは、認識におけるVFEと行動におけるexpected VFEとが別のものとして扱われるようになったこと。統一してないじゃん。まあ、認識もexpected VFEの一種だとは言えるか。

« 前の記事へ

次の記事へ »

トップページへ