« 総説「視覚サリエンスは脳のどこで、どのように計算されるか?」を出版しました | 最新のページに戻る | OGRE YOU ASSHOLE@名古屋クラブクアトロ20170121行ってきた! »

■ セミナー「アクティブビジョンと フリストン自由エネルギー原理」スライドをアップロードしました

2017年1月11日に北大文学部の田口茂さんのところで講演を行いました。タイトルは「アクティブビジョンとフリストン自由エネルギー原理」です。田口さんのラボでの告知記事

Karl Fristonが提唱している「自由エネルギー原理(free-energy principle = FEP)」について、北大文学部の聴衆を対象にして、物理学や機械学習の知識の前提を抜きにして説明を行ったものです。FEPの意識研究への応用に向けて、Karl FristonのFEPとAlva Noeのエナクション説の近接性について強調したものとなっております。実際のスライドからいくらか手直ししており、発表時よりもより正確に、ちょっと詳しくなっております。

そういうわけで、このスライドの想定読者は、神経科学や意識研究に興味があって、「自由エネルギー原理」って話には聞いたことあるけど難しくてわからんなー、という方です。まずはこれを読んでみるとイメージは掴めるのではないかと思います。

「アクティブビジョンと フリストン自由エネルギー原理」@北大20170111 from Masatoshi Yoshida

なるたけコンパクトに説明するために、スタンダードな説明から大胆に重要なパーツを削っております。削っている点についてまとめておきます:

  • Predictive codingにおいては脳の中で複数の層で段階的に予測誤差が処理されてゆきます(hierarchical message passing)。今回は脳に層はありません。網膜とひとかたまりの脳だけです。
  • ベイズの式も出てきません。変分ベイズしません。ラプラス近似しません。
  • KL divergenceもsurprisal (-ln p)も出てきません。自由エネルギーの式は何の関数なのか(b:神経活動, s:感覚入力)だけを示します。

Active inferenceを嘘つかずに説明するためにはどうしても条件付き確率だけは省略できませんでした。本当はもっと簡単にしたかったのだけど、いちおう高校までの知識の範囲で読めるようにはなっているはずです。

このスライドを読んで興味を持ったら、機械学習(変分ベイズ)や物理学(解析力学や熱力学)を勉強してさらに先に進むとよいかと思います。

そのうちもう一段先の説明のスライドも作ってみようと思います。つまり、KL divergenceやsurprisalを手計算できるようなtoy modelを使った説明をしてみようかと考えてます。でもいつになるかわからんので、今回はこのあたりでアップロードします。

詳しい方はぜひ間違いを見つけたら教えて下さい。内容をアップデートしてゆきますので。

このスライドの目的は、機械学習における生成モデルと脳でやっていることの近似性を強調する点にはありません。それはまさにフリストンがやっていることそのものなのですが。どちらかというとこのスライドは、意識研究においてFEPを応用するために、agentの内部からアクセスできるものは何か、という点からFEPを批判的に捉え直したいという動機のもとで作成しております。


いくつか追記:スライド後半で使っている蝶と蛾の話は、以前から駒場講義で使っていたものなのだけど今回かなりアップデートした。知ってる人には当たり前なのかもしれないけど、私はこのくらい具体的な説明がないとわからないし、そしてどこにもこういう説明がなかったので、自分で作らざるを得なかった。

一方で前半のCNNニュースと砂嵐の話もずっと使ってきたんだけど、これは本来ベイジアンサプライズを説明するための題材なので、predictive codingの説明に最適化されているわけではない。蝶と蛾の話だけで統一的に説明したほうが、アクティブビジョンの流れにも沿っていて良かったのかも。

スライドを作っている時点では、田口さんの「経験は「当てはずれ」に開かれている」の話と繋げてみたいという動機があったのだけど、「無意識的推論」の説明としてはこのあたりもっとスッキリさせることができたように思う。あとでの田口さんとの議論には役に立ったけど。

あと、なるたけ同じ概念を別の言葉で言い表さないように気を付けていて、たとえば、無意識的推論とpredictive codingでは前者だけ使った。でもrecognition density q(x|b)に関してだけはちゃんと統一できてない。あるときは「推定」だし、またあるときはbeliefだし、モデルって言ってるところもあるし。しかしフリストン論文でも自由自在に使ってる様子だしなあ。

セミナー後に質問を受けて気づいたけど、「pとqが一致する」って書くのはKL divergenceを知っていればすぐに通じるけど、今回の説明だと通じない。ちゃんと「2つのヒストグラムがまったく同じ分布をしていること」が予測誤差がゼロであることなのだと明確に説明するべきだった。

あと、かなり字が小さいスライドがあるけど、実際のスライドでは24ポイントより小さい文字はreferenceの表示(18ポイント)以外では使っていない。本番では喋りで処理している部分を、slideshareに上げる際にちゃんと読めるように編集した次第。(<-言い訳がまC)


お勧めエントリ


月別過去ログ