[月別過去ログ] 2017年01月

« 2016年12月 | 最新のページに戻る | 2017年02月 »

2017年01月23日

OGRE YOU ASSHOLE@名古屋クラブクアトロ20170121行ってきた!

OGRE YOU ASSHOLE@名古屋クラブクアトロ20170121に行ってきた! すごいよかった!

スタート5分前に到着すると会場はほぼ満員。なんとか後ろの高いところではなくて低い場所のいちばん後ろくらいに陣取った。スタートはほぼきっかり18時。ライブ前のSE流れている状態でメンバーが現れて楽器構えている間にSEの音量が下がって、照明が落ちて、ライブがスタート。

曲順に関してはこちらに情報あり。ネットで調べると先週の鹿児島や福岡の公演のセットリストが見つかるので、ニューアルバム(「ハンドルを放す前に」)からほぼ全曲とあとプラスアルファという感じで予想していた。でもそれと比べると、名古屋公演では曲順に変更があった。スタートは「はじまりの感じ」で、ラスト前に先週はなかった「ロープ(long ver.)」が入っていて、アンコールは「ワイパー」一曲。終了は19時55分くらいで、トータル2時間弱で18曲。

自分的なハイライトは、二曲目の「ハンドルを放す前に」での長いインスト部分と、「フラッグ」でマントラみたいに繰り返す部分と、「見えないルール」でG馬淵がSGかき鳴らすところと、「移住計画」からつなげて「ロープ (long ver.)」が始まったところと、アンコールの「ワイパー」でリズム隊止まってギター2本だけになるところ(正確に言えばハイハットは打ってるけど)。

というわけで、とてもよかった。オウガのスタジオ盤はすごいドライな音の感触なので、サイケとシューゲ好きな自分としては正直好みの音響ではないのだけど、ライブは二つのギターにイフェクトかけまくって最高な音だ。"Workshop"みたいにライブ盤が出たら買うのに。


OGRE YOU ASSHOLEのことを知ったのはずいぶん最近のことで、2015年5月のROVO TOUR 2015の5/22 名古屋・ボトムラインでOGRE YOU ASSHOLEも出るというニュースを見たときのことで、けっきょくこのライブは仕事の都合で行けなかった。

それでYoutubeで公式映像探してみたら「ロープ(long ver.)」を見つけて、これがどサイケ(クラウトロック風味)というどストライクな音だったのでこの日を楽しみにしていたという次第。そういうわけで、今回は初めてのライブ参加だった。


前回ライブに行ったのはいつか調べてみたら、20150130のTycho@名古屋クラブクアトロだった。そういうわけで2年ぶり。次は何に行こうか。Explosions in the skyが2月末にあるけど、あいにく出張と重なってた。


2017年01月13日

セミナー「アクティブビジョンと フリストン自由エネルギー原理」スライドをアップロードしました

2017年1月11日に北大文学部の田口茂さんのところで講演を行いました。タイトルは「アクティブビジョンとフリストン自由エネルギー原理」です。田口さんのラボでの告知記事

Karl Fristonが提唱している「自由エネルギー原理(free-energy principle = FEP)」について、北大文学部の聴衆を対象にして、物理学や機械学習の知識の前提を抜きにして説明を行ったものです。FEPの意識研究への応用に向けて、Karl FristonのFEPとAlva Noeのエナクション説の近接性について強調したものとなっております。実際のスライドからいくらか手直ししており、発表時よりもより正確に、ちょっと詳しくなっております。

そういうわけで、このスライドの想定読者は、神経科学や意識研究に興味があって、「自由エネルギー原理」って話には聞いたことあるけど難しくてわからんなー、という方です。まずはこれを読んでみるとイメージは掴めるのではないかと思います。

「アクティブビジョンと フリストン自由エネルギー原理」@北大20170111 from Masatoshi Yoshida

なるたけコンパクトに説明するために、スタンダードな説明から大胆に重要なパーツを削っております。削っている点についてまとめておきます:

  • Predictive codingにおいては脳の中で複数の層で段階的に予測誤差が処理されてゆきます(hierarchical message passing)。今回は脳に層はありません。網膜とひとかたまりの脳だけです。
  • ベイズの式も出てきません。変分ベイズしません。ラプラス近似しません。
  • KL divergenceもsurprisal (-ln p)も出てきません。自由エネルギーの式は何の関数なのか(b:神経活動, s:感覚入力)だけを示します。

Active inferenceを嘘つかずに説明するためにはどうしても条件付き確率だけは省略できませんでした。本当はもっと簡単にしたかったのだけど、いちおう高校までの知識の範囲で読めるようにはなっているはずです。

このスライドを読んで興味を持ったら、機械学習(変分ベイズ)や物理学(解析力学や熱力学)を勉強してさらに先に進むとよいかと思います。

そのうちもう一段先の説明のスライドも作ってみようと思います。つまり、KL divergenceやsurprisalを手計算できるようなtoy modelを使った説明をしてみようかと考えてます。でもいつになるかわからんので、今回はこのあたりでアップロードします。

詳しい方はぜひ間違いを見つけたら教えて下さい。内容をアップデートしてゆきますので。

このスライドの目的は、機械学習における生成モデルと脳でやっていることの近似性を強調する点にはありません。それはまさにフリストンがやっていることそのものなのですが。どちらかというとこのスライドは、意識研究においてFEPを応用するために、agentの内部からアクセスできるものは何か、という点からFEPを批判的に捉え直したいという動機のもとで作成しております。


いくつか追記:スライド後半で使っている蝶と蛾の話は、以前から駒場講義で使っていたものなのだけど今回かなりアップデートした。知ってる人には当たり前なのかもしれないけど、私はこのくらい具体的な説明がないとわからないし、そしてどこにもこういう説明がなかったので、自分で作らざるを得なかった。

一方で前半のCNNニュースと砂嵐の話もずっと使ってきたんだけど、これは本来ベイジアンサプライズを説明するための題材なので、predictive codingの説明に最適化されているわけではない。蝶と蛾の話だけで統一的に説明したほうが、アクティブビジョンの流れにも沿っていて良かったのかも。

スライドを作っている時点では、田口さんの「経験は「当てはずれ」に開かれている」の話と繋げてみたいという動機があったのだけど、「無意識的推論」の説明としてはこのあたりもっとスッキリさせることができたように思う。あとでの田口さんとの議論には役に立ったけど。

あと、なるたけ同じ概念を別の言葉で言い表さないように気を付けていて、たとえば、無意識的推論とpredictive codingでは前者だけ使った。でもrecognition density q(x|b)に関してだけはちゃんと統一できてない。あるときは「推定」だし、またあるときはbeliefだし、モデルって言ってるところもあるし。しかしフリストン論文でも自由自在に使ってる様子だしなあ。

セミナー後に質問を受けて気づいたけど、「pとqが一致する」って書くのはKL divergenceを知っていればすぐに通じるけど、今回の説明だと通じない。ちゃんと「2つのヒストグラムがまったく同じ分布をしていること」が予測誤差がゼロであることなのだと明確に説明するべきだった。

あと、かなり字が小さいスライドがあるけど、実際のスライドでは24ポイントより小さい文字はreferenceの表示(18ポイント)以外では使っていない。本番では喋りで処理している部分を、slideshareに上げる際にちゃんと読めるように編集した次第。(<-言い訳がまC)


2017年01月03日

総説「視覚サリエンスは脳のどこで、どのように計算されるか?」を出版しました

昨年書いていた総説論文が英国王立協会フィロソフィカル・トランザクションズ誌でオンラインアクセス可能になりました。オープンアクセスですので購読していなくても読むことができます。

Review article: "How is visual salience computed in the brain? Insights from behaviour, neurobiology and modelling." Richard Veale, Ziad M. Hafed, Masatoshi Yoshida Phil. Trans. R. Soc. B 2017 372 20160113; DOI: 10.1098/rstb.2016.0113. Published 2 January 2017

(本総説はテーマ特集号 'Auditory and visual scene analysis'の一部として査読を経て出版された。)


どういう内容かというと、視覚サリエンシー(サリエンス)が脳のどこで計算されるかを、大脳皮質での経路と皮質下(上丘)での経路とでの計算過程の違いに注目してまとめた。これが私にとって初めてのコレスポでの総説論文となった。

総説の骨格をざっくり書いてみる。注意の心理学やコンピュータービジョンの世界では「サリエンシーマップ」という概念が提唱されている。これを実際の画像を元にして視覚シーンのうちどこが「注意を惹く」つまりsalient(サリエント、セイリエント)であるかを定量化した二次元マップ(サリエンシーマップ)として脳内に表象している、というのがサリエンシー計算論モデル。それではじつのところ、視覚サリエンシーは脳の中でどうやって計算されているか?

Ittiのモデル(図1)では、視覚の低レベル特徴(輝度lum、色col、方位ori、方向mot)ごとに特徴検出を行う((1)feature analysis)。そのうえでどこが目立つかをcenter excitation-surround inhibitionのメカニズムによって計算したものを計算する((2)feature map, 特徴マップ)。そのあとでその特徴マップをすべて足し合わせたサリエンシーマップを計算する((3)saliency map)。つまりサリエンシーマップは特徴には依存しない単一のマップであることを想定している。これらのマップは視覚刺激そのものによって一意に決まる。これに対して報酬やゴールといった状況依存的なもの、トップダウン注意と呼ばれるようなものを加味したものが優先度マップ((4)priority map)。このpriority mapのなかで実際にどこに目を向けたり手を伸ばしたりするかということをwinner-take-allルールで決めてやる。

では脳の中でこのような計算は実際に行われているのか? 図2にまとめてみた。まずこれまでの論文を調べてみると分かるのが、V1はサリエンシーマップというよりは特徴マップと考えたほうがよいということ。V1では輝度サリエンシーよりも輝度そのものをコードしている(Betz et al 2013)。

ではV4やLIPはどうかというと、Mazer and Gallant 2002にあるように、V4ニューロンは輝度コントラストに強く反応するのだけど、サッカードする際に徐々にゴールの情報を反映するようになる。つまりこれは(特徴に依存しない)サリエンシーマップでもなければpriority mapでもなくて、特徴に依存しつつ、ゴールの情報を持つ、いわばfeature-specific priority mapとでも呼ぶべきものになる。

FEFや上丘の深層(dSC)がpriority mapとしての情報を持っているということはすでにいろいろエビデンスがある。つまり、大脳皮質でのサリエンシー計算は上記図2(b)の黒矢印のように、feature map -> feature-specific priority map -> priority mapの順番で行われている。つまり、Ittiのモデルでは正しく分類することはできない。おそらく、大脳皮質でのサリエンシー計算はボトムアップとトップダウンのリカレントな計算が必須で、Tsotsosのモデルとかのほうが妥当であるといえる。Ittiのは片方向の計算だけだから。

一方、以前の私の盲視の研究からわかるように、V1損傷後でもサリエンシーは計算できる(Yoshida et al 2012)。ではどこで計算しているかというと最大の候補は上丘の表層(sSC)だ。たとえば上丘には視覚刺激が止まっているときよりも動いているときに強く活動するのに、動きの向き(上下左右)への選択性はないニューロンが大半を占める(Moors and Vendrik 1979)。これはつまり方向の情報を計算せずに(図1でいうfeature amalysisの段階がない)、動きのサリエンシーだけをいっきょに計算しているという意味で、サリエンシーに特化したニューロンであるといえる。(大脳皮質では方位、傾きの情報をV1のニューロンが計算した上でそこからサリエンシーを抽出するという意味ではサリエンシー計算は方位計算の結果を用いた二次的なものといえる。) 哺乳類の上丘は他の脊椎動物での視蓋の相同脳部位であり、カエルのバグ検出器(Lettvin and Maturana 1959)が動きサリエンシー検出器であって虫の種類を弁別することができないということともよく合致している。

より決定的な証拠として、Yoshida et al 2012の共著者であるクイーンズ大学のBrian Whiteは上丘のニューロン活動がフリービューイング中に視覚サリエンシーを(輝度などの情報よりも)反映していることを示した。この論文はいまNature Communicationsにin pressとなっている(Brianのサイトの情報より)。じつのところこの仕事については以前からよく知っていて、図を引用したかったのでこの論文が出版されるのを待っていたのだけれど、査読過程でかなり苦労していたので、こっちの総説のほうが先に出てしまったという経緯がある。

そんなわけで、サリエンシー計算のルートには上記の図2(b)の黒矢印のルートとは別に、上丘を経由するルート(上記図2(b)の灰色矢印)があって、こっちのほうではfeature map -> (feature-agnostic) saliency map -> priority mapと、Ittiのサリエンシー計算論モデルによく合致した計算過程があることが推測できる。

では上丘の局所回路でどんなことやっているかってのが後半の話で、これが私が今やっている上丘ニューロンのシミュレーションの話に繋がる。ひとつはZiad Hafedさんとやっている、マイクロサッカードも考慮した上でのneural fieldベースのモデルになるし、もうひとつがRichard Vealeさんとやっているスパイキングニューロンネットワークを用いたモデルになる。ここに関しては省略。今後の発展を乞うご期待ということで。


以上で総説の説明が終了。この総説には盛り込むには時期尚早だったけど本当に興味があるのは、以上のサリエンシー計算についての図式を予想コーディングおよびフリストンの自由エネルギー原理の枠組みのなかにうまく位置づけてやるということ。

フリストンの論文 2012にもあるように、自由エネルギー原理の枠組みにおいては、サリエンシー計算(=外れ値検出)は階層的な予測誤差のカスケードの中での予測誤差として捉えることができる。これは自由エネルギーの式でいうと F = Complexity - Accuracy という式表現でのcomplexityがまさにサリエンシーそのものであり、Itti and Baldi 2009でのbayesian surpriseとして計算できる(すでにIttiのモデルの中でimplementされている)。そうすると、脳内のフィードフォワード方向の予測誤差はサリエンシー計算、フィードバック方向の予測信号は無意識的推論、と捉えることができる。つまり、(大脳皮質での)サリエンシー計算は無意識的推論としての視覚のモデルの一部として必然的に計算されるものであるというわけ。

まあ、今後はこんなことをやってゆく所存です。今年もよろしくお願いします。


お勧めエントリ

  • 細胞外電極はなにを見ているか(1) 20080727 (2) リニューアル版 20081107
  • 総説 長期記憶の脳内メカニズム 20100909
  • 駒場講義2013 「意識の科学的研究 - 盲視を起点に」20130626
  • 駒場講義2012レジメ 意識と注意の脳内メカニズム(1) 注意 20121010 (2) 意識 20121011
  • 視覚、注意、言語で3*2の背側、腹側経路説 20140119
  • 脳科学辞典の項目書いた 「盲視」 20130407
  • 脳科学辞典の項目書いた 「気づき」 20130228
  • 脳科学辞典の項目書いた 「サリエンシー」 20121224
  • 脳科学辞典の項目書いた 「マイクロサッケード」 20121227
  • 盲視でおこる「なにかあるかんじ」 20110126
  • DKL色空間についてまとめ 20090113
  • 科学基礎論学会 秋の研究例会 ワークショップ「意識の神経科学と神経現象学」レジメ 20131102
  • ギャラガー&ザハヴィ『現象学的な心』合評会レジメ 20130628
  • Marrのrepresentationとprocessをベイトソン流に解釈する (1) 20100317 (2) 20100317
  • 半側空間無視と同名半盲とは区別できるか?(1) 20080220 (2) 半側空間無視の原因部位は? 20080221
  • MarrのVisionの最初と最後だけを読む 20071213

月別過去ログ


« 2016年12月 | 最新のページに戻る | 2017年02月 »