[月別過去ログ] 2008年03月

« 2008年02月 | 最新のページに戻る | 2008年04月 »

2008年03月28日

ASSC2008口演やります

今年の意識学会(ASSC)の年会は台北で行われます:ASSC2008
昨年はポスターを出しました。そのときの様子は20070625あたりに。
ここで土谷さんとAlex Maierと知り合ったので私にとっては非常に重要な学会です。ちなみに今度の神経科学大会(東京)であと私とATRの神谷さんの四人でシンポジウムをやります。タイトルは「主観的視知覚の神経メカニズム-心理物理、fMRI、電気生理による実験的アプローチ」です。ぜひ見に来てください(宣伝)。
でもって今年のASSCのほうですが、はじめてアジアで開催されるASSCの年会ということもあって、各方面から働きかけがあって、日本からも多くの方が参加して講演をされます。スケジュールはこちら。Keynote Lecture 4コマのうち二つが日本からで、ATRの川人光男先生と霊長研の松沢哲朗先生が話をされます。それからシンポジウムでは理研の田中啓治先生が話をされます。それからTutorialでは順天堂の北澤茂先生とNTTの西田眞也先生によるものがあります。
というわけでわたしもここはチャンスと見てオーラルのセッション('concurrent sessions')に応募していたのですが、これが無事通りました。まだ時間は未定ですが、現在出ているプログラムを見ると、三日目(6/22)に"Blindsight in Normal and Lesioned Brains"というセッションがあるのでここに間違いないでしょう。
ということで論文出せてないのにorzいろんなことやってます。こういう活動が実のあるものとなるよう祈りながら。
それでは、台北で僕と握手!

コメントする (3)
# 金井

こんばんわ。

いま、ASSCのプログラム見ていたら、おなじセッションみたいですね。
http://www.ym.edu.tw/assc12/concurrent_sessions.html

# pooneil

おひさしぶりです。
ASSCのプログラム、アップデートしてたんですね。(メールでの連絡は来ないのだけれど、webの方は着々とアップデートしているようです。)
このあいだまではセッション名だけがわかっていたので、"blindsight"のセッションはどんなかんじになるのかと思ってましたが、要はMIBやflash suppressionなどを含めたperceptual suppression全般を含んだ表現として使っているようです。
なるほど、いっしょのセッションです。Vincent Walshのところに移られてからの仕事がまとまったのですね。仕事が順調に進んでいるようで素晴らしいです。http://kanair.cocolog-nifty.com/blog/2007/12/ucl_a101.html

# 金井

たしかに、blindsightというにはセッションの内容が、blindness全般ですね。最初はアジアでやるASSCにどれだけ人がくるのか心配していたのですが、おもしろそうなトークがたくさんあるので楽しみです。台湾で会いましょう。


2008年03月26日

Corticonics

ガヤの近著のあのカタカナで発音するあれに関しては、華麗にスルーする方針だったんですが、今日生協でこの本のカバーのへんなwメガネかけた写真をよくみたら、持ってる本がMoshe Abelesの"Corticonics"ではないですか。俺が反応しないでだれが反応しますか!ということでここにメモ。
ちなみに当ブログのガヤScience論文2004に関するスレッド
「池谷裕二 corticonics」でぐぐるとこれひとつだけが見つかってきます。(つーかこういうエントリを書いたらそれがgoogleに補足されるので検索結果がひとつだけでなくなるのだった。迂闊。)


2008年03月22日

Twitterに脳内がだだ漏れる

今年これまでtwitterに書いたことを断章形式でブログに再利用:


1/4 酔っぱらった勢いで夜11時にウクレレ。//で気に入ったコード進行がEb-G-B-C。1弦がAb-G-F#-Eと降りてくるところがミソ。//うーむ、Eb-G-B-F-Cのほうが1弦の下降的には良いけど4小節にならない。Eb/G/B|F/Cとかで押し込めるか。

1/7 なんかどうでも良くなってきた。//オレダッテ、ソウイウコトモアル。(パクってみた。)//音速ラインいいな。//英語なんて無理だって。//それでも話を振ってくれるのでありがたい。//なんか、そういう惨めなかんじが常に残る。//ていうか日本語の会話でもけっこう早とちりすることあるんですけど。//気の利いた素早い切り返しみたいなことは期待しないで欲しい。//もともとそういうのが得意と誤解していたことがあった。//それはキツいシャレで返すということを気を使わずにやっていたから。//舌禍事件も多々あった。//長文過ぎ。今日はここまで。//かんちがいのいちばんひどい例は、//車を運転しているときにガソリンの話を振られたので、まだガソリンはあるから大丈夫、と言ったら、//日本のガソリン価格は高いのか、っていう質問だったこと。//そのときはさすがに死んだ。// 心に茨を持つあたりを書いてみた。

1/10 もうね、PIがエアギターとか。//スイート・ホーム・アラバマで総立ちで全員踊ってるとか。//ボヘミアン・ラプソディーの中間部分を完璧に歌っちゃうとか、//カオスでした。楽しみすぎて次の日は絶不調。

1/22 すべてをそのあるべき姿に戻す豪腕。//とかそれっぽいフレーズで。//大洪水のあとで。//薄膜で。僕は3万倍に薄められて。//天幕が。遠い山。そして虫眼鏡で見た蟻。//声は遠く、色は薄い。//静まった夜に、冷蔵庫の音。//Dreamers dreaming, weeper weeping.// Teaser teasing, fetcher fetching.

2/3 バンド名ひとつ思いついた! 「コールドスリープ」。シューゲイザーっぽくてクール!

2/5 なんつーか、それは、すごい嫌な、夢の残骸だった。

2/15 "Wilder Penfield in the Age of YouTube"だってさ!イカしてる!なんかデヴィッドボウイみたいだ!

2/22 昨日は夜遅くまで仕事して、さあ寝ようってwebを見てたら荒川工さんが退職ってニュースとmixiでの日記を見て、なんか自分と重ねてしまって、眠れなくなってしまった

2/23 やっとsumbitした!//酒飲んで寝る。

2/26 We'll be back soonキター!//よし、USサイトでmulti-touchと200GBと2,4GHzのMBPキタ!//X300も正式発表か!

3/12 Amazonのwish listが騒ぎになってる。//とりあえずなにも入れてないんでいいんだけど。//「ひだまりスケッチ」とかリストに出たら死ねる(といいつつ無難なチョイス)。

3/17 とりあえず俺はさ、win-winとか言うやつ嫌いだぜ。//すくなくとも自分がwin側にいることが確定したつもりのは。

3/19 世界がオレで満ちている。//それは美しい、「兆候」。//遠くで地鳴りまでしている。//ほとんど不可能なくらいまでに。


2008年03月17日

大脳皮質の連合繊維の構造

以前のエントリ「半側空間無視の原因部位は?」でとりあげたBartolomeo P, Thiebaut de Schotten M, Doricchi F, "Left Unilateral Neglect as a Disconnection Syndrome"(Cereb. Cortex, 2007)はposterior parietal cortexとprefrontal cortexとを結ぶfiberであるSLF IIの離断がおおきな決定因子ではないかという話だったわけですが、そこで準拠していたのがSchmahmann and Pandyaの"Fiber pathways of the brain" (2006) Oxford University Pressでした。

ちなみにこの本、一昨年のSFNで見つけて購入して当ラボにあるんですが、nhpの大脳でトリチウムラベルされたプロリンの注入でanterogradeラベリングをして、long-rangeのcortico-coritical fiberを追うということを長年にわたって行ってきたPandyaの仕事の集大成です。元々解剖をやっていたものとして、灰白質の方の分類に関してはいろいろ勉強してきたつもりですが(Brodmannの細胞構築による分類とかvon Bonin and Baileyの分類とか)、white matterのfiberをきっちり分類して把握しておくというのはあまりしてこなかったのでいかんなと思っていたところでこの本を見つけて、これは必読だと思ったわけです。

んで、それとは別ラインでDTIのこと勉強してたんですけど、そこで重要論文を発見:

Brain 2007 130(3):630-653 "Association fibre pathways of the brain: parallel observations from diffusion spectrum imaging and autoradiography" Jeremy D. Schmahmann, Deepak N. Pandya, Ruopeng Wang, Guangping Dai, Helen E. D'Arceuil, Alex J. de Crespigny and Van J. Wedeen

これはSchmahmann and PandyaがVan J. Wedeenと組んでdiffusion MRIを使ってnhpのassociation fiber (long distanceなcortico-corticalなfiber)のorganizationを調べたというものでして、上記のanteroの仕事と組み合わせることによって、diffusion MRIで調べたwhite matterの走行がanterograde tracerによるtract-tracingとちゃんと整合性があって、より詳しいこともわかるということを示したものでして、画期的なものではないかと思います。

それだけでなくて、上記の"fiber pathways of the brain"が大著すぎてフォローできなかった部分がまとめてあるので、association fiberについての概観を得る、という目的にも適しているんではないでしょうか。 まずは方法論の方ですが、diffusion MRIのことは詳しくないのでよくわかりません。nhpのbrainをpost mortemで、ガドリニウム(contrast ehnhansing agentとして使われる)に浸けたものを撮影します。ここで使っているのはDTIではなくて、DSIです。ほかにもDWIとかあったりして、私にはもはやさっぱりわかりません。

DSIを最初に報告したWedeenが著者に入っているので、その方法で様々なところを最適化しているようです。たとえば、post mortemの脳ですので、撮像にはいくらでも時間をかけられる。ここでは25時間かけてます。MRマシーンはBrukerの4.7T。DTIとの違いは、fiberがcrossするvoxelのところでちゃんと別方向のfiberを分けることができるという点にあるようです。Figure.2とかを見ると、見てきたんかってくらいもっともらしいfiberの走行が見られます。Figure.3にあるように、いくつか縛りをかけてやって、解剖学でのデータと整合性があるようにしているようです。このへんがミソらしい。そういう意味では、やっぱlong-distanceの長いfiberだから良いのであって、短いやつには向いてないし、あくまで白質でのデータであって、灰白質のどこからfiberが出ているかとかそういうのには向いてなさそうです。その意味では今回の方法論はSchmahmann and Pandyaのこれまでの仕事とベストマッチしていると言えることでしょう。

さて、そうやって出てきたデータのまとめがFigure.4-14です。もうここの図は、壁に貼っておくべきだね(言うだけ)。表にしておきます。ちなみに論文の本文は読んでないので、図を見てピンと来たことだけざっくりとメモっときます:

SLF-I superior longitudinal fasciculus, branch I
PRRとかからPMd,BA9へ。IPSとcingulate suclusとの挟んだところから出てくるから、parietalのmedial側もこれによってつながってるはず。Rizollattiとかが言うところのdorsal streamのうちさらにdorsal側の経路か。
SLF-II superior longitudinal fasciculus, branch II
LIPとか7AとかからFEF、BA46へ。ポイントとしては、白質の走行はけっこう深いところにあって、IPSのfundusからlateral fissureのfundusくらいまで広がってる。だから、PPCとtemporal cortexはそんなに離れていない、とも読める。(7BとかIPGのプロパーはSLF IIIの方なのでじつは離れているのかも!)
SLF-III superior longitudinal fasciculus, branch III
7Bとかinferior parietal gyrusの部分がPMv、BA44, BA46vとつながる。例の、ミラーニューロンの経路と大きく関係してくる。
FOF fronto-occipital fasciculus
DPとかPGってかいてあるけどようするにたぶんV3とかV6とかから直接FEFやPMdに行く経路。これがあるからたぶん、ボトムアップの信号はLIPを通らなくてもFEFに行けるし、FEFの応答潜時が異様に早いのもこういったショートカットがあるからではないですか。これも白質の深いところを走ってる。Long-rangeであればあるほどに深いところを走っている、という一般法則があるかんじ。これはたぶん、fiberの走行が全体の距離を最小にするようにできているとかそういう論文があったと思うけど、それを反映しているのでしょう。
UF uncinate fasciculus
TEから前頭葉に投射するものでして、Gaffanなんかはこれをtransectしたりするのだけれど、じつはTEからUFを介しての投射というのはOFCとかinferior convexityとかそのあたりに限局していて、ventral pathwayからの情報をprefrontal cortexに運んでいる本体ではないということについてはこれまでの解剖学の論文から持論としては持っていたのだけれど、この図を見てそれは正しいと思いました。本体はEmCですね。
EmC extreme capsule
STSのfundusからPFCのBA46のdorsal, ventral両方ともに走っている。この経路が重要であろうことはTomita et.al., NatureとHasegawa et.al., Scienceとからわかっているわけだけど、ま、多くは語りませんが。
AF arcuate fasciculus
これは知らなかった。超重要。TPO/TPtってなにやってんのか、ってそういう問題ですが。Schall-BullierののV4-FEFの結合もここですかね。
MdLF middle longitudinal fasciculus
STGの真下をTPOとかからTAaまでずっと降りてゆくやつ。興味深いのはparietalともつながっていることですね。おそらくはさらにいくつかのfiberのグループに分けられるのだと思うのだけれど。
ILF inferior longitudinal fasciculus
Ventral pathwayのメインのファイバーですね。V4からTE1まで行ってる。TE1というのはTEavやA36まで含む領域ですので、memory systemのほうまで直でつながっているということになるでしょう。あと、この経路のうち、dorsal側とventral側とはおそらくべつのものとしてさらに分類することが出来ることでしょう。
CB cingulum bundle
Retrosplenialとparahippocampalをつなぐ経路。これはRocklandとかもやってたし、泰羅先生のナビゲーションの仕事とかもやっぱこの経路で海馬までつながるんではないでしょうかね。

これはもう、データベースとして公開するべきではないでしょうかね。Van Essenの仕事とかと合わせて、マクロレベルでのconnectomicsとして共有すべきものであるように思うのです。どんなふうに進んでいるのかは知りませんが。ともあれ、tract-tracing techniqueの進むべき方向はこっちだと思ってます。ちなみにSchmahmann et.al.はあくまでanterograde tracerとDSIはべつの脳でやってましたけど、おなじ脳でやればもっとパワフルになるに決まってます。どこかに障壁はありますかね。たとえば、固定したあとで、contrast enhancing agentに最低28日浸ける、なんて書いてあるので、そのへんで抗原性とかが消えさえしなければよいわけですよね。

そういえば、Shuzoさんの「脳とネットワーク/The Swingy Brain」でのヒト脳内ネットワークのトポロジー

"Mapping Human Whole-Brain Structural Networks with Diffusion MRI" Patric Hagmann, Maciej Kurant, Xavier Gigandet, Patrick Thiran, Van J. Wedeen, Reto Meuli, Jean-Philippe Thiran

が言及されていました。ここでの「まずマカクで精度を確認すると」というのに対応するのが今回のSchmahmann et.al.と言えそうです。

ともあれこれは精読しなくては。(「あとで読む」カテゴリーかよ!)

コメントする (2)
# Shuzo

勉強になりました。マカクだからこそのすごい研究ですね。

この論文では積極的にshort fibersを取り除いたようですので、技術的にそのあたりの問題を克服できたらさらにすごいですね。それから、右脳・左脳のファイバーマッピングするのも面白いかな、と思いました(Fig.2Bなんか見ると左右差があるようなないような・・・)。fiber lesion的なパラダイムとも絡みそうで将来の期待大ですね。

そうそう、私のブログのエントリーまで紹介していただいてありがとうございました。(自分でそのエントリーを立てたことすら忘れてました。。。)

# pooneil

たぶんlong-distanceのものだけにしたからこれだけきれいなんでしょうね。皮質下との結合(basal gangliaやら上丘やら)はどのくらい見ることができるんでしょうね。
>>fiber lesion的なパラダイムとも絡みそうで
うむ、やはりなにかと組み合わせることが重要でして、この方向性が技術的にどのくらい可能か、私も興味を持ってます。


2008年03月11日

Autismにおける注視位置

先日はCRESTの第5回領域内研究報告会に行ってきました。わたしもポスター出したり、生理研研究会の宣伝をしたり、いろんな方に挨拶したりと諸活動を。
順天堂の北澤先生の「応用行動分析による発達促進のメカニズムの解明」が興味深かったんですが、未発表の内容なのでここでは紹介を控えるとして(「このサイトについて」のところにも書きましたがこれが当サイトの方針です)、そこでKlin et.al.の仕事を紹介されてました。これが非常に重要な話だと思うので今日はこれについて。
Arch Gen Psychiatry. 2002;59:809-816. "Visual Fixation Patterns During Viewing of Naturalistic Social Situations as Predictors of Social Competence in Individuals With Autism" Ami Klin, Warren Jones, Robert Schultz, Fred Volkmar and Donald Cohen
Autismのある被験者がビデオクリップを見ているときの視線の動きを記録して解析します。これをAutismのない比較対照群の被験者と比べます。Autismのない比較対照群のばあい、人の顔が出てくる場面では視点は目と目の間あたりに来ます。一方でAutismのある被験者で非常に特徴的なのは、人の顔を見るときに、目ではなくて口のあたりを注視する時間が多いということです。
この話を聞いたときに私がはじめに思ったのは、視覚刺激のbottom-upの要素、つまりsaliencyの影響ではないか、ということでした。つまり、じつは口というのは目以上にsalientで、viewers with autismではよりsaliency-baseになっていて、cotrol groupではtop-downの要素によって目を見ているのではないかと。ついでに言えば、英米人の方が言葉を発するときに口を大きく使いますので、われわれ日本人がしゃべるときよりもmotionによるsaliencyが高い可能性があります。
ともあれ、Itti and Kochのsaliency modelとかを元にビデオクリップのsaliencyを考慮に入れて解析したらいいんではないだろうか、と考えてすこし文献を漁ってみたら、もろに該当するものを見つけました。
Social Cognitive and Affective Neuroscience 2006 1(3):194-202; "Looking you in the mouth: abnormal gaze in autism resulting from impaired top-down modulation of visual attention" Dirk Neumann, Michael L. Spezio, Joseph Piven and Ralph Adolphs
以前(20080115)にも多少言及しましたRalph Adolphsの論文です。これがドンピシャで、Itti and Kochのsaliency modelを使って視点の位置を解析してます。
デザインも凝ってて、解析も凝ってる。
刺激には"bubbled face"というのを使っていて、顔刺激(例のDolanの論文とかで使われる恐怖の顔とか4表情のパターン)を空間周波数ごとにランダムな位置でマスクをかけてやって、それをさらに足し合わせる。これではわからんと思うので元論文読んでほしいですが、要は一つの顔の写真からその要素が部分部分入ったものをgenerateするわけです。目のコントラストが高いやつとか、口だけコントラストが高いやつとかいろいろ作れるわけです。これで刺激をtrial-uniqueにすることができる。
課題としては元の4パターンの表情のどれかを弁別してもらう。このときの視点の位置を記録しておく。また、刺激ごとのsaliencyをItti-Kochモデルから計算してやる。どの位置に注視しているかをsaliencyからpredictできれば、それは視線の位置をbottom-upによる効果で説明できるということだし、predictionが悪ければ、top-downのバイアスを反映しているといえるわけです。
結果は私が予想していたのとは違っていました。目のコントラストが高いときはcontrol群でもautism群でも刺激の顔の目に視点が集まる。目の方には実は差がない。差があるのは口の方で、control群では口のコントラストが高いときに口に視点が集まる。一方で、autism群では口のコントラストが低くても口に視点が集まる。つまり、口の位置のsaliencyとはあまり依存せずに口に視点が集まる。つまり、口の位置への注視はsaliency(bottom-up)によるpredictionが悪い。というわけで、私が予想していたのとは逆で、viewer with autismでは、top-downのバイアスで口を見ている、という結論だったのです。
ただ、これだけの結果だと、たんに画像の下の方を見る傾向があるから、という説明も可能です。そこで著者は押さえとして、逆さまになった顔のときのデータを出しているのですが(これはbubbled faceではなくて元の顔画像)、このときは正立しているときよりもさらに口を注視する傾向があります。よって今指摘した可能性は排除できそうです。
あと、top-downのバイアスで目から視線をそらしているとしたら目への視点のpredictionが悪くなるはずだから、それでは説明できません。ちょっとこのへんの結果は謎なかんじ。やってることは正しいようだけどなにか見逃している気がします。
解析も凝ってて、統計はちゃんとmixed effect modelを使っているし、上記のpredictionのところではsupport vector machineを使ってます。視点の位置の密度分布も、ガウシアンカーネルでデータをスムージングではなくて、kernel density estimationを使ってます(いや、本質的には同じなんだけど、視線のデータはデータがsparseになるから、天下り的にband widthを決めるのではなくて、leave-one-outでband widthを決めてやるという意味でこちらの方が良いはず。こんなことすっかり忘れてた。これは参考になった。ちなみにMATLABでの関数はksdensity)。刺激の作り方も、元論文はあるとはいえ、Itti-Kochがfeature mapを何段階かのspatial resolutionでやっていることと対応した刺激の作り方をしているので、理にかなっています。この論文、僕はけっこう好きです。私が目指す芸風に近い。
そういえば、以前(20080115)Ralph Adolphsに言及したときに
Adolphs R, Gosselin F, Buchanan TW, Tranel D, Schyns P, Damasio AR. "A mechanism for impaired fear recognition after amygdala damage." Nature. 2005 Jan 6;433(7021):68-72.
をリストに入れておきましたが、これと今回の話はものすごく関係がありました。両側のamygdalaにdamageのある患者さんが写真の顔が恐怖の表情を浮かべていることを認知することができない、という報告があります(以前言及したNature 1994)。これがじつはその患者さんが写真の顔の目を見てないからで、目を見て答えるように実験者が指示したうえで、同じ課題をやってもらうと対照群と同じくらいの成績になった、というものです。この場合も「目を見ること」が非常に重要な要素でした。
ではまた。


2008年03月07日

適合度の尤度比検定ってこれで良いの?

(追記:latexでPDFファイルを作成しました。そちらの方が数式が読みやすいかと思います。こちらから:loglikelihood.pdf)

宿題持ってくるんじゃねー、とか言われたりしないのでブログは良い。
以下の問題を解こうとして、ネットを調べてたんですが、よくわからないので自作してみました。これでいいんでしょうか、先生(<-だれよ):

こういう問題です:
Observed dataがN個あってそれのヒストグラムを作りました。
このヒストグラムをfittingしてやるために二種類のモデルによるヒストグラムを作りました。
モデルH0とモデルH1があって、H1はH0のモデルにパラメータをひとつ付加したもの。それぞれのモデルからデータをgenerateしてやって、ヒストグラムを作る。
モデルH0によるfittingの適合度とモデルH1によるfittingの適合度とを比べて有意差があるか知りたい。
そこで、ふたつの適合度の尤度比検定をしてやろうというわけです。
それぞれのfittingの尤度関数さえ計算できれば、モデル間で差がないとする帰無仮説において「-2*loglikelihoodの差」が自由度1(H0とH1での自由度の差)のカイ二乗分布に従うことを使って検定できます。
(なお、全部ヒストグラムではなくて確率密度関数にしても成り立つはず。あと、要はモデル選択なので、AICとかBICでやるかという話もあるけど、とりあえず簡単のため尤度比検定で。)

Obserbed dataはN個:
[data(1),data(2),data(3),....data(N)]
ヒストグラムのbinはn個:
[x(1),x(2),x(3),....x(n)]
Observed data、
モデルH0でのbest-fitted data、
モデルH1でのbest-fitted data、
のそれぞれのヒストグラムでの各binの頻度:
[ NO(x(1)), NO(x(2)),..., NO(x(n))]
[NE0(x(1)),NE0(x(2)),...,NE0(x(n))]
[NE1(x(1)),NE1(x(2)),...,NE1(x(n))]
それぞれのヒストグラムのデータの総数は
∑( NO(x(i)))=N
∑(NE0(x(i)))=N
∑(NE1(x(i)))=N
です。(Fitting時に同じになるようにnormalizeしてある。)

まずそれぞれのfittingの尤度関数を作ってみる。
まずObserved dataのある1個data(j)がヒストグラムのbin x(i)に落ちるとすると、
data(j)がモデルH0の分布のbin x(i)に落ちる確率は

NE0(x(i))/∑(NE0(x(i)))=NE0(x(i))/N
と書けます。
だから、尤度関数L(H0)は全observed dataの数だけこれを掛け合わせたものです。
Observed dataの[data(1),data(2),data(3),....data(N)]
がそれぞれ落ちるbinがたとえば
x(m),x(n),x(q),x(r)
とかだとすると、
L(H0)=(NE0(x(m))/N)*(NE0(x(n))/N)*(NE0(x(q))/N)*...*(NE0(x(r))/N)
=NE0(x(m))*NE0(x(n))*NE0(x(q))*...*NE0(x(r)/(N^N)
といったかんじになります。
これをlog-likelihoodに変換すると、
LL(H0)=ln(NE0(x(m)))+ln(NE0(x(n)))+ln(NE0(x(q)))+...+ln(NE0(x(r))-N*ln(N)
です。
全observed dataはx(i)のbinのどこかに落ちるから、
たとえば、x(1)のbinに落ちるobserved dataはNO(x(1))個ある、というふうに整理すると、
LL(H0)=NO(x(1))*ln(NE0(x(1)))+NO(x(2))*ln(NE0(x(2)))+...+NO(x(n))*ln(NE0(x(n)))-N*ln(N)
となります。これを∑を使ってbinごとに(i=1:n)足し合わせるように表記すると
LL(H0)=∑(NO(x(i))*ln(NE0(x(i))))-N*ln(N)
と書けます。
同様にH1のモデルのときは
LL(H1)=∑(NO(x(i))*ln(NE1(x(i))))-N*ln(N)
となります。
あとは2LLを作るだけ。二番目の項が消えます。
2LL = -2*(LL(H1)-LL(H0))
=2*∑(NO(x(i))*ln(NE0(x(i))))-2*∑(NO(x(i))*ln(NE1(x(i))))

∑はどちらも共通のbin x(i)で足し合わせているから合体できます。

2LL = 2*∑(NO(x(i))*ln(NE0(x(i))/NE1x(i)))
ということで計算できました。
これで合ってるのか答えがネットを探していても見つからないのだけれど、G-testやKL diveregenceの値と似ているから、間違った方向には行ってないでしょう。ということで検算のためにG-testの式に近づけてみる:
上記の2LL式を変形してやると、
2LL= 2*∑(NO(x(i))* ln(NE0(x(i))/NE1(x(i))*NO(x(i))/NO(x(i))))
   = 2*∑(NO(x(i))*(ln(NE0(x(i))/ NO(x(i)))-ln(NE1(x(i))/ NO(x(i)))))
   =-2*∑(NO(x(i))*(ln( NO(x(i))/ NO(x(i)))-ln( NO(x(i))/NE1(x(i))))
   = 2*∑(NO(x(i))*(ln( NO(x(i))/NE1(x(i))))-2*∑(NO(x(i))*(ln(NO(x(i))/NE0(x(i))))
   = G(H1)-G(H0)
となって、二つのG検定値の差となっています。なんてこったorz
ちなみにモデルH0でobserved dataをfittingしたときのG検定のG-statisticsは、
G(H0)=2*∑(NO(x(i))*(ln(NO(x(i))/NE0(x(i))))

となります。

というわけでたぶんこんな長々と計算しなくても、二つのfittingをして、G-statisticsを計算して、その差をカイ二乗検定すれば良かったというオチ、のようです。じつははじめに計算をしたときは、G statisticsではなくてカイ二乗の方を使ったのだけれど、カイ二乗の差をまたカイ二乗検定、ってなんかへんではないか?と思って上のような計算をしてみた次第。あと、G-test自体がobserved dataとfitted dataとのあいだでの尤度比検定なのは知っていたのですが、二つのモデルの比較で単純にそれらをさし引いて良いかどうかがわからなかったわけです。以上の計算からすると、最尤推定の考えからしてもさし引いて良い、ということになりそうですが。

ま、いつも通り自分で疑問出して自分で納得してるってかんじなのですが、まだ納得しているわけではないんです。というのも、計算される値が大きすぎるし、ググっても、関係してくる項目が見つからない。まだなんか間違えている気がします。

また、G検定はいわばKL divergenceの離散バージョンと式の上では同じですから(ところでこのことをwebで探しても明確に書かれているものを見つけられない)、情報幾何で使われるイメージ化の方法が使えます。ここでしている-2LLのカイ二乗検定というのは、[Observed data -> model H0でのbest fitted data]の距離と[Observed data -> model H1でのbest fitted data])の距離との差を取っているということになります。たとえば「神経回路網とEMアルゴリズム」とかにあるようなとり扱いをすると、observed dataの集団を多様体の中のある一点として、H0のモデルに属した曲面とH1のモデルに属した曲面とがあって、observed dataの点からそれぞれの曲面に垂線を下ろした当たったところがそれぞれのモデルでのbest-fitted dataの集団の位置で、その垂線(正確にはm測地線)の距離がKL-diveregenceです。

さて、そうするとわたしがわからないのは、そういったまっすぐでない空間での二つのKL-divergenceをたんにさっ引いてよいのかっていう問題になるのかも知れません。ていうかそこまでいくと、2LLの原理を調べろ、ってことでネイマンーピアソンまで戻って勉強しないといけない。こういうことやってるとJSTORにある昔の統計学の論文とか読み出してどんどんはまることになるので、このへんまでにしておきます。

コメントする (2)
# mmrl

ここにお邪魔するのはおひさしぶり、mmrlです。
計算は見た目間違ってないように見えますし、G統計量に関してはあんまり知らないのもあるんですが、やっぱりパラメータ数の違う最尤推定をしても、データを増やしたらパラメータが多いほうが尤度では勝っちゃいませんか?AICやBICでパラメータ数の補正はかけないと、というのはすぐに思いついちゃいます。

あ、でもパラメータ数の多いモデルの張る関数空間がパラメータ数が少ないモデルの空間を含まない場合は、必ずしもそうなるとは限らないかな...?

# pooneil

先生キター! コメントどうもありがとうございます。

>>計算は見た目間違ってないように見えますし

そもそも尤度関数の作り方からしてこれでいいのかどうかわからなかったので、安心しました。

>>やっぱりパラメータ数の違う最尤推定をしても、データを増やしたらパラメータが多いほうが尤度では勝っちゃいませんか?

多少補足しますと、モデルH0のパラメータが8個、モデルH1のパラメータが9個でして、モデルH1はモデルH0にひとつパラメータを余計に付加したものです。モデルH0では、あるパラメータが二つの実験条件のあいだで共通になっています(theta1=theta2)。モデルH1ではこれがtheta1≠theta2になっています。この二つのモデルを比較して、H0をrejectすることで、theta1とtheta2とのあいだに差があることを示そう、というわけです。ですので今回のモデルは

>>あ、でもパラメータ数の多いモデルの張る関数空間がパラメータ数が少ないモデルの空間を含まない場合は、

パラメータ数の多いモデルの張る関数空間がパラメータ数が少ないモデルの空間を含む場合に該当すると思います。
というわけで、カイ二乗検定はパラメータ数の差(9-8)で自由度1で検定しているので、パラメータ数が多くなった分はそこで考慮しているとは言えます。ただ、データ数がものすごく多いので(>30,000)、そこを考慮してこれで良いのか、というあたりがよくわかってません。その意味ではBICのほうがデータ数nを考慮しているのでよいのかも知れません。
じっさいにBICを計算してみると、BICでのペナルティ項 k*ln(n) (kはパラメータ数、nはデータ数)の両モデルでの差は10程度で、2LLの差はそれよかずっと大きいので、こっちで計算してもH0よりもH1のほうが良い、という結論になります。こっちのやり方の方がよいのかも知れません。
ただこの場合、あくまでモデル選択ですので、p-valueを付けることは出来ません。上記のtheta1=theta2を棄却するというような考え方と、モデル選択の考え方とが変に入り交じっているところがそもそもの問題なのかも知れません。
ともあれ、助かりました。どうもありがとうございます!


お勧めエントリ

  • 細胞外電極はなにを見ているか(1) 20080727 (2) リニューアル版 20081107
  • 総説 長期記憶の脳内メカニズム 20100909
  • 駒場講義2013 「意識の科学的研究 - 盲視を起点に」20130626
  • 駒場講義2012レジメ 意識と注意の脳内メカニズム(1) 注意 20121010 (2) 意識 20121011
  • 視覚、注意、言語で3*2の背側、腹側経路説 20140119
  • 脳科学辞典の項目書いた 「盲視」 20130407
  • 脳科学辞典の項目書いた 「気づき」 20130228
  • 脳科学辞典の項目書いた 「サリエンシー」 20121224
  • 脳科学辞典の項目書いた 「マイクロサッケード」 20121227
  • 盲視でおこる「なにかあるかんじ」 20110126
  • DKL色空間についてまとめ 20090113
  • 科学基礎論学会 秋の研究例会 ワークショップ「意識の神経科学と神経現象学」レジメ 20131102
  • ギャラガー&ザハヴィ『現象学的な心』合評会レジメ 20130628
  • Marrのrepresentationとprocessをベイトソン流に解釈する (1) 20100317 (2) 20100317
  • 半側空間無視と同名半盲とは区別できるか?(1) 20080220 (2) 半側空間無視の原因部位は? 20080221
  • MarrのVisionの最初と最後だけを読む 20071213

月別過去ログ


« 2008年02月 | 最新のページに戻る | 2008年04月 »