« Tononiのinformation integration theory of consciousness | 最新のページに戻る | 細胞外電極はなにを見ているか リニューアル版 »

■ ニューロン記録データの共有

京都で開催された脳プロ分科会に行って「皮質脳波』および「データベース』のセクションに参加してきました。
「皮質脳波』の方ではニューロン活動から細胞外電位ができるまでとその逆推定に関してトークをしてきました。元ネタは以前のブログのエントリ(「細胞外電極はなにを見ているか」)ですが、それでは足りずかなり変更を加えることに。おかげでかなり整理できましたんで、これに関してはまたエントリを作製します。
んで、「データベース』の方ですが、面白かったんでいろいろしゃべりたかったのですが、その場では時間がなかったのでこちらでまとめます。
神経科学者SNSブログに同じものを投稿しておきます。どちらでもコメントしやすいほうにコメントしていただけるとありがたいです。
藤田保健衛生大の宮川さんが遺伝子改変マウスの場合のデータ共有についてお話をされていて、これが面白かったです。宮川さんの最近の論文("Alpha-CaMKII deficiency causes immature dentate gyrus, a novel candidate endophenotype of psychiatric disorders")を例にして、どのようにデータベースが使われているかを説明されていました。論文に沿った話ですのでここに書きますね。Alpha-CaMKIIのノックアウトマウスをデータベースから探してマウスをもらって、行動解析をして統合失調症モデルとしての有用性を示して、Allen Instituteのin situの発現のデータベースからDGに限局して発現しているのを見つけて、ノックアウトマウスではDGでの細胞新生が昂進しているのを見つけて、さらに自前の行動バッテリーデータベースから同様な行動パターンを示すノックアウトマウスを見つけた、といった話でした。(不正確な部分は勘弁。)
これを聞きながらニューロン記録データの場合だったらどのようなやり方が可能かということを考えていました。データ共有における大事なポイントの一つは、どの段階でデータ公開をするかということです。ニューロン記録データの場合、現状のやり方のままでは、実験者はデータをなかなか手放さないだろうと思います。つまり、実験者が自分でデータを解析して、実験デザインの中で重要な部分を解析して、もうこれ以上は得られるものがないというところまでいかないとデータをオープンにはしないだろうと思います。
宮川さんの話を聞いた上でのわたしの憶測ですが(誤解だったら指摘してください)、ノックアウトマウスの場合だったら、ノックアウトマウスを作って、基本的な行動解析をして、in situで分布を見て、もっとも関係ありそうな機能を調べてと、一通りのことが済んだらたぶんそのマウス単独でできることはそんなになくなってしまうんではないでしょうか。だからこそデータベースに上げて、他のgeneのノックアウトマウスとかと一緒にしてデータマイニングをすることで新しい情報を見つけるという経路に入るわけです。そして思いも依らない機能などが見つかれば、マウス提供者としてもありがたい。つまりここには自然なインセンティブ構造、つまりみんながハッピーになる仕組み、ができているというわけです。
だから、ニューロン記録データの場合も同様な切り分け方を考える必要があるのではないか、と考えてました。川人先生がお話しされていたように、データ公開自体の義務かの流れはやってくるだろうし、何らかのインセンティブ構造を作るべきなのはたしかです(たとえばデータ提供が論文出版と同様に評価されるとか)。私がその場で言おうとしていたことは、インセンティブ構造のデザインとは、それを制度的に作ることよりは、遺伝子改変マウスの場合にうまくいっているようなデータの切り分け方(ひとつのノックアウトマウスでできることと、他のノックアウトマウスとの比較でデータマイニングしてはじめて見つかること)を見つけてその実例を示して行くことではないか、ということでした。
そのような見方で上記のニューロン記録データの場合で考えると、遺伝子改変マウスの場合と同様、「そのデータ単独では検証すべき仮説が出てこないので、他のデータとつきあわせてデータマイニングする必要が出てきた場合」ということになるのではないかと思います。そういう意味では、京大の篠本先生が日本各地のニューロン記録データを集めた上で脳の各記録部位(V1からTEからM1からDLPFCまで)のデータ間でのfiring property (inter-spike intervalなどに注目したもの)を解析するということをされていますが、これはデータ共有の仕方として「自然な」流れの例と言えるのではないかと思います。
これから始まるであろう、大規模ニューロン記録データの共有では、もはや実験者では解析が手に負えないという状況になって、実験者と解析者とのコラボレーションが必要となるという状況が生まれることになります。ここにいかにしては上記のような自然なインセンティブ構造によるデータの流れを作るか、というのが目下の問題となるわけです。
ちょっと話が具体的になりすぎたのでもう少し話を散らしますね。
データ共有という意味では昨今のWeb 2.0というやつが参考になります。Web 2.0のポイントのひとつは利用者で率先して自分でメタデータを作る、という点にあります。たとえばアマゾンでの読者の評価、はてなブックマークでのコメント、こういったもの自体がコンテンツとなってさらに人が集まる、というのが特色です。データ共有という意味で参考になるのは、Web 2.0では、データの作成者と使用者が一緒、とまではいかなくても重なった集団であるということです。こういったメタデータの作成者はそのサービスのヘビーユーザーです。
ひるがえって研究データの共有の場合はどうなんでしょう。ここは質問ですが、遺伝子改変マウスの場合はどうでしょうか? 遺伝子改変マウスの作成者自体がデータベースのヘビーユーザーなのではないでしょうか。だからたぶん、ニューロン記録データの場合も、データを作成する実験者自体がそのデータベースのヘビーユーザーとなるようでないと立ちゆかないのではないかと思うのです。
悲観的なもの言いのように聞こえるかもしれませんが、私としてはこのようなことを考えたうえで、自分で使いたくなるようなデータベースがなんだかを見つけることができたら、きっとうまくいくんではないかと思うんで、そういうデータベースがなんだか考えましょう! それを考えついた人が次世代偉くなると思う。(いや、偉くならなくていいんだけど。)
追記:神経科学者SNSの方でたくさんコメントをもらってます。宮川さんからもレスポンスをいただきました。アカウントがある方はぜひそちらでコメントを。
追記:神経科学者SNSでのつづきのわたしのコメント:
宮川さん、どうもありがとうございます。そんなに的外れなことは言ってなかったようで、安心しました。
Neuroshareは面白いと思いました。赤崎さんのお話を伺った限りだとまだそんなにアクティブではないようですが、データ共有はこの形にしてもよいのではないかと思いました。違う会社のデータの解析を統一した環境で行えるという点が既にメリットになっていると思います。R Andersenラボにこのあいだ見学に行ったのですが、ラボにはcyberkineticsあり、tucker davisあり、plexonありというかんじで、データ処理の環境の統一がなかなか大変そうな印象を受けました。
吉岡さんのときに私もコメントしましたが、それぞれの会社のバイナリでデータを共有するといろんな人がアクセスできるというわけにいきません。じっさい、たしかaxon instrumentsの新しいファイル形式は公開されていない(必要だったら個別に聞けみたいな)はずです。
Neuroshareはいまのところまだ会社主導で、十分にソフトウェアとかが整備されていないようですが、将来的には、いったんNeuroshareにデータを移すと解析が便利だというかんじになるとよいと思います。それには解析ソフトの整備もありますが、実験者自体がどんどんmatlabの scriptとかを掲載していって、解析のプラットフォームはこのレベルにした方が良さそうだ、というレベルまでいけばデファクトスタンダード化すると思います。
臼井先生が「オールジャパン体制で」というフレーズで日本の一部の人ではなくて日本全体での取り組みを強調されていましたが、今回の話し合いでは海外の類似プロジェクトとの関連の話はなかったと思います。私自身は特に利害関係がないのでべつに日本国内にこだわらなくてもよいのではないかと思ってます。すくなくとも、Neuroshareの話の場合は関連する海外のプロジェクトに積極的にコミットするというスタンスでもよいのではないかと思いました。じっさい、赤崎さんのPOMUはAertsenのFINDとかとも相補的な関係にありそうですし。


お勧めエントリ


月別過去ログ