« 論文いろいろ | 最新のページに戻る | フールプルーフ »

■ PubMed2.0

本読んでて思ったんだけど、Googleのpagerankみたいに、論文のcitationにかんしても論文単位で評価するのってないんですかね。もちろん、web of scienceみたいなやつはあって、referされた回数というやつが個々の論文で評価されるわけだけど、それだけでなく、referenceのグラフ構造みたいなものからデータマイニングの手法を使ってわかることがあるのではないかと。

たとえば、論文間の近接度からオリジナリティがどのくらいあるかを評価したり、新しい領域を作り出した論文による新しいクラスターの形成とかも見えるだろうし、この論文が引くべき論文を引いていないとか、個々の論文からではわからないことが見えてきそうだし。

もちろん、さいきん増えてきた、この論文はこれらの論文からreferされてます、というようなのは非常に有用ですが、このへんはもっと進歩するのではないかと思うのですね。

論文のreferenceにかんして、webでのページランクと違う点として、

  • 論文では新しい論文によるリンクの付加しかない。
  • author自体にも、overlapは離合集散があって、small world的構造がある
  • 全く同じ内容のものがあってはならない。オリジナリティがなければならない

というあたりがあるわけで、このへんを加味して考えると、pagerank的なものをたんに論文のreferenceにかんしても作ってみました、というのよりもおもしろくなりそうです。というかこういうことはどっかでやられているんでしょう。

全く同じ内容のものがあってはならない、という拘束条件によって類似度の高いものについては新しい方の重みを下げる、とかすると、オリジナルペーパーとレビューとをまとめて一つの仕事として捉えることに寄与しそうだし、二番煎じ的論文はその素性がばれやすくなるということでもあります。

そもそもpagerankからしてそうなんだけれど、「内容は全く問わずにリンクだけで評価できる」というところが重要なのであって、これらはすべて内容を読んで新しい論文を作成してゆく人たちによって補完され、データが付加されてゆくわけです。あとはこれにF1000やconnoteaでのタグ付けなど、論文の執筆者ではなくて読者によるデータが付加されて統合されることによって「PubMed2.0」とでもいえる状況になるといえるでしょう。やっぱり、webとちがって、読者によるデータの付加というところがむつかしい。

つれづれと。

コメントする (1)
# tny

こんにちは。はじめまして。
最近、Web 2.0的論文査読システムのことを考えていました(http://d.hatena.ne.jp/tny/20051108/1131545621)。

こちらのエントリーを読んで、論文の評価システムも考えなくてはいけないのだな、と気がつきました。どうもありがとうございます。

#Google Scholarというのがあれば、はてなスカラーというのもあってもよいかな、と考えてみたりして(笑)


お勧めエントリ


月別過去ログ