« Neuron 5/27 | 最新のページに戻る | いつもググって探すので貼っとこ。 »

■ "はてなアンテナ被登録数"

2004-07-20a.gif

Figure 1

"はてなアンテナ被登録数"の統計が出ていたのでヒストグラムを書いてみました(図1)。横軸ははてなアンテナ被登録数(logスケール。0と1はomitしてあります)で、縦軸はそれぞれの横軸に該当するidの数です。それぞれのプロットは1月から7月までの毎月の計測データで、色分けしてませんが、だんだん増える方向にあります。注目する点としては、分布の形自体は変化がないのですね。

2004-07-20b.gif

Figure 2

というわけでこれをcumulative plotにしたのが図2です。横軸は図1と同じで0と1は計算から除外しています。縦軸Pは累積データの全体のデータに占める割合です。スケールはprobitスケール、つまりP-valueをZ valueに変換したものです(MATLABでいうところのnorminv(P,0,1))。もし分布がgaussianならこのプロットは直線になります。じっさいにはpoisson-likeですが。青線は各月のデータですが、ほとんど重なっていることがわかります。赤丸を赤線でつないだid:pooneilは順調に被登録数を上げていき、7月現在で上位10%まで来てます。専門的なサイトにしては健闘していると言えるでしょう。

コメントする (3)
# ガヤ

おっと?これは思わず書き込みせずにはいられない統計処理(笑) 0と1が省略されているのでなんとも言えませんが、2エッジ以上を見る限り期待通りスケール・フリーっぽいですね。各月の折れ線が重なっているのにも、その特徴が現れているかと。

# ryasuda

Poissonになるってのは面白いですね。全員がランダムにリンクしたとしても、ポアソン的になりそう。

# pooneil

>>ガヤ なるほど、scale-freeの話でしたねこれは。というわけで7/21のところでやってみました。けっこうきれいにいきました。>>ryasudaさん、はじめまして。日記見にいってます。アメリカでラボを持つことに関する貴重な資料だと思っております。これからもよろしくお願いします。それから、分布がpoissonだというのは私の早とちりでした。全員がランダムにリンクしたときには今回の分布のような100以上のリンクを持つサイトができることはない、というあたりも7/21で検証してみました。よければご覧ください。


お勧めエントリ


月別過去ログ