pooneilの脳科学論文コメント: Amazonのカスタマーレビューの「有用性の高い順」ってどうやって決めてる？

« この厳然たる事実を祝福しよう | 最新のページに戻る | そうして、このごろ1001 »

■ Amazonのカスタマーレビューの「有用性の高い順」ってどうやって決めてる？

Amazonで本を探したりするときにはレビューの文章をけっこう読んだりするのだけれども、あれは「このレビューが参考になった」の数に基づいた「有用性の高い順」でソートすることができる。そうするとしょうもないレビューを読まなくてすむ。まさにwisdom of clouds。

ところであの「有用性の高い順」ってどうやって決めてるんだろう？たとえばUSアマゾンのSlaughterhouse 5のレビューで、Most Helpful Firstでソートしてみると、一位が257/286 (全投票数286のうち、helpfulが257)で、次が212/236、67/75, 16/16, 28/31, という順番になっている。

一番のものから順番に、「helpfulに投票された比率」をプロットしてゆくと図のいちばん上のようになる。もしこの比率だけで並べられているならこんなにはデコボコにならない。

どうやら、「helpfulに投票された比率」だけではなくて、投票数も加味して順位を決めているっぽい。そりゃそうだよね。16/16と1/1ではデータの信頼度がぜんぜん違う。

そこで以前のエントリ(20090319)で作ったように、最尤法で95% credible intervalを計算してやって、エラーバーを付けてやったのが真ん中の図。それっぽくなってきた。ちなみにエラーバーが0-1になっているデータは0/0のもの。

「helpfulに投票された比率」は二項分布での最尤推定値だけど、そのかわりに尤度の分布で重み付き平均を計算して表示したのが下の図。(これをnon-informative priorでのベイズと捉えれば、前者がMAP推定に相当して、後者がベイズ推定に相当する。)

完全には同じでないのでなんかまだ違うことやっているようだけど、だいたい近づいたので満足した。

データ入りのmatlabスクリプトあり：sh5plot3.m ご自由にどうぞ。

…とここまで書いて、Amazonランキングの謎を解くという本があることを思い出した。関係あるんだろうか。まあいいや。(あとで図書館で見つけたが、売り上げランキングの話で、今回の話題とは関係なかった。)

余談だけど、順位が下のレビュー(helpfulの比率が10%以下)ってのはたいがいは読んでなくても書けるような文章、たとえば「退屈で難解、読む価値無し」みたいなやつだったりして、0/10とか付いても当然ってかんじでつまらん。でもたまにトラルファマドール星人に拉致られたとしか思えないようなものが見つかる。しかもレビューへのコメント欄が煽り合戦。まさに「いったい何と戦っているんだ」状態。

/ ツイートする
/ 投稿日: 2011年12月01日
/ カテゴリー: [雑記]
/ Edit(管理者用)

お勧めエントリ

細胞外電極はなにを見ているか(1) 20080727 (2) リニューアル版 20081107
総説長期記憶の脳内メカニズム 20100909
駒場講義2013 「意識の科学的研究 - 盲視を起点に」20130626
駒場講義2012レジメ意識と注意の脳内メカニズム(1) 注意 20121010 (2) 意識 20121011
視覚、注意、言語で3*2の背側、腹側経路説 20140119
脳科学辞典の項目書いた「盲視」 20130407
脳科学辞典の項目書いた「気づき」 20130228
脳科学辞典の項目書いた「サリエンシー」 20121224
脳科学辞典の項目書いた「マイクロサッケード」 20121227
盲視でおこる「なにかあるかんじ」 20110126
DKL色空間についてまとめ 20090113
科学基礎論学会秋の研究例会ワークショップ「意識の神経科学と神経現象学」レジメ 20131102
ギャラガー＆ザハヴィ『現象学的な心』合評会レジメ 20130628
Marrのrepresentationとprocessをベイトソン流に解釈する (1) 20100317 (2) 20100317
半側空間無視と同名半盲とは区別できるか？(1) 20080220 (2) 半側空間無視の原因部位は？ 20080221
MarrのVisionの最初と最後だけを読む 20071213

月別過去ログ

[2025]: 6|; 5|; 4|; 3|; 2|; 1|
[2024]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2023]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2022]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2021]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2020]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2019]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2018]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2017]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2016]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2015]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2014]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2013]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2012]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2011]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2010]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2009]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2008]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2007]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2006]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2005]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2004]: 12|; 11|; 10|; 9|; 8|; 7|; 6|; 5|; 4|; 3|; 2|; 1|
[2003]: 12|; 11|; 8|; 7|
[2001]: 10|; 8|; 6|; 5|; 4|; 2|
[2000]: 12|; 9|; 8|; 7|; 6|; 3|; 2|; 1|
[1999]: 9|; 8|; 7|