« Online journalサイトへの悪口つづき | 最新のページに戻る | JNP 統計の使い方のガイドライン »

■ JNP 統計の使い方のガイドライン

いつもどおりサッポロ一番塩ラーメンをラボのお茶部屋で作って食べながらJNPをぴらぴらめくっていたら、重要そうなのがあるではないですか。こういうことがあるから紙のジャーナルを置いておく価値があるってもんですよ。

JNPのeditorialより。

"Guidelines for reporting statistics in journals published by the American Physiological Society."

JNPを出版しているAmerican Physiological Societyが統計の使い方についてのガイドラインを出しています。簡単にまとめ。

  1. 実験を計画する際に(使うべき統計などに)不明な点があったら統計学者に相談すること。
  2. 有意度水準αは目的にあったものを選んでそれを明示し、正当性を与える。
  3. どういう統計方法を使ったか、どういう統計パッケージを使ったかをわかるようにしなさい。
  4. 多重比較を統制しなさい。
  5. (5) データのばらつきはseではなくてsdを使って示しなさい。
  6. 見出した統計結果の不確かさは信頼区間を使って示しなさい。
  7. 正確なP-valueを示しなさい(P<0.05ではなくてP=0.023とか)。
  8. 統計結果の数字には科学的に意味のある有効数字までを表示しなさい。
  9. 要旨ではmain resultのそれぞれに正確なP-valueと信頼区間を示しなさい。
  10. Main resultのそれぞれの解釈には正確なP-valueと信頼区間を用いなさい。

私の印象というかコメント:

(2)に関して、P<0.05を無差別に使うのはよくないとして、P<0.01やP<0.10を使った方がよいことを示しています。たしかに、0.05<P<0.10に位置するものはpotentialには帰無仮説がrejectされる可能性があるものといえますが(ゆえに、有意でないときはP>0.10であることを示さないと、例数が足りなくて有意に出なかっただけではないかと疑われる)、もし論文のmain resultのPがα=0.10で書いてあったらかなり信頼性落ちると思います。しかもそれが(3)の問題をviolateしていて、たとえばsubject間のばらつきを考慮せずに単にノンパラとかの比較をしているとしたら、私だったら認めないです。

(4)は私がこの場で何度も書いていることです。実際にはかなりややこしい問題があることもこれまで述べた通り。

(5)、これなんですが、データのばらつきはたとえばsingle-unitの論文のtableとかではすでにみんなstandard deviationの方を使っていると思うのですよ。その一方で、平均値の比較とかで使うエラーバーはみんなseを使っていますよね。それはもちろん、平均値の比較をしたいときにはそのグループのデータの平均値のばらつきを見たいからであって、データ自体のばらつきを見たいわけではないからなのです。このようなseの使い方には問題がないと思うのですがね。このへん、ガイドラインではどう考えているのだろう、というと:

(6) seではなくて、平均値の信頼区間の方を使え、ということのようなのですね。たとえば、multipe regressionとかでの個々のb (それぞれのregressorのcoefficient)を評価するのに信頼区間を使う(bの信頼区間が0にかかっていないことを示す)、というのはいいと思うんだけど、上述の平均の差の検定のときはどうすればよいんだろう? 平均の差の信頼区間を作ってそれが0にかかっていないことを示す? とりあえず、conventionalなbar chartにエラーバーという図にはまったく馴染まないですが。

(7) 私はいままでP=0.019とかいう書き方をしてきましたが、有意でない方に関してはP>0.10とかF<1とかでよいと思うんです。P>0.90とか書いているのを見かけることがあって、それって片側検定してるせいじゃん、とか思ったりしますけど。 …こんな感じです。明日続き貼ります。


お勧めエントリ


月別過去ログ