- 記事
- 人気
正確にp値を報告していますか?
一般的に、p値はグループや関係性における違いが、偶然によるものなのか、あるいは研究対象の変数によるものなのかを読者に指し示すものです。
ネイチャーを含むほとんどの統計ガイドラインによると、“有意”であると考えられる変化や差異、あるいは関連性にはp値を提供する必要があります。さらに、有意水準(有意か否かを決定する際のp値)は.05、.001 、あるいは.01でもありうるため、自分の論文のメソッドのセクションで、研究に使用された有意水準をはっきりと述べることが賢明です。「有意水準は.05と定めた」という一文があれば十分です。
しかしながら、p値は効果や変化、あるいは関係性の強さや大きさを読者に伝えるものではありません。したがって、ただp値のみを報告することは避けたほうが良いでしょう。検定統計量(t, F, Uなど)、相関関係、回帰係数(ピアソンの相関係数r、スピアマンの順位相関係数rhoなど)、あるいは効果量の尺度(イータ2乗、偏イータ2乗、オメガ2乗など)を一緒に提供することおすすめします。
「仕事の満足度と不安の間に有意な関係を発見した(p < .05)」という文を見てみましょう。
この場合、あなたが読者に伝えていることは、この関係性が偶然によるものとは考えにくいというに足る証拠を見つけたということのみです。
読者は、この関係性が正の関係なのか、逆の関係なのか(つまり、高い不安感を持つ被験者は仕事にも高い満足度を持つのか、あるいは不安感をあまり持たない被験者が仕事に高い満足度を持つのか)わかりません。
また、この関係性が強いものなのか弱いものかもわかりません。読者のために、相関係数をp値と共に報告しなければなりません。もしあなたが上記の文の最後に括弧で“r = -.78”と付け加えるなら、この関係が強い逆の関係であると読者は理解できるでしょう。その結果、彼らはあなたの研究成果をより良く理解できます。
「事前テストと事後テストの間にスコアの有意を発見した」という文はどうでしょう。この場合、(a)この差異を検証するためにあなたがどんな統計テストを実施したかがわかるよう、統計テストの方法と、(b)この差異がどれほど大きいなものか読者が理解できるよう、効果量の尺度の2点を報告することをおすすめします。事前テストと事後テストそれぞれの平均値でさえ、あなたが発見した効果量を理解するのに十分の場合もあります。
さらに、厳密なp値を報告することは良いアイデアです。というのも、こうした実践は科学をより厳密なものにすることに貢献するといえます。
p < .05とあれば、このp値は“.048”かもしれません。この値は厳密には“.05”以下という意味ですが、.05に非常に近いため、統計的に有意とは言えないp値0.51のように扱う必要があるかもしれないからです。典型的には、もし厳密なp値が.001以下であれば、ただ“p < .001”と提示するだけでよいです。そうでなければ、厳密なp値を報告すべきだし、とりわけ研究における主要な結果に対してはそうすべきでしょう。
ここで、私がよくお目にかかるp値に関する基本的な間違いをいくつか挙げてみましょう。
1. “p = .00” or “p < .00”
厳密に言って、p値が0と等しくなることはない。統計プログラムの中には、.000のp値を出すものがあるが、これは自動的な四捨五入によるものか、あるいは小数点以下の表示されているところで省略されているためです。したがって、”p=.000”を“p< .001”に表記し直してはどうでしょう。後者の方がより好ましいとされるし、報告されたp値の重要性を大きく変えるものでもないからだ。また、p値は常に0と1の間にあり、マイナスになることはないでしょう。
2. “p < .03”
多くのジャーナルは、“p < .05” 、“p < .01”、あるいは“p < .001” といったようにアルファ値(統計的有意水準)との関係で表示されるp値を受け入れているでしょう。これらは、“p = .03” または “p = .008”といったように絶対値として表現することもできます。しかしながら、不等式(>あるいは<)に続く値がアルファ値ではない時には、通常、p値はこうした記号とともには使われません。
以上、p値について解説しました。p値の報告の仕方を改善できるか、論文の結果報告部分をチェックすることをおすすめします。もしご意見・ご感想がありましたら、コメント欄より質問を受け付けます!
おすすめ関連記事:
引用測定はどのように研究のインパクトを測るのに役立つか
引用を使った尺度(citation metrics)の乱用に反対の立場
コメントを見る