ウェビナー「データ分布を読み解く」で寄せられた質問6選

ウェビナー「データ分布を読み解く」で寄せられた質問6選

統計分析におけるデータ分布の記述と説明をテーマに開催された2月28日のウェビナーには、世界中から多くの方にご参加頂きました。講師を務めたJacob Wickham博士(Integrative Zoology誌編集長/中国科学院動物学研究所助教授)には、専門家の立場から、統計分析におけるデータ分布の重要性、さまざまな種類のデータ分布、中心的傾向と変動性の測定、実社会での応用のベストプラクティスについて詳しくお話し頂きました。

 

この記事では、参加者から寄せられた6つの質問と、それに対するWickham博士の回答をまとめました。ウェビナーの内容を振り返りたい方も、ウェビナーを見逃した方も、ぜひお読みください。ウェビナー全体はこちらからご覧頂けます。
 

 

Q. パラメトリック検定を行うときと、ノンパラメトリック検定を行うときの違いは何ですか?

パラメトリック検定とノンパラメトリック検定のどちらを使うかは、仮定の通りになっているかどうかで見極めます。t検定や分散分析(ANOVA)などのパラメトリック検定では、データが正規分布になっていると仮定しますが、その場合は等分散性と不等分散性があります。仮定の通りになっていなければ、ノンパラメトリック検定に切り替える必要があります。つまり、データの分析を始める前に、Shapiro Wilke(シャピロ–ウィルク)検定やLevine(ルビーン)検定を行なって、データが正規分布になっているか、等分散かどうかを確認する必要があります。データが正規分布でなくても心配は無用です。ノンパラメトリック検定に切り替えて分析を行いましょう。ノンパラメトリック検定でも、ジャーナルには問題なく許容されます。

 

Q.  統計の基本的概念を理解するためのおすすめのウェブサイトはありますか?

Shapunov博士のウェブサイトを参照してみてください。ここでは、さまざまな統計の概要と、特定の分析手法を選ぶ理由のほか、主要なコンセプトについての解説も載っています。「Biometry」は生物学分野における統計の一般的なテキストですが、統計学の基礎を理解するのに役立ちます。「Applied Multivariate Statistical Analysis」という書籍もおすすめです。この2冊は、私が学部、修士課程、博士課程のときに使っていたものです。ありがたいことに、統計学は変化しないのです。独立した学問分野である統計は、生物学、化学、工学、社会科学など、さまざまな分野で利用されていますが、このことは統計の偉大さを表していると思います。

 

Q. 実験室条件で実施された実験のデータは、どのような場合に変換する必要がありますか?

データが対数分布や指数分布のときに、データの変換を行う場合があります。実行可能なデータ変換を行なって、データがより正規分布に近づくようにできるということです。統計の教科書では、データ分析の前にデータ変換を行うと説明している場合もあります。

 

Q. 非臨床試験でのボンフェローニ補正はいつ行えばいいですか?具体例で教えてください。

例えば、ANOVAを適切に実施せず、10回のt検定を行なったとします。このようなときにボンフェローニ補正を行うとよいでしょう。この場合、具体的には、p値を決めて10で割ります。これは、ANOVAを行う必要があるところで10回のt検定を行なったためで、t検定の過剰な使用を回避するための適切な方法です。もう一つ例を示しましょう。私は博士論文で、3~4グループと2種類の治療法をテストする組み合わせの数を比較しました。比較できる組み合わせの数を、ここでは仮に12としておきましょう。p値は0.05とし、それを12で割って、新しいp値とします。p値ははるかに低い値となり、データの有意性を示すことができました。

 

Q. タイプ1エラーかタイプ2エラーかの判断はいつしますか?

有意水準(α) 0.05では、タイプ1とタイプ2の両方のエラーを考慮に入れます。α値がごく小さい場合、たとえば0.01の場合、実際には2つの母集団の平均に違いがある可能性がありますが、α値が小さすぎるため、違いを検出できません。0.05は、タイプ1とタイプ2の誤差の実質的な中間点もしくは妥協点と言えます。どちらのタイプのエラーもあり得ることを認識しておけばよいでしょう。

 

Q. 正規分布でも等分散でもない場合のみ、パラメトリック検定ではなくノンパラメトリック検定を行えばいいのでしょうか。

必ずしもそうではありません。Wilcoxon(ウィルコクソン)の順位のようなカテゴリカルデータがある場合は、本質的にノンパラメトリック検定になります。また、カイ二乗検定もカテゴリカルデータに基づいているので、ノンパラメトリック検定だと思います。つまり、正規分布や等分散性とは関わりなく、ノンパラメトリック検定を行うことになるケースがあります。

 

 

統計の専門家からのアドバイスが必要な方は、エディテージのStatistical Analysis & Reviewサービスのご利用をご検討ください。今なら無料相談を受付中です(2023年 3月31日まで)。

学術界でキャリアを積み、出版の旅を歩もうとしている皆様をサポートします!

無制限にアクセスしましょう!登録を行なって、すべてのリソースと活気あふれる研究コミュニティに自由に参加しましょう。

ソーシャルアカウントを使ってワンクリックでサインイン

5万4300人の研究者がここから登録しました。

便利さを実感して頂けましたか?

あなたの周りの研究者にもぜひご紹介ください


このコンテンツは「研究の実施」ステージに属しています。

研究を行うにあたっての基本を学びましょう。エキスパートによる無料の個別コーチングを受けましょう。