クラスカル-ワリス検定のデータに関する考慮事項

有効な結果が確実に得られるようにするため、データの収集、分析の実行、および結果の解釈時には、次のガイドラインを考慮してください。

Kruskal-Wallis検定の代わりの方法としてパラメトリック分析を使用する場合は、データがその分析のデータ要件を満たすことを検証する必要があります。パラメトリック分析のデータ要件は、Kruskal-Wallis検定などのノンパラメトリック分析の要件といつでも両立するとは限りません。

データには固定因子であるカテゴリ変数が1つだけ含まれている

要因についての詳細は、「因子と因子水準」および「固定因子と変量因子」を参照してください。

応答変数は連続量である
応答変数がカテゴリの場合、モデルが分析の前提条件を満たしたり、データを正確に表したり、または有効な予測を行ったりする確率は低くなります。
  • 応答変数に合格や不合格などの2種類のカテゴリが含まれる場合は、2値ロジスティックモデルを適合を使用します。
  • 応答変数に、「強く反対」「反対」「どちらでもない」「同意」「強く同意」などの自然律に従うカテゴリが3種類以上含まれている場合は、順位ロジスティック回帰を使用します。
  • 応答変数に、傷、へこみ、および裂け目などの自然律に従わないカテゴリが3種類以上含まれている場合は、名義ロジスティック回帰を使用します。
  • 応答変数で欠陥の数などの出現数を数える場合は、適合ポアソンモデルを使用します。
サンプルデータが正規分布になっている必要はない
グループの分布は、形状および広がりが同じで、外れ値を含まないようにする必要があります。
  • グループの分布に外れ値が含まれている場合は、ムードの中央値検定を使用します。
  • グループの分布が正規分布になっている場合は、検出力が高い一元配置分散分析を使用することを考慮します。
サンプルサイズを15または20未満の観測数にするか、工程が中央値によって適切に代表されるようにする

ノンパラメトリック検定はパラメトリック検定に比べて検出力が低い傾向にあります。また、パラメトリック検定はサンプルサイズが十分に大きい場合に非正規データで良好な結果を得られます。サンプルサイズが非常に小さかったり、分析において中央値が有意であるなどでなければ、非正規データの場合でもパラメトリック検定の実行を検討してください。

データが次のサンプルサイズのガイドラインを満たしている場合は、歪んだ分布と非正規分布の場合に非常に良好な結果が得られ、検出力も高いことから、一元配置分散分析の使用を考慮してください。
  • データには2~9のグループが含まれており、各グループのサンプルサイズは15以上です。
  • データには10~12のグループが含まれており、各グループのサンプルサイズは20以上です。
各グループのサンプルサイズは、5以上にする必要がある
サンプルに含まれる観測値の数が5より少ない場合は、p値が不正確になる可能性があります。
各観測値は他のすべての観測値から独立している
観測値が従属している場合、結果は有効ではない可能性があります。以下の点を考慮して、観測値が独立しているかどうか判断します。
  • ある観測値に別の観測値の値に関する情報が含まれていない場合、それらの観測値は独立しています。
  • ある観測値に別の観測値に関する情報が含まれている場合、それらの観測値は従属しています。

従属観測値がある場合は反復測定計画の分析を参照してください。サンプルに関する詳細は、従属サンプルと独立サンプルの違いを参照してください。

ベストプラクティスを使用してデータを収集する
結果が確実に有効になるようにするため、次のガイドラインについて考慮します。
  • データが対象の母集団を表すことを確認します。
  • 必要な精度を達成するために十分なデータを収集します。
  • 可能な限り正確かつ高精度に変数を測定します。
  • データを収集した順序で記録します。
本サイトを使用すると、分析およびコンテンツのカスタマイズのためにクッキーが使用されることに同意したことになります。  当社のプライバシーポリシーをご確認ください