一元配置分散分析(ANOVA)のデータに関する考慮事項

有効な結果が確実に得られるようにするため、データの収集、分析の実行、結果の解釈時には、次のガイドラインを考慮してください。

データには固定因子であるカテゴリ変数が1つだけ含まれている

因子についての詳細は、「因子と因子水準」および「固定因子と変量因子」を参照してください。

応答変数は連続量である
応答変数がカテゴリである場合、モデルは、データを正確に示すのにまたは有利な予測を行うのに、分析の仮説を満たしにくくなります。
  • 応答変数に、合格と不合格などの、2つのカテゴリが含まれている場合は、2値ロジスティックモデルの当てはめを使用します。
  • 応答変数に、まったくそう思わない、そう思わない、どちらともいえない、そう思う、とてもそう思うなど、自然な順序のカテゴリが3つ以上含まれている場合は、順位ロジスティック回帰を使用します。
  • 応答変数に、キズ、打痕、摩耗など、自然な順序ではないカテゴリが3つ以上含まれている場合は、名義ロジスティック回帰を使用します。
  • 応答変数で、欠陥数などの発生件数が数えられている場合は、ポアソンモデルの当てはめを使用します。
標本データを正規母集団から取得するか、または各標本を15または20より大きくする

サンプルサイズが15や20より大きい場合、この検定は歪んだ分布と非正規分布の場合に非常に良好な結果が得られます。サンプルサイズが15や20より小さい場合、非正規分布で結果は誤解を招くものとなる可能性があります。

必要とされる実際のサンプルサイズは、以下のように、データに含まれるグループの数によって決まります。
  • 2~9のグループがある場合、各グループのサンプルサイズは15以上でなければなりません。
  • 10~12のグループがある場合、各グループのサンプルサイズは20以上でなければなりません。

データが正規分布に従っていること、標本サイズのガイドラインに適合していることに自信が持てない場合は、クラスカル-ワリス検定を使用します。

各観測値は他のすべての観測値から独立している
観測値が従属している場合、結果は有効ではない可能性があります。以下の点を考慮して、観測値が独立しているかどうか判断します。
  • ある観測値に別の観測値の値に関する情報が含まれていない場合、それらの観測値は独立しています。
  • ある観測値に別の観測値に関する情報が含まれている場合、それらの観測値は従属しています。

従属観測値がある場合は反復測定計画の分析を参照してください。サンプルについての詳細は、「従属サンプルと独立サンプルの違い」を参照してください。

ベストプラクティスを使用してデータを収集する
結果が確実に有効になるようにするため、次のガイドラインについて考慮します。
  • データが対象の母集団を表すことを確認します。
  • 必要な精度を達成するために十分なデータを収集します。
  • 可能な限り正確かつ的確に変数を測定します。
  • データを収集した順序で記録します。
モデルがデータに良好に適合している

モデルがデータに適合しない場合、結果は、誤った認識を与える可能性があります。出力において、残差プロット、異常観測値の診断統計量、モデル要約統計量を使用して、モデルのデータへの適合度を判断します。