バランス型分散分析（ANOVA）のデータに関する考慮事項

有効な結果が確実に得られるようにするため、データの収集、分析の実行、結果の解釈時には、次のガイドラインを考慮してください。

データにはカテゴリ因子のみが含まれている

計画に共変量が含まれている場合は、一般線形モデルの適合を使用します。

カテゴリ因子は、交差因子および枝分かれ因子、また固定因子および無作為因子である可能性があります。

因子の詳細は、因子と因子水準、因子、交差因子、枝分かれ因子とは、固定因子と変量因子の違いを参照してください。

計画は、一元配置計画がない場合、釣り合い型にする必要がある

釣り合い型計画には、各処理の組み合わせで同じ観測数がなければなりません。

釣り合い型データの条件は、枝分かれ因子にも拡張されます。Aに3つの水準があり、BがAの中で枝分かれしている場合を考えてみます。Aの最初の水準の中でBに4つの水準がある場合、Aの2番目の水準と3番目の水準でもBは4つの水準を持つ必要があります。Minitabでは、不釣り合いな枝分かれがある場合はメッセージが表示されます。データが釣り合い型であるという条件は、欠損データが省略されたあとで保持される必要があります。

計画が不釣り合いな場合は、一般線形モデルの適合を使用します。

バランス型計画に関する詳細については、バランス型計画とアンバランス型計画を参照してください。

枝分かれ因子では、同じ見出しセットを使用する必要がある

Aの各水準にあるBの4つの水準は、同じ見出しを使って示されなければなりません。したがって、Bの4つの水準は、Aの水準1で(1 2 3 4)、Aの水準2で(5 6 7 8)、Aの水準3で(9 10 11 12)となることはありません。

応答変数は連続量である

応答変数がカテゴリである場合、モデルは、データを正確に示すのにまたは有利な予測を行うのに、分析の仮説を満たしにくくなります。

応答変数に、合格と不合格などの、2つのカテゴリが含まれている場合は、2値ロジスティックモデルの当てはめを使用します。
応答変数に、まったくそう思わない、そう思わない、どちらともいえない、そう思う、とてもそう思うなど、自然な順序のカテゴリが3つ以上含まれている場合は、順位ロジスティック回帰を使用します。
応答変数に、キズ、打痕、摩耗など、自然な順序ではないカテゴリが3つ以上含まれている場合は、名義ロジスティック回帰を使用します。
応答変数で、欠陥数などの発生件数が数えられている場合は、ポアソンモデルの当てはめを使用します。

各観測値は他のすべての観測値から独立している

観測値が従属している場合、結果は有効ではない可能性があります。以下の点を考慮して、観測値が独立しているかどうか判断します。

ある観測値に別の観測値の値に関する情報が含まれていない場合、それらの観測値は独立しています。
ある観測値に別の観測値に関する情報が含まれている場合、それらの観測値は従属しています。

標本データは無作為に選択される

無作為標本を使用して母集団についての一般化または推定を行います。データが無作為に収集されていなければ、結果は母集団とならない可能性があります。

ベストプラクティスを使用してデータを収集する

結果が確実に有効になるようにするため、次のガイドラインについて考慮します。

データが対象の母集団を表すことを確認します。
必要な精度を達成するために十分なデータを収集します。
可能な限り正確かつ的確に変数を測定します。
データを収集した順序で記録します。

モデルがデータに良好に適合している

モデルがデータに適合しない場合、結果は、誤った認識を与える可能性があります。出力において、残差プロットおよびモデル要約統計量を使用して、モデルのデータへの適合度を判断します。