完全枝分かれ分散分析のデータに関する考慮事項

有効な結果が確実に得られるようにするため、データの収集、分析の実行、結果の解釈時には、次のガイドラインを考慮してください。

データにはランダムで枝分かれしたカテゴリ因子のみが含まれている

計画に共変量、固定因子、または交差因子が含まれている場合は、一般線形モデルの適合を使用します。

因子の詳細は、因子と因子水準因子、交差因子、枝分かれ因子とは固定因子と変量因子の違いを参照してください。

計画は完全に枝分かれしている必要がある
Minitabでは、階層的に完全に枝分かれしたモデルが、因子ボックス内の因子の順序に従って実行される枝分かれに適合します。因子A B Cを入力する場合、モデルの項は次のようになります。
  • A
  • Aで枝分かれしたB
  • Aで枝分かれしたBで枝分かれしたC
釣り合い型分散分析(ANOVA)とGLMの場合は、枝分かれを指定する必要はありません。

枝分かれは釣り合い型である必要はありません。枝分かれ因子には、枝分かれ因子のある水準で少なくとも2水準なければなりません。因子Bが因子A内で枝分かれしている場合、それぞれのAの水準内にBの不等水準がある可能性があります。また、Bの水準の識別に使われる見出しは、それぞれのAの水準と異なることもあります。ただし、完全な枝分かれ計画が不釣り合いである場合、Minitabでは、Fやp値は計算できません。

Minitabでは、完全枝分かれ分散分析のすべての計算に逐次(Type I)平方和を使用します。調整平方和を使う場合は、一般線形モデルの適合を使用してください。

計画が完全に枝分かれしていない場合は、一般線形モデルの適合を使用します。

応答変数は連続量である
応答変数がカテゴリである場合、モデルは、データを正確に示すのにまたは有利な予測を行うのに、分析の仮説を満たしにくくなります。
  • 応答変数に、合格と不合格などの、2つのカテゴリが含まれている場合は、2値ロジスティックモデルの当てはめを使用します。
  • 応答変数に、まったくそう思わない、そう思わない、どちらともいえない、そう思う、とてもそう思うなど、自然な順序のカテゴリが3つ以上含まれている場合は、順位ロジスティック回帰を使用します。
  • 応答変数に、キズ、打痕、摩耗など、自然な順序ではないカテゴリが3つ以上含まれている場合は、名義ロジスティック回帰を使用します。
  • 応答変数で、欠陥数などの発生件数が数えられている場合は、ポアソンモデルの当てはめを使用します。
各観測値は他のすべての観測値から独立している
観測値が従属している場合、結果は有効ではない可能性があります。以下の点を考慮して、観測値が独立しているかどうか判断します。
  • ある観測値に別の観測値の値に関する情報が含まれていない場合、それらの観測値は独立しています。
  • ある観測値に別の観測値に関する情報が含まれている場合、それらの観測値は従属しています。
標本データは無作為に選択される

無作為標本を使用して母集団についての一般化または推定を行います。データが無作為に収集されていなければ、結果は母集団とならない可能性があります。

ベストプラクティスを使用してデータを収集する
結果が確実に有効になるようにするため、次のガイドラインについて考慮します。
  • データが対象の母集団を表すことを確認します。
  • 必要な精度を達成するために十分なデータを収集します。
  • 可能な限り正確かつ的確に変数を測定します。
  • データを収集した順序で記録します。
モデルがデータに良好に適合している

モデルがデータに適合しない場合、結果は、誤った認識を与える可能性があります。出力において、残差プロットを使用して、モデルのデータへの適合度を判断します。