一般線形モデルの適合のデータに関する考慮事項

有効な結果が確実に得られるようにするため、データの収集、分析の実行、結果の解釈時には、次のガイドラインを考慮してください。

データにはカテゴリ因子が1つ以上含まれている

カテゴリ因子は、交差因子および枝分かれ因子、また固定因子および無作為因子である可能性があります。

応答変数は連続量である

応答変数がカテゴリである場合、モデルは、データを正確に示すのにまたは有利な予測を行うのに、分析の仮説を満たしにくくなります。

相関していて、共通の因子セットである多重応答変数がある場合、強力で多変量応答パターンを検出可能な一般多変量分散分析を使用します。
応答変数に、合格と不合格などの、2つのカテゴリが含まれている場合は、2値ロジスティックモデルの当てはめを使用します。
応答変数に、まったくそう思わない、そう思わない、どちらともいえない、そう思う、とてもそう思うなど、自然な順序のカテゴリが3つ以上含まれている場合は、順位ロジスティック回帰を使用します。
応答変数に、キズ、打痕、摩耗など、自然な順序ではないカテゴリが3つ以上含まれている場合は、名義ロジスティック回帰を使用します。
応答変数で、欠陥数などの発生件数が数えられている場合は、ポアソンモデルの当てはめを使用します。

各観測値は他のすべての観測値から独立している

観測値が従属している場合、結果は有効ではない可能性があります。以下の点を考慮して、観測値が独立しているかどうか判断します。

標本データは無作為に選択される

無作為標本を使用して母集団についての一般化または推定を行います。データが無作為に収集されていなければ、結果は母集団とならない可能性があります。

ベストプラクティスを使用してデータを収集する

結果が確実に有効になるようにするため、次のガイドラインについて考慮します。

多重共線性としても知られる予測変数間の相関は重度ではない

多重共線性が極端である場合、どの予測変数をモデルに含むべきか判断できないことがあります。多重共線性の大きさを判断するには、出力に含まれる係数表の分散拡大係数（VIF）を使用します。

モデルがデータに良好に適合している

モデルがデータに適合しない場合、結果は、誤った認識を与える可能性があります。出力において、残差プロット、異常観測値の診断統計量、モデル要約統計量を使用して、モデルのデータへの適合度を判断します。