一般線形モデルを適合のデータに関する考慮事項

有効な結果が確実に得られるようにするため、データの収集、分析の実行、および結果の解釈時には、次のガイドラインを考慮してください。

データにはカテゴリ因子が1つ以上含まれている

カテゴリ因子は、交差して枝分かれした因子と、固定されたランダム因子にすることができます。

  • モデルに変量因子がある場合、通常は、制限付き最尤法(REML)を利用できるように混合効果モデルを適合を使用します。
  • カテゴリ因子が1つあり、連続予測変数がない場合は、一元配置分散分析を使用します。
  • 主に連続予測変数を使用する場合は、適合回帰モデルによって類似のモデルを得ることができます。
  • カテゴリ因子が1つか2つあり、水準平均を、正規分布、二項分布、またはポアソン分布に従うデータの全体平均と比較する場合は、平均の分析を使用します。
  • グループ間の標準偏差の同等性を検定する場合は、等分散性検定を使用します。

因子に関する詳細は、因子と因子水準, 因子、交差因子、枝分かれ因子とは、および固定因子と変量因子の違いを参照してください。

応答変数は連続量である
応答変数がカテゴリの場合、モデルが分析の前提条件を満たしたり、データを正確に表したり、または有効な予測を行ったりする確率は低くなります。
  • 相関している複数の応答変数、および共通の因子セットが1組ある場合は、一般多変量分散分析を使用します(このコマンドのほうが検出力があり、多変量応答パターンを検出できます)。
  • 応答変数に合格や不合格などの2種類のカテゴリが含まれる場合は、2値ロジスティックモデルを適合を使用します。
  • 応答変数に、「強く反対」「反対」「どちらでもない」「同意」「強く同意」などの自然律に従うカテゴリが3種類以上含まれている場合は、順位ロジスティック回帰を使用します。
  • 応答変数に、傷、へこみ、および裂け目などの自然律に従わないカテゴリが3種類以上含まれている場合は、名義ロジスティック回帰を使用します。
  • 応答変数で欠陥の数などの出現数を数える場合は、適合ポアソンモデルを使用します。
各観測値は他のすべての観測値から独立している
観測値が従属している場合、結果は有効ではない可能性があります。以下の点を考慮して、観測値が独立しているかどうか判断します。
  • ある観測値に別の観測値の値に関する情報が含まれていない場合、それらの観測値は独立しています。
  • ある観測値に別の観測値に関する情報が含まれている場合、それらの観測値は従属しています。
サンプルデータはランダムに選択される

ランダムサンプルを使用して母集団についての一般化または推定を行います。データがランダムに収集されていなければ、結果は母集団とならない可能性があります。

ベストプラクティスを使用してデータを収集する
結果が確実に有効になるようにするため、次のガイドラインについて考慮します。
  • データが対象の母集団を表すことを確認します。
  • 必要な精度を達成するために十分なデータを収集します。
  • 可能な限り正確かつ高精度に変数を測定します。
  • データを収集した順序で記録します。
多重共線性としても知られる予測変数間の相関は重度ではない

多重共線性が極端である場合、どの予測変数をモデルに含むべきか判断できないことがあります。多重共線性の大きさを判断するには、出力に含まれる係数表の分散拡大係数(VIF)を使用します。

モデルがデータに良好に適合している

モデルがデータに適合しない場合、結果は、誤った認識を与える可能性があります。出力において、残差プロット、異常観測値の診断統計量、およびモデル要約統計量を使用して、モデルのデータへの適合度を判断します。

本サイトを使用すると、分析およびコンテンツのカスタマイズのためにクッキーが使用されることに同意したことになります。  当社のプライバシーポリシーをご確認ください