直交回帰のデータに関する考慮事項

有効な結果が確実に得られるようにするため、データの収集、分析の実行、結果の解釈時には、次のガイドラインを考慮してください。

データには測定誤差を含む連続予測変数が1つだけ含まれている
連続予測変数が1つあるものの、そこに測定誤差が含まれていない場合は、適合線プロットを使用します。
応答変数は連続量である

応答変数がカテゴリである場合、モデルは、データを正確に示すのにまたは有利な予測を行うのに、分析の仮説を満たしにくくなります。

測定の比較可能性を評価しない場合、代わりとなる以下の方法を検討できます。

  • 応答変数に、合格と不合格などの、2つのカテゴリが含まれている場合は、2値ロジスティックモデルの当てはめを使用します。
  • 応答変数に、まったくそう思わない、そう思わない、どちらともいえない、そう思う、とてもそう思うなど、自然な順序のカテゴリが3つ以上含まれている場合は、順位ロジスティック回帰を使用します。
  • 応答変数に、キズ、打痕、摩耗など、自然な順序ではないカテゴリが3つ以上含まれている場合は、名義ロジスティック回帰を使用します。
  • 応答変数で、欠陥数などの発生件数が数えられている場合は、ポアソンモデルの当てはめを使用します。
応答変数と予測変数における測定誤差分散比を指定する必要がある
誤差分散の推定値を取得する1つの方法としては、各変数で個別のゲージR&R研究を行うというものがあります。
実測値または予想される測定値の範囲を代表する測定単位を選択します
2つの計器または方法により測定値が比較可能かを検証するには、測定比較に必要なすべての値を代表する測定単位を選択します。その後、両方の計器または方法を使用して単位を測定します。
ベストプラクティスを使用してデータを収集する
結果が確実に有効になるようにするため、次のガイドラインについて考慮します。
  • データが対象の母集団を表すことを確認します。
  • 必要な精度を達成するために十分なデータを収集します。
  • 可能な限り正確かつ的確に変数を測定します。
  • データを収集した順序で記録します。
モデルがデータに良好に適合している

モデルがデータに適合しない場合、結果は、誤った認識を与える可能性があります。出力において、残差プロットおよび適合線プロットを使用して、モデルのデータへの適合度を判断します。