多重共線性を測定するには、予測変数の相関の構造を調べます。また、モデル内の回帰係数の分散拡大係数(VIF)を調べることもできます。分散拡大係数は、予測変数間に相関がある場合に推定された回帰係数の分散がどれだけ増加するかを測定するものです。すべてのVIFが1の場合は多重共線性はありませんが、一部のVIFが1よりも大きい場合は予測変数が相関しています。VIFが5より大きい場合、その項の回帰係数は適切に推定されません。
多重共線性の別な測定値は条件数です。Minitabでは、べストサブセット回帰の拡大版の表に条件数が表示されます。条件数では、個々の項ではなくモデル全体の多重共線性を評価します。条件数が多くなると、モデル内の項の多重共線性も大きくなります。Montgomery、PeckおよびVining(1 )では、条件数が100よりも多い場合は多重共線性が中程度であることを示しています。多重共線性が中程度または低い場合は、VIFとデータの相関構造を使用してモデル内の項間の関係を調査する必要があります。
予測変数の他の予測変数との相関がほぼ完全である場合、項を推定できないというメッセージが表示されます。推定できない 項のVIF値は通常、10億を超えます。
多重共線性は、適合度および予測の良さには影響しません。係数(線形判別関数)について信頼性の高い解釈を行うことはできませんが、適合値(分類された値)は影響を受けません。
多重共線性は、判別分析に回帰と同じような影響を与えます。
たとえば、あるおもちゃメーカーが、顧客満足度を予測しようとしています。回帰モデルに「強度」と「壊れにくさ」を予測変数として取り込みます。調査員は、これらの2つの変数の間に強い負の相関があり、VIFが5より大きいと判断します。ここで、調査員は変数のいずれかを削除することができます。また、PLSまたは主成分分析を使用して、これらの関連する変数を使用して「耐久性」成分を作成することもできます。