Para medir multicolinearidade, você pode examinar a estrutura de correlação das variáveis preditoras. Os fatores de inflação da variância (VIFs) dos coeficientes de regressão no modelo. Os VIFs medem o quanto a variância de um coeficiente de regressão estimado aumenta se seus preditores estão correlacionados. Se todos os VIFs forem 1, não há multicolinearidade, mas se alguns VIFs forem maiores do que 1, os preditores estão correlacionados. Quando um VIF é 5 > 10, o coeficiente de regressão para esse termo não é estimado de maneira apropriada.
Outra medida de multicolinearidade é o número da condição. O Minitab fornece o número da condição na tabela expandida para a regressão de melhores subconjuntos. O número da condição avalia a multicolinearidade para um modelo inteiro em vez de termos individuais. Quanto maior o número da condição, maior a multicolinearidade dos termos no modelo. Montgomery, Peck e Vining1 sugerem que um número de condição maior que 100 indica uma multicolinearidade moderada. Quando a multicolinearidade tem um nível moderado ou mais baixo, você deve usar os VIFs e a estrutura de correlação dos dados para investigar as relações entre os termos do modelo.
Se a correlação de um preditor com outros preditores for quase perfeita, o Minitab exibe uma mensagem informando que o termo não pode ser estimado. Os valores de VIF para termos que não podem ser estimados normalmente excedem a um bilhão.
A multicolinearidade não afeta a qualidade do ajuste e a qualidade da predição. Os coeficientes (função discriminante linear) não podem ser interpretados de forma confiável, mas os valores ajustados (classificados) não são afetados.
A multicolinearidade tem o mesmo efeito na análise discriminante e na regressão.
Por exemplo, um fabricante de brinquedos deseja predizer a satisfação dos clientes e inclui "resistência" e "não quebra" como variáveis preditoras no modelo de regressão. O investigador determina que as duas variáveis são fortemente correlacionadas negativamente e que possuem VIF maior que 5. Nessa hora, o investigador poderia tentar remover qualquer uma das variáveis. Ele também poderia usar Mínimos Quadrados Parciais ou Análise de Componentes Principais para usar essas variáveis relacionadas para criar um componente "durabilidade".