Um coeficiente de regressão descreve o tamanho e a direção da relação entre um preditor e variável de resposta. Os coeficientes são os números pelos quais os valores do termo são multiplicados em uma equação de regressão.
Use o coeficiente para determinar se uma mudança na variável preditora pode tornar o evento mais ou menos provável. O coeficiente estimado para uma preditora representa a mudança na função de ligação para cada mudança de unidade na preditora, enquanto as outras preditoras no modelo são consideradas constantes. A relação entre o coeficiente e a probabilidade depende de diversos aspectos da análise, incluindo a função de ligação, o evento de referência da resposta e os níveis de referência das preditoras categóricas que estão no modelo. Geralmente, os coeficientes positivos tornam o evento mais provável e os coeficientes negativos tornam o evento menos provável. Um coeficiente estimado próximo de 0 sugere que o efeito da preditora é pequeno.
A função de ligação logit fornece a interpretação mais natural dos coeficientes estimados e é, portanto, a ligação padrão no Minitab. A interpretação usa o fato de que as chances de um evento de referência sejam P(evento)/P(não evento) e supõe que as outras preditoras permanecem constantes. Quanto maiores as chances do log, mais provável é o evento de referência. Portanto, os coeficientes positivos indicam que o evento torna-se mais provável e coeficientes negativos indicam que o evento torna-se menos provável. Segue-se um resumo de interpretações para diferentes tipos de preditoras.
O coeficientes de uma preditora contínua é a mudança estimada no log natural das chances de o evento de referência para cada unidade aumentar na preditora. Por exemplo, se o coeficiente de tempo em segundos é 1,4, então o log natural das chances aumenta em 1,4 para cada segundo adicional.
Os coeficientes estimados também podem ser usados para calcular as razões de chances ou a razão entre duas chances. Para calcular a razão de chances, exponencie o coeficiente de uma preditora. O resultado é a razão de chances para quando a preditora é x+1, comparado a quando a preditora é x. Por exemplo, se a razão de chances para massa em quilogramas é 0,95, para cada quilograma adicional, a probabilidade do evento diminui em cerca de 5%.
O erro padrão do coeficiente estima a variabilidade entre a estimativa do coeficiente que seria obtida caso fossem extraídas amostras da mesma população por vezes seguidas. O cálculo pressupõe que o tamanho da amostra e os coeficientes para estimativa permaneceriam os mesmos caso fossem extraídas repetidas amostras.
Use o erro padrão do coeficiente para medir a precisão da estimativa do coeficiente. Quanto menor o erro padrão, mais precisa é a estimativa.
O fator de inflação da variância (VIF) indica quanto da variância de um coeficiente está inflado devido a multicolinearidade.
Use o VIF para descrever quanta multicolinearidade existe em uma análise de regressão. A multicolinearidade é problemática porque ela pode aumentar a variância dos coeficientes de regressão, tornando difícil avaliar o impacto individual que cada uma das preditoras tem na resposta.
VIF | Multicolinearidade |
---|---|
VIF = 1 | Nenhum |
1 < VIF < 5 | Moderado |
VIF > 5 | Alto |
Para obter mais informações sobre a multicolinearidade e como minimizar seus efeitos, veja Multicolinearidade em regressão.
Para regressão logística binária, o Minitab mostra dois tipos de equações de regressão. A primeira equação diz respeito à probabilidade do evento para a resposta transformada.A primeira equação se relaciona ao número de eventos da resposta transformada. A forma da primeira equação depende da função de ligação. A segunda equação relaciona as preditoras à resposta transformada.
Use as equações para examinar a relação entre a resposta e as variáveis preditoras.
Por exemplo, um modelo usa a dose de um medicamento para prever o evento que um tipo de bactéria não está presente em um paciente. A primeira equação mostra a relação entre a probabilidade e a resposta transformada por causa da função de ligação do logit. A segunda equação mostra como a dose diz respeito à resposta transformada. Como o coeficiente para dose é positivo, quando a dose é maior, existe menos probabilidade de a bactéria estar presente.
P(Nenhuma Bactéria) | = | exp(Y')/(1 + exp(Y')) |
---|
Y' | = | -5,25 + 3,63 Dose (mg) |
---|
Razão de Chances | IC de 95% | |
---|---|---|
Dose (mg) | 37,5511 | (2,9647; 475,6190) |
A razão de chances compara as chances de dois eventos. As chances de um evento são a probabilidade de que o evento ocorra dividida pela probabilidade de que o evento não ocorra. O Minitab calcula razões de chances quando o modelo usa a função de ligação logit.
Use a razão de chances para compreender o efeito de uma preditora. As razões de chances que são maiores do que 1 indicam que o evento tem mais probabilidade de ocorrer conforme a preditora aumenta. As razões de chances que não menos do que 1 indicam que o evento tem menos probabilidade de ocorrer conforme a preditora aumenta.
Nesses resultados, o modelo usa o nível de dosagem de um medicamento para predizer a presença ou ausência de bactéria em adultos. Cada comprimido contém uma dose de 0,5 mg, portanto, os pesquisadores usam uma mudança de unidade de 0,5 mg. A razão de chances é de aproximadamente 6. Para cada comprimido adicional que um adulto ingere, as chances de que um paciente não tenha a bactéria aumenta cerca de 6 vezes.
Unidade de Mudança | Razão de Chances | IC de 95% | |
---|---|---|---|
Dose (mg) | 0,5 | 6,1279 | (1,7218; 21,8087) |