A saída também identifica que nível de resposta é o evento de referência.
Use as informações de resposta para examinar quantos dados há na análise. Amostras aleatórias maiores com diversas ocorrências de cada nível, normalmente fornecem inferências mais exatas sobre a população.
Além disso use as informações da resposta para determinar qual evento é o evento de referência. A interpretação das estatísticas como coeficientes e razões de chances dependem de qual evento é o evento de referência.
A tabela de informações dos fatores exibe os fatores do experimento, os números dos níveis e os valores dos níveis. Os fatores podem assumir somente um número limitado de valores possíveis, conhecidos como níveis de fatores. Os níveis de fatores podem ser texto ou numéricos. Os fatores numéricos usam alguns valores controlados no experimento, ainda que vários valores sejam possíveis.
Use a tabela de informações dos fatores para ver o número de níveis na análise. Por exemplo, um analista de qualidade planeja estudar os fatores que poderiam afetar a resistência do plástico durante o processo de fabricação. O analista incluir Aditivo. O aditivo é uma variável categórica que pode ser do tipo A ou do tipo B.
Fator | Níveis | Valores |
---|---|---|
Aditivo | 2 | A; B |
Os fatores podem ser cruzados ou aninhados. Dois fatores são cruzados quando cada nível de um fator ocorre em combinação com cada nível do outro fator. Dois fatores estão aninhados quando um conjunto dos níveis de um fator aparecem em somente um nível de um segundo fator. Por exemplo, se um experimento contém máquina e operador, esses fatores são cruzados se todos os operadores usarem todas as máquinas. Contudo, o operador é aninhado na máquina se cada máquina tiver um conjunto diferente de operadores.
Na tabela de informações de fatores, os parênteses indicam fatores aninhados. Por exemplo, Padrão(Avaliador) indica que o Padrão está aninhado dentro do Avaliador. Neste contexto, o aninhamento indica que cada avaliador tem seu próprio conjunto de peças padrão. Os níveis de fatores de um fator aninhado são repetidos para cada nível aninhamento, o que aumenta o número de níveis para o fator aninhado. Neste exemplo, cada avaliador tem 5 padrões, mas como o padrão está aninhado no avaliador, o padrão tem 20 níveis diferentes.
Fator | Níveis | Valores |
---|---|---|
Padrão(Appraiser) | 20 | 1(Amanda); 2(Amanda); 3(Amanda); 4(Amanda); 5(Amanda); 1(Britt); 2(Britt); 3(Britt); 4(Britt); 5(Britt); 1(Eric); 2(Eric); 3(Eric); 4(Eric); 5(Eric); 1(Mike); 2(Mike); 3(Mike); 4(Mike); 5(Mike) |
Appraiser | 4 | Amanda; Britt; Eric; Mike |
Para obter mais informações sobre fatores, vá para Fatores e níveis de fatores, O que são fatores, fatores cruzados e fatores aninhados? e Qual é a diferença entre fatores fixos e aleatórios?.
A equação logística nominal trata cada resultado nominal separadamente. A equação de regressão de logística é composta de múltiplas funções logit, uma para cada valor da resposta menos um. Cada equação tem uma inclinação exclusiva para as preditoras. Essas equações avaliam como a probabilidade de um resultado nominal muda em relação a outro resultado nominal conforme as variáveis da preditora mudam.
Use os coeficientes para examinar como a probabilidade de um resultado muda conforme as variáveis preditoras mudam. O coeficiente estimado para um preditora representa a mudança na função de ligação para cada mudança de unidade na preditora, enquanto as outras preditoras no modelo são consideradas constantes. A relação entre o coeficiente e a probabilidade de um resultado depende de diversos aspectos da análise, incluindo o resultado de referência para a variável resposta e os níveis de referência para preditoras categóricas. Geralmente, coeficientes positivos tornam o resultado de referência menos provável conforme a preditora aumenta. Coeficientes negativos tornam o resultado de referência o mais provável conforme a preditora aumenta. Um coeficiente negado próximo de 0 sugere que o efeito da preditora é pequeno.
Por exemplo, o administrador de uma escola quer avaliar métodos de ensino diferentes. Ele usa o método de idade e ensino para predizer quais assuntos os alunos preferem. O primeiro evento do resultado é o primeiro na tabela de informações de resposta e é o resultado de referência para a variável de resposta. Para estes dados, o resultado de referência é aquele que o aluno prefere ciência. O logit 1 compara a probabilidade de que um aluno prefere matemática à ciência. Nesta equação, o valor-p para o coeficiente de idade é maior do que 0,7. Um valor-p tão alto sugere que a idade tem pouco efeito em se um aluno prefere a matemática à ciência.
O Logit 2 compara a arte à ciência. Nesta equação, o coeficiente de idade é maior do que o coeficiente que compara a matemática à ciência. O coeficiente de idade é positivo. Conforme os alunos ficam mais velhos, os alunos têm maior probabilidade de preferir artes à ciência.
A interpretação dos coeficientes para preditoras categóricas depende do nível de referência do fator. Nos dados dos métodos de ensino, os dois níveis do método de ensino são "Demonstrar" e "Explicar". "Demonstrar" não está na tabela e coeficientes, portanto "Demonstrar" é o nível de referência. O valor-p para "Explicar" na equação, que compara matemática à ciência é maior que 0,5. Um valor-p tão alto sugere que o método de ensino tem pouco efeito em se um aluno que prefere matemática à ciência.
No logit 2, o coeficiente de "Explicar" é maior do que o coeficiente que compara a matemática à ciência. O valor-p para este coeficiente é menor do que 0,05, portanto este coeficiente é estatisticamente significativo no nível 0,05. O coeficiente de "Explicar" nesta equação é positivo. Ao ensinar que o método de ensino é "Explicar". o aluno tem maior probabilidade de preferir Arte.
Variável | Valor | Contagem | |
---|---|---|---|
Assunto | Ciências | 10 | (Evento de Referência) |
Matemática | 11 | ||
Artes | 9 | ||
Total | 30 |
Fator | Níveis | Valores |
---|---|---|
Método de Ensino | 2 | Demonstrar; Explicar |
Razão de Chances | IC de 95% | |||||
---|---|---|---|---|---|---|
Preditor | Coef. | EP de Coef | Z | P | Inferior | |
Logito 1: (Matemática/Ciências) | ||||||
Constante | -1,12266 | 4,56425 | -0,25 | 0,806 | ||
Método de Ensino | ||||||
Explicar | -0,563115 | 0,937591 | -0,60 | 0,548 | 0,57 | 0,09 |
Idade | 0,124674 | 0,401079 | 0,31 | 0,756 | 1,13 | 0,52 |
Logito 2: (Artes/Ciências) | ||||||
Constante | -13,8485 | 7,24256 | -1,91 | 0,056 | ||
Método de Ensino | ||||||
Explicar | 2,76992 | 1,37209 | 2,02 | 0,044 | 15,96 | 1,08 |
Idade | 1,01354 | 0,584494 | 1,73 | 0,083 | 2,76 | 0,88 |
IC de 95% | |
---|---|
Preditor | Superior |
Logito 1: (Matemática/Ciências) | |
Constante | |
Método de Ensino | |
Explicar | 3,58 |
Idade | 2,49 |
Logito 2: (Artes/Ciências) | |
Constante | |
Método de Ensino | |
Explicar | 234,90 |
Idade | 8,66 |
GL | G | Valor-P |
---|---|---|
4 | 12,825 | 0,012 |
Método | Qui-Quadrado | GL | P |
---|---|---|---|
Pearson | 6,95295 | 10 | 0,730 |
Deviance | 7,88622 | 10 | 0,640 |
O erro padrão do coeficiente estima a variabilidade entre a estimativa do coeficiente que seria obtida caso fossem extraídas amostras da mesma população por vezes seguidas. O cálculo pressupõe que o tamanho da amostra e os coeficientes para estimativa permaneceriam os mesmos caso fossem extraídas repetidas amostras.
Use o erro padrão do coeficiente para medir a precisão da estimativa do coeficiente. Quanto menor o erro padrão, mais precisa é a estimativa.
O valor Z é uma estatística de teste que mede a razão entre o coeficiente e seu erro padrão.
O Minitab usa o valor Z para calcular o valor-p, que pode ser usado para a tomada de uma decisão sobre a significância estatística dos termos e do modelo. O teste de Wald é exato quando o tamanho da amostra é grande o bastante de forma que a distribuição dos coeficientes da amostra segue uma distribuição normal.
Um valor-z que está suficientemente longe de 0 indica que a estimativa do coeficiente é amplo e preciso o bastante para ser estatisticamente diferente de 0. Inversamente, um valor-z que está perto de 0 indica que a estimativa do coeficiente é muito pequena ou muito imprecisa para estar certa de que o termo tem um efeito na resposta.
O valor-p é uma probabilidade que mede a evidência contra a hipótese nula. As probabilidades inferiores fornecem evidências mais fortes contra a hipótese nula.
A razão de chances compara as chances de dois eventos. As chances de um resultado são a probabilidade de que o resultado da comparação ocorra dividida pela probabilidade de que o resultado de referência ocorra.
Use a razão de chances para compreender o efeito de uma preditora. A interpretação da razão de chances depende se a preditora é categórica ou contínua. Na tabela de regressão logística, o resultado da comparação é o primeiro resultado após o rótulo do logit, e o resultado da referência é o segundo resultado. O resultado da referência é o mesmo para cada logit.
As razões de chances que são maiores do que 1 indicam que o resultado da comparação tem mais probabilidade do que o resultado de referência conforme a preditora aumenta. As razões de chances que não menores do que 1 indicam que o resultado de referência tem menos probabilidade do que o resultado da comparação.
Por exemplo, um administrador de escola quer avaliar diferentes métodos de ensino. Para o logit 1, o resultado da comparação é matemática. Para o logit 2, o resultado da comparação é arte. O resultado de referência é ciência. No logit 2, a estimativa da razão de chances é 2,76, que é maior do que 1. Conforme a idade aumenta, um aluno tem mais probabilidade de preferir arte à ciência. Para cada ano adicional de idade, as chances de que um aluno prefira arte é 3 vezes maior do que as chances de que ele prefira ciência.
Razão de Chances | IC de 95% | |||||
---|---|---|---|---|---|---|
Preditor | Coef. | EP de Coef | Z | P | Inferior | |
Logito 1: (Matemática/Ciências) | ||||||
Constante | -1,12266 | 4,56425 | -0,25 | 0,806 | ||
Método de Ensino | ||||||
Explicar | -0,563115 | 0,937591 | -0,60 | 0,548 | 0,57 | 0,09 |
Idade | 0,124674 | 0,401079 | 0,31 | 0,756 | 1,13 | 0,52 |
Logito 2: (Artes/Ciências) | ||||||
Constante | -13,8485 | 7,24256 | -1,91 | 0,056 | ||
Método de Ensino | ||||||
Explicar | 2,76992 | 1,37209 | 2,02 | 0,044 | 15,96 | 1,08 |
Idade | 1,01354 | 0,584494 | 1,73 | 0,083 | 2,76 | 0,88 |
IC de 95% | |
---|---|
Preditor | Superior |
Logito 1: (Matemática/Ciências) | |
Constante | |
Método de Ensino | |
Explicar | 3,58 |
Idade | 2,49 |
Logito 2: (Artes/Ciências) | |
Constante | |
Método de Ensino | |
Explicar | 234,90 |
Idade | 8,66 |
Para preditoras categóricas, a razão de chances compara as chances do resultado da comparação em dois níveis diferentes da preditora. O nível de comparação está na tabela de regressão logística e tem uma razão de chances estimada. As razões de chances que são maiores que 1 indicam que o resultado da comparação torna-se mais provavelmente relativo para o resultado de referência quando a preditora categórica muda do nível de referência para o nível de comparação. As razões de chances que são menos do que 1 indicam que o resultado da comparação torna-se menos provável para o resultado de referência quando a preditora categórica muda do nível de referência para o nível de comparação.
Por exemplo, o administrador de uma escola quer avaliar métodos de ensino diferentes. Para o logit 1, o resultado da comparação é matemática. Para o logit 2, o resultado da comparação é arte. O resultado de referência é ciência. Para o logit 2, a estimativa da razão de chances para o método de ensino é 15,96, que é maior do que 1. Quando os métodos de ensino mudam de "demonstrar" para "explicar", as chances de que um aluno prefira arte são cerca de 16 vezes maiores do que as chances de que ele prefira ciência.
Razão de Chances | IC de 95% | |||||
---|---|---|---|---|---|---|
Preditor | Coef. | EP de Coef | Z | P | Inferior | |
Logito 1: (Matemática/Ciências) | ||||||
Constante | -1,12266 | 4,56425 | -0,25 | 0,806 | ||
Método de Ensino | ||||||
Explicar | -0,563115 | 0,937591 | -0,60 | 0,548 | 0,57 | 0,09 |
Idade | 0,124674 | 0,401079 | 0,31 | 0,756 | 1,13 | 0,52 |
Logito 2: (Artes/Ciências) | ||||||
Constante | -13,8485 | 7,24256 | -1,91 | 0,056 | ||
Método de Ensino | ||||||
Explicar | 2,76992 | 1,37209 | 2,02 | 0,044 | 15,96 | 1,08 |
Idade | 1,01354 | 0,584494 | 1,73 | 0,083 | 2,76 | 0,88 |
IC de 95% | |
---|---|
Preditor | Superior |
Logito 1: (Matemática/Ciências) | |
Constante | |
Método de Ensino | |
Explicar | 3,58 |
Idade | 2,49 |
Logito 2: (Artes/Ciências) | |
Constante | |
Método de Ensino | |
Explicar | 234,90 |
Idade | 8,66 |
Estes intervalos de confiança (IC) são amplitudes de valores que apresentam a probabilidade de conter os valores verdadeiros das razões de chances. O cálculo dos intervalos de confiança usa a distribuição normal. O intervalo de confiança é exato se o tamanho da amostra for grande o bastante de forma que a distribuição das razões de chances da amostra siga uma distribuição normal.
Como as amostras são aleatórias, é improvável que duas amostras de uma população produzam intervalos de confiança idênticos. No entanto, se você extrair muitas amostras aleatórias, uma determinada porcentagem dos intervalos de confiança resultantes conterá o parâmetro populacional desconhecido. A porcentagem destes intervalos de confiança que contém o parâmetro é o nível de confiança do intervalo.
Use o intervalo de confiança para avaliar a estimativa da razão de chances.
Por exemplo, com um nível de confiança de 95%, é possível ter 95% de certeza de que o intervalo de confiança contém o valor da razão de chances para a população. O intervalo de confiança ajuda a avaliar a significância prática de seus resultados. Use seu conhecimento especializado para determinar se o intervalo de confiança inclui valores que tenham significância prática para a sua situação. Se o intervalo for muito amplo para ser útil, pense em aumentar o tamanho da amostra.
Esse teste é um teste geral que considera todos os coeficientes para uma preditora categórica simultaneamente. O teste é para preditoras categóricas com mais de 2 níveis.
Use o teste para determinar se uma preditora categórica com mais de 1 coeficiente tem uma relação estatisticamente significativa com os eventos de resposta. Quando uma preditora categórica tem mais de 2 níveis, os coeficientes para os níveis individuais têm valores-p diferentes. O teste geral dá uma resposta única sobre se a preditora é estatisticamente significativa.
O Minitab maximiza a função log-verossimilhança para encontrar valores ótimos dos coeficientes estimados.
Use a log-verossimilhança para comprar dois modelos que usam os mesmos dados para estimar os coeficientes. Como os valores são negativos, quanto mais próximo de 0 o valor, melhor o modelo se ajusta aos dados.
A log-verossimilhança não pode diminuir quando você adiciona termos a um modelo. Por exemplo, um modelo com 5 termos tem maior log-verossimilhança do que quaisquer dos modelos de 4 termos que você pode criar com os mesmos termos. Portanto, a log-verossimilhança é mais útil quando você compara modelos do mesmo tamanho. Para tomar decisões sobre termos individuais, você normalmente examina os valores-p para o termo nos diferentes logits.
Esse teste é um teste geral que considera todos os coeficientes para preditoras no modelo.
Use o teste para determinar se pelo menos uma das preditoras do modelo tem uma associação estatisticamente significativa com os eventos da resposta. Normalmente, você não interpreta a estatística G ou os graus de liberdade (DF). Os DF são iguais ao número de coeficientes das preditoras no modelo.
O teste de qualidade de ajuste de Pearson avalia a discrepância entre o modelo atual e o modelo completo.
O teste de qualidade de ajuste de deviance avalia a discrepância entre o modelo atual e o modelo completo.