O Minitab pode usar o esquema de codificação (0, 1) ou (−1, 0, +1) para incluir variáveis categóricas no modelo. O esquema (0, 1) é o padrão para análise de regressão, enquanto o esquema (−1, 0, +1) é o padrão para ANOVA e DOE. A escolha entre estes dois esquemas não altera a significância estatística das variáveis categóricas. No entanto, o esquema de codificação realmente altera os coeficientes e a maneira de interpretá-los.
Verifique se o esquema de codificação que é exibido garante que você tenha realizado a análise pretendida. Interprete os coeficientes para as variáveis categóricas como a seguir:
Se você optou por padronizar os preditores contínuos em seu modelo, o Minitab fornece detalhes sobre o método na tabela padronização preditor Contínuo.
Normalmente, você usa a padronização para centralizar variáveis, dimensionar variáveis ou ambas as coisas. Quando você centraliza as variáveis, reduz a multicolinearidade causada por termos polinomiais e termos de interação, o que melhora a precisão das estimativas dos coeficientes. Na maioria dos casos, quando você dimensionar as variáveis, o Minitab converte as diferentes escalas das variáveis para uma escala comum, o que permite comparar o tamanho dos coeficientes.
Quando você usa uma transformação Box-Cox, o λ (lambda) estimado é o valor ideal para produzir valores de resposta transformados que são normalmente distribuídos. Por padrão, o Minitab usa o valor de lambda arredondado.
Lambda é o expoente que o Minitab utiliza para transformar os dados de resposta. Por exemplo, se lambda = -1, então todos os valores de resposta (Y) são transformados como se segue: −Y-1 = −1/Y. Se lambda é igual a 0, isso representa o logaritmo natural de Y em vez de Y0.
Os intervalos de confiança para λ (lambda) são faixas de valores que tendem a conter o verdadeiro valor de λ para toda a população a partir da qual sua amostra foi tirada.
Como as amostras são aleatórias, é improvável que duas amostras de uma população produzam intervalos de confiança idênticos. No entanto, se você extrair muitas amostras aleatórias, uma determinada porcentagem dos intervalos de confiança resultantes conterá o parâmetro populacional desconhecido. A porcentagem destes intervalos de confiança que contém o parâmetro é o nível de confiança do intervalo.
Use o intervalo de confiança para avaliar a estimativa de lambda para a sua amostra.
Por exemplo, com um nível de confiança de 95%, é possível ter 95% de certeza de que o intervalo de confiança contém o valor de lambda para a população. O intervalo de confiança ajuda a avaliar a significância prática de seus resultados. Use seu conhecimento especializado para determinar se o intervalo de confiança inclui valores que tenham significância prática para a sua situação. Se o intervalo for muito amplo para ser útil, pense em aumentar o tamanho da amostra.
Por padrão, o Minitab arredonda o λ (lambda) ideal para a metade mais próxima, porque esses valores correspondem a uma transformação mais intuitiva. Se você quiser usar o valor ideal para a transformação, escolha .
Lambda | Transformação |
---|---|
-2 | −Y-2 = −1 / Y2 |
-1 | −Y-1 = −1 / Y |
-0,5 | −Y-0,5 = −1 / (raiz quadrada de Y) |
0 | log (Y) |
0,5 | Y0,5 = raiz quadrada de Y |
1 | Y |
2 | Y2 |
Quando você usa um conjunto de dados de teste, a tabela mostra a porcentagem dos dados que estão no conjunto de dados do teste. Quando você usa validação cruzada, a tabela mostra o número de dobras. Quando você especifica uma coluna que determina quais observações estão no conjunto de dados de teste ou quais observações estão em cada duplicação, a tabela mostra o título da coluna.
Verifique se método de validação que está em resultados garante que você tenha realizado a análise pretendida.