Minitab peut utiliser le schéma de codage (0, 1) ou (−1, 0, +1) pour intégrer des variables de catégorie dans le modèle. Le schéma (0, 1) est celui utilisé par défaut pour l'analyse de régression tandis que le schéma (−1, 0, +1) est celui utilisé par défaut pour l'ANOVA et les plans d'expériences. Le choix entre ces deux schémas ne modifie par la signification statistique des variables de catégorie. En revanche, le schéma de codage modifie les coefficients et la manière de les interpréter.
Vérifiez quel est le schéma de codage affiché pour vous assurer que vous avez effectué l'analyse que vous vouliez. Interprétez les coefficients pour les variables de catégorie de la manière suivante :
Si vous souhaitez normaliser les prédicteurs continus de votre modèle, Minitab fournit des détails sur la façon de procéder dans le tableau Normalisation des prédicteurs continus.
En général, la normalisation est utilisée pour centrer les variables, les mettre à l'échelle ou les deux. Lorsque vous centrez des variables, vous réduisez la multicolinéarité produite par les termes polynomiaux et d'interaction, ce qui améliore la précision des estimations de coefficients. Dans la plupart des cas, lorsque vous mettez des variables à l'échelle, Minitab convertit les différentes variables sur une échelle commune, ce qui vous permet de comparer les coefficients.
Lorsque vous utilisez une transformation de Box-Cox, la valeur de λ (lambda) estimée est la valeur optimale permettant de générer des valeurs de réponse transformées qui soient distribuées normalement. Par défaut, Minitab utilise la valeur arrondie de lambda.
Lambda est l'exposant utilisé par Minitab pour transformer les données de réponse. Par exemple, si lambda = -1, toutes les valeurs de réponse (Y) sont transformées comme suit : −Y-1 = −1/Y. Si lambda est égal à 0, il représente le logarithme népérien de Y plutôt que Y0.
Les intervalles de confiance pour λ (lambda) sont des étendues de valeurs ayant de fortes chances de contenir la valeur de λ réelle pour l'ensemble de la population dont votre échantillon est issu.
Les échantillons étant aléatoires, il est peu probable que deux échantillons d'une population donnent des intervalles de confiance identiques. Cependant, si vous prenez de nombreux échantillons aléatoires, un certain pourcentage des intervalles de confiance obtenus contiendra le paramètre de population inconnu. Le pourcentage de ces intervalles de confiance contenant le paramètre est le niveau de confiance de l'intervalle.
Utilisez l'intervalle de confiance pour estimer la valeur de lambda pour votre échantillon.
Par exemple, avec un niveau de confiance de 95 %, vous pouvez être sûr à 95 % que l'intervalle de confiance comprend la valeur de lambda pour la population. L'intervalle de confiance vous aide à évaluer la signification pratique de vos résultats. Utilisez vos connaissances spécialisées pour déterminer si l'intervalle de confiance comporte des valeurs ayant une signification pratique pour votre situation. Si l'intervalle est trop grand pour être utile, envisagez d'augmenter votre effectif d'échantillon.
Par défaut, Minitab arrondit la valeur λ (lambda) optimale à 0,5 près, car ces valeurs correspondent à une transformation plus intuitive. Pour utiliser la valeur optimale pour la transformation, sélectionnez .
Lambda | Transformation |
---|---|
-2 | −Y-2 = −1 / Y2 |
-1 | −Y-1 = −1 / Y |
-0,5 | −Y-0,5 = −1 / (racine carrée de Y) |
0 | log (Y) |
0,5 | Y0,5 = racine carrée de Y |
1 | Y |
2 | Y2 |
Lorsque vous utilisez un ensemble de données de test, le tableau affiche le pourcentage des données qui se trouvent dans l'ensemble de données de test. Lorsque vous utilisez la validation croisée, le tableau affiche le nombre de partitions. Lorsque vous spécifiez une colonne qui indique les observations se trouvant dans l'ensemble de données de test ou dans chaque partition, le tableau affiche le titre de la colonne.
Vérifiez la méthode de validation utilisée dans les résultats pour vous assurer que vous avez effectué l'analyse que vous vouliez.