Tableau de méthodes pour Ajuster le modèle de régression et Regressão Linear

Vous trouverez les définitions et les interprétations de chaque statistique dans le tableau Méthodes.

Codage des prédicteurs de catégorie

Minitab peut utiliser le schéma de codage (0, 1) ou (−1, 0, +1) pour intégrer des variables de catégorie dans le modèle. Le schéma (0, 1) est celui utilisé par défaut pour l'analyse de régression tandis que le schéma (−1, 0, +1) est celui utilisé par défaut pour l'ANOVA et les plans d'expériences. Le choix entre ces deux schémas ne modifie par la signification statistique des variables de catégorie. En revanche, le schéma de codage modifie les coefficients et la manière de les interpréter.

Interprétation

Vérifiez quel est le schéma de codage affiché pour vous assurer que vous avez effectué l'analyse que vous vouliez. Interprétez les coefficients pour les variables de catégorie de la manière suivante :

  • Avec le schéma de codage (0, 1), chaque coefficient représente la différence entre la moyenne de chaque niveau et la moyenne du niveau de référence. Le coefficient associé au niveau de référence n'est pas affiché dans le tableau Coefficients.
  • Avec le schéma de codage (−1, 0, +1), chaque coefficient représente la différence entre la moyenne de chaque niveau et la moyenne globale.

Normalisation du prédicteur continu

Si vous souhaitez normaliser les prédicteurs continus de votre modèle, Minitab fournit des détails sur la façon de procéder dans le tableau Normalisation des prédicteurs continus.

En général, la normalisation est utilisée pour centrer les variables, les mettre à l'échelle ou les deux. Lorsque vous centrez des variables, vous réduisez la multicolinéarité produite par les termes polynomiaux et d'interaction, ce qui améliore la précision des estimations de coefficients. Dans la plupart des cas, lorsque vous mettez des variables à l'échelle, Minitab convertit les différentes variables sur une échelle commune, ce qui vous permet de comparer les coefficients.

Interprétation

Utilisez le tableau sur la méthode de normalisation pour vérifier que vous avez effectué l'analyse comme vous le souhaitiez. En fonction de la méthode choisie, vous devrez peut-être interpréter les coefficients différemment, comme suit :
Spécifier les niveaux inférieur et supérieur pour coder comme -1 et +1
Cette méthode permet à la fois de centrer les variables et de les mettre à l'échelle. Minitab utilise cette méthode dans les plans d'expériences (DOE). Les coefficients représentent la variation moyenne de la réponse associée aux valeurs élevées et faibles que vous avez spécifiées.
Soustraire la moyenne et diviser par l'écart type
Cette méthode permet à la fois de centrer les variables et de les mettre à l'échelle. Chaque coefficient représente la variation attendue de la réponse lorsque la variable est modifiée d'un écart type.
Soustraire la moyenne
Cette méthode permet de centrer les variables. Chaque coefficient représente la variation attendue de la réponse lorsque la variable est modifiée d'une unité, en utilisant l'échelle de mesure initiale. Lorsque vous soustrayez la moyenne, le coefficient constant offre une estimation de la réponse moyenne lorsque tous les prédicteurs ont leur valeur moyenne.
Diviser par l'écart type
Cette méthode permet de mettre les variables à l'échelle. Chaque coefficient représente la variation attendue de la réponse lorsque la variable est modifiée d'un écart type.
Soustraire une valeur spécifiée, puis diviser par une autre
L'effet et l'interprétation de cette méthode dépend des valeurs que vous entrez.

Valeur estimée de λ

Lorsque vous utilisez une transformation de Box-Cox, la valeur de λ (lambda) estimée est la valeur optimale permettant de générer des valeurs de réponse transformées qui soient distribuées normalement. Par défaut, Minitab utilise la valeur arrondie de lambda.

Interprétation

Lambda est l'exposant utilisé par Minitab pour transformer les données de réponse. Par exemple, si lambda = -1, toutes les valeurs de réponse (Y) sont transformées comme suit : −Y-1 = −1/Y. Si lambda est égal à 0, il représente le logarithme népérien de Y plutôt que Y0.

IC à 95 % pour λ

Les intervalles de confiance pour λ (lambda) sont des étendues de valeurs ayant de fortes chances de contenir la valeur de λ réelle pour l'ensemble de la population dont votre échantillon est issu.

Les échantillons étant aléatoires, il est peu probable que deux échantillons d'une population donnent des intervalles de confiance identiques. Cependant, si vous prenez de nombreux échantillons aléatoires, un certain pourcentage des intervalles de confiance obtenus contiendra le paramètre de population inconnu. Le pourcentage de ces intervalles de confiance contenant le paramètre est le niveau de confiance de l'intervalle.

Interprétation

Utilisez l'intervalle de confiance pour estimer la valeur de lambda pour votre échantillon.

Par exemple, avec un niveau de confiance de 95 %, vous pouvez être sûr à 95 % que l'intervalle de confiance comprend la valeur de lambda pour la population. L'intervalle de confiance vous aide à évaluer la signification pratique de vos résultats. Utilisez vos connaissances spécialisées pour déterminer si l'intervalle de confiance comporte des valeurs ayant une signification pratique pour votre situation. Si l'intervalle est trop grand pour être utile, envisagez d'augmenter votre effectif d'échantillon.

Valeur arrondie de λ

Par défaut, Minitab arrondit la valeur λ (lambda) optimale à 0,5 près, car ces valeurs correspondent à une transformation plus intuitive. Pour utiliser la valeur optimale pour la transformation, sélectionnez Fichier > Options > Modèles linéaires > Affichage des résultats.

Interprétation

Les valeurs suivantes sont des valeurs arrondies courantes de lambda, associées à la transformation de la variable de réponse qu'elles entraînent.
Lambda Transformation
-2 −Y-2 = −1 / Y2
-1 −Y-1 = −1 / Y
-0,5 −Y-0,5 = −1 / (racine carrée de Y)
0 log (Y)
0,5 Y0,5 = racine carrée de Y
1 Y
2 Y2

Validation

Lorsque vous utilisez un ensemble de données de test, le tableau affiche le pourcentage des données qui se trouvent dans l'ensemble de données de test. Lorsque vous utilisez la validation croisée, le tableau affiche le nombre de partitions. Lorsque vous spécifiez une colonne qui indique les observations se trouvant dans l'ensemble de données de test ou dans chaque partition, le tableau affiche le titre de la colonne.

Interprétation

Vérifiez la méthode de validation utilisée dans les résultats pour vous assurer que vous avez effectué l'analyse que vous vouliez.