Spécifier le codage des variables catégorielles et continues pour Ajuster le modèle de régression et Regressão Linear

Stat > Régression > Régression > Ajuster le modèle de régression > Codage

Module d'analyse prédictive > Régression linéaire > Codage

Codage des variables de catégorie

Codage pour les prédicteurs de catégorie
Pour effectuer l'analyse, Minitab doit recoder les prédicteurs de catégorie en utilisant une méthode parmi deux possibles. Choisissez une méthode selon que vous voulez comparer les niveaux des prédicteurs à la moyenne globale ou à la moyenne d'un niveau de référence. Le schéma de codage ne modifie pas le test de l'effet général du prédicteur. Pour plus d'informations, reportez-vous à la rubrique Schémas de codage des prédicteurs de catégorie.
  • (-1, 0, +1) : choisissez cette option pour estimer la différence entre chaque moyenne de niveau et la moyenne globale.
  • (1, 0) : choisissez cette option pour estimer la différence entre chaque moyenne de niveau et la moyenne du niveau de référence. Si vous choisissez le schéma de codage (1, 0), le tableau du niveau de référence devient actif dans la boîte de dialogue.
Tableau de niveau de référence
Prédicteur de catégorie
Cette colonne du tableau indique le nom de tous les prédicteurs de catégorie de votre modèle. Cette colonne est en lecture seule.
Niveau de référence

Minitab compare les moyennes de tous les niveaux au niveau de référence. Le fait de changer de niveau de référence n'a pas d'impact sur la signification globale, mais elle peut rendre l'interprétation des coefficients plus révélatrice.

Pour les prédicteurs avec le codage 1, 0, Minitab définit les niveaux de référence suivants par défaut, en fonction du type de données :
  • Pour les prédicteurs de catégorie numériques, le niveau de référence est celui qui a la plus petite valeur numérique.
  • Pour les prédicteurs de catégorie de type date/heure, le niveau de référence est celui ayant la valeur de date/heure la plus ancienne.
  • Pour les prédicteurs de catégorie de type texte, le niveau de référence par défaut est le premier dans l'ordre des valeurs, c'est-à-dire, par défaut, l'ordre alphabétique. Pour plus d'informations sur la modification de l'ordre des valeurs pour les variables texte, reportez-vous à la rubrique Modification de l'ordre d'affichage des valeurs de texte dans les résultats de Minitab.

Normaliser les prédicteurs continus

Vous pouvez normaliser les prédicteurs continus dans votre modèle. Les prédicteurs normalisés ne servent qu'à ajuster le modèle et ne sont pas stockés dans la feuille de travail.

La normalisation des prédicteurs continus permet d'améliorer l'interprétation du modèle dans des conditions spécifiques.
  1. Centrez les prédicteurs continus en soustrayant la moyenne : cette méthode permet de réduire la multicolinéarité, ce qui améliore la précision des estimations des coefficients. Cette méthode est utile si votre modèle comporte des prédicteurs, des termes d'ordre supérieur et des termes d'interaction hautement corrélés. Chaque coefficient représente la modification attendue de la réponse en fonction d'une modification d'une unité du prédicteur, à l'aide de l'échelle de mesure initiale.
  2. Normalisez l'échelle des prédicteurs continus en divisant par l'écart type : cette méthode permet d'harmoniser les prédicteurs afin de pouvoir comparer la taille des coefficients. Cette approche est utile lorsque vous souhaitez savoir quels prédicteurs ont le plus d'effet, tout en contrôlant les différences dans l'échelle. Toutefois, chaque coefficient représente la modification prévue de la réponse en fonction d'une modification de l'un des écarts types du prédicteur.
Utilisez l'une des méthodes suivantes pour normaliser vos prédicteurs continus :
  • Ne pas normaliser : utilisez vos données d'origine pour les prédicteurs continus.
  • Spécifier les niveaux inférieur et supérieur pour coder comme -1 et +1 : utilisez cette option pour centrer les prédicteurs et les placer sur une échelle comparable. Minitab a recours à cette méthode dans le plan d'expériences (DOE). Toutes les données comprises entre le minimum et le maximum indiqués sont transformées en un nombre compris entre −1 et +1. Dans le tableau, saisissez le minimum et le maximum, ou utilisez les valeurs par défaut contenues dans l'échantillon.
    Prédicteur continu
    Affiche le nom de tous les prédicteurs continus de votre modèle. Cette colonne est en lecture seule.
    Min.
    Saisissez une valeur à coder comme −1. La valeur par défaut est la valeur minimale de l'échantillon.
    Max.
    Saisissez une valeur à coder comme +1. La valeur par défaut est la valeur maximale de l'échantillon.
  • Soustraire la moyenne et diviser par l'écart type : utilisez cette option pour centrer les prédicteurs et les placer sur une échelle comparable.
  • Soustraire la moyenne : utilisez cette option pour centrer les prédicteurs.
  • Diviser par l'écart type : utilisez une échelle comparable pour tous les prédicteurs.
  • Soustraire une valeur spécifiée, puis diviser par une autre : indiquez d'autres valeurs au lieu d'utiliser les estimations de la moyenne et de l'écart type issues de l'échantillon.
    Prédicteur continu
    Affiche le nom de tous les prédicteurs continus de votre modèle. Cette colonne est en lecture seule.
    Soustraire
    Saisissez la valeur à soustraire de chaque prédicteur continu.
    Diviser par
    Saisissez la valeur utilisée par Minitab pour diviser le résultat de la soustraction.