Entrée des données pour la fonction Analyse discriminante

Stat > Multivariée > Analyse discriminante

Entrée des données

  1. Dans Groupes, indiquez la colonne qui identifie le groupe auquel chaque observation appartient. La colonne peut être de type numérique, texte ou date/heure, et peut contenir jusqu'à 20 groupes.
    Remarque

    Si vous désirez changer l'ordre de tri des groupes de texte, vous pouvez définir vos propres critères de tri. Pour plus d'informations, reportez-vous à la rubrique Modification de l'ordre d'affichage des valeurs de texte dans les résultats de Minitab.

  2. Dans la zone Prédicteurs, indiquez les colonnes contenant les variables de mesures numériques qui seront utilisées pour déterminer les différences entre les groupes.

Dans cette feuille de travail, Gpe niveau correspond à la colonne de groupement et indique le parcours pédagogique actuel dans lequel le directeur d'établissement a placé chaque étudiant. Score du test et Motivation sont les variables de prédiction permettant de déterminer le parcours pédagogique de chaque étudiant.
C1 C2 C3
Parcours Score du test Motivation
3 1021 44
2 1152 56
1 1224 61
3 1077 46
2 1149 55
2 1192 49

Fonction discriminante

Sélectionnez la fonction discriminante à utiliser pour l'analyse.

Remarque

Vous pouvez effectuer l'analyse deux fois, en utilisant chaque fonction discriminante, puis comparer les résultats pour déterminer la fonction la plus adaptée à vos données. La comparaison de la proportion de classements corrects est une méthode courante pour évaluer la fonction discriminante. Une autre méthode consiste à traiter certaines observations dont les groupes sont connus comme s'ils étaient inconnus, puis à déterminer si la fonction discriminante prévoit correctement les groupes connus.

Utiliser la validation croisée

Sélectionnez cette option pour compenser un taux d'erreur apparent optimiste relatif aux observations mal classées. Le taux d'erreur apparent est le pourcentage d'observations mal classées. Ce nombre tend à être optimiste, car les données classées sont également les données utilisées pour générer la fonction de classement.

Avec la validation croisée, Minitab omet les observations une par une et calcule la fonction discriminante avec les observations restantes. Ensuite, Minitab prévoit le groupe pour l'observation omise. Si la proportion de groupes corrects est élevée, vous pouvez vous fier aux prévisions.

Si vous utilisez la validation croisée, Minitab affiche un tableau récapitulatif supplémentaire et ajoute des informations sur la validation croisée au tableau Récapitulatif des observations mal classées.

Remarque

Une autre méthode pour calculer un taux d'erreur plus réaliste est de partager vos données en deux parties. Utilisez une partie pour créer la fonction discriminante et l'autre comme ensemble de validation. Prévoyez l'appartenance aux groupes de l'ensemble de validation et calculez le taux d'erreur sous forme de pourcentage de données mal classées.

Stockage

Vous pouvez enregistrer les résultats de votre analyse dans la feuille de travail de façon à pouvoir les utiliser dans d'autres analyses, graphiques et macros. Minitab enregistre les résultats sélectionnés dans la colonne que vous indiquez. Le nom des colonnes de stockage pour les ajustements et ajustements à validation croisée se termine par un chiffre qui augmente lorsque vous enregistrez plusieurs fois ces résultats.

Fonction discriminante linéaire
Indiquez des colonnes pour stocker les coefficients de la fonction discriminante linéaire. Entrez une colonne pour chaque groupe. Minitab stocke une colonne pour chaque fonction et une ligne pour chaque coefficient. La constante est stockée dans la première ligne de chaque colonne.
Valeurs ajustées
Sélectionnez cette option pour stocker les valeurs ajustées. Pour une observation, la valeur ajustée est le groupe dans lequel elle est classée. Minitab stocke les identificateurs de groupes dans la colonne AJUS1, avec une ligne pour chaque observation dans les données.
Valeurs ajustées de la validation croisée
Sélectionnez cette option pour stocker les valeurs ajustées lorsque la discrimination est effectuée avec validation croisée. Pour une observation, la valeur ajustée est le groupe dans lequel elle est classée. Minitab stocke les identificateurs de groupes pour validation croisée dans la colonne VAL AJU X1, avec une ligne pour chaque observation dans les données.