Entrée des données pour la fonction Analyse discriminante

Stat > Multivariée > Analyse discriminante

Sur ce thème

Entrée des données
Fonction discriminante
Utiliser la validation croisée
Stockage

Entrée des données

Dans Groupes, indiquez la colonne qui identifie le groupe auquel chaque observation appartient. La colonne peut être de type numérique, texte ou date/heure, et peut contenir jusqu'à 20 groupes.
Remarque
Si vous désirez changer l'ordre de tri des groupes de texte, vous pouvez définir vos propres critères de tri. Pour plus d'informations, reportez-vous à la rubrique Modification de l'ordre d'affichage des valeurs de texte dans les résultats de Minitab.
Dans la zone Prédicteurs, indiquez les colonnes contenant les variables de mesures numériques qui seront utilisées pour déterminer les différences entre les groupes.

Dans cette feuille de travail, Gpe niveau correspond à la colonne de groupement et indique le parcours pédagogique actuel dans lequel le directeur d'établissement a placé chaque étudiant. Score du test et Motivation sont les variables de prédiction permettant de déterminer le parcours pédagogique de chaque étudiant.

C1	C2	C3
Parcours	Score du test	Motivation
3	1021	44
2	1152	56
1	1224	61
3	1077	46
2	1149	55
2	1192	49

Fonction discriminante

Sélectionnez la fonction discriminante à utiliser pour l'analyse.

Linéaire : effectuez une analyse discriminante linéaire si vous pouvez supposer que les groupes ont la même matrice de covariance. Pour plus d'informations, reportez-vous à la rubrique Qu'est-ce qu'une analyse discriminante linéaire ?.
Quadratique : effectuez une analyse discriminante quadratique si vous ne pouvez pas supposer que les groupes ont la même matrice de covariance. Pour plus d'informations, reportez-vous à la rubrique Qu'est-ce qu'une analyse discriminante quadratique ?.

Remarque

Vous pouvez effectuer l'analyse deux fois, en utilisant chaque fonction discriminante, puis comparer les résultats pour déterminer la fonction la plus adaptée à vos données. La comparaison de la proportion de classements corrects est une méthode courante pour évaluer la fonction discriminante. Une autre méthode consiste à traiter certaines observations dont les groupes sont connus comme s'ils étaient inconnus, puis à déterminer si la fonction discriminante prévoit correctement les groupes connus.

Utiliser la validation croisée

Sélectionnez cette option pour compenser un taux d'erreur apparent optimiste relatif aux observations mal classées. Le taux d'erreur apparent est le pourcentage d'observations mal classées. Ce nombre tend à être optimiste, car les données classées sont également les données utilisées pour générer la fonction de classement.

Avec la validation croisée, Minitab omet les observations une par une et calcule la fonction discriminante avec les observations restantes. Ensuite, Minitab prévoit le groupe pour l'observation omise. Si la proportion de groupes corrects est élevée, vous pouvez vous fier aux prévisions.

Si vous utilisez la validation croisée, Minitab affiche un tableau récapitulatif supplémentaire et ajoute des informations sur la validation croisée au tableau Récapitulatif des observations mal classées.

Remarque

Une autre méthode pour calculer un taux d'erreur plus réaliste est de partager vos données en deux parties. Utilisez une partie pour créer la fonction discriminante et l'autre comme ensemble de validation. Prévoyez l'appartenance aux groupes de l'ensemble de validation et calculez le taux d'erreur sous forme de pourcentage de données mal classées.

Stockage

Vous pouvez enregistrer les résultats de votre analyse dans la feuille de travail de façon à pouvoir les utiliser dans d'autres analyses, graphiques et macros. Minitab enregistre les résultats sélectionnés dans la colonne que vous indiquez. Le nom des colonnes de stockage pour les ajustements et ajustements à validation croisée se termine par un chiffre qui augmente lorsque vous enregistrez plusieurs fois ces résultats.

Fonction discriminante linéaire: Indiquez des colonnes pour stocker les coefficients de la fonction discriminante linéaire. Entrez une colonne pour chaque groupe. Minitab stocke une colonne pour chaque fonction et une ligne pour chaque coefficient. La constante est stockée dans la première ligne de chaque colonne.
Valeurs ajustées: Sélectionnez cette option pour stocker les valeurs ajustées. Pour une observation, la valeur ajustée est le groupe dans lequel elle est classée. Minitab stocke les identificateurs de groupes dans la colonne AJUS1, avec une ligne pour chaque observation dans les données.
Valeurs ajustées de la validation croisée: Sélectionnez cette option pour stocker les valeurs ajustées lorsque la discrimination est effectuée avec validation croisée. Pour une observation, la valeur ajustée est le groupe dans lequel elle est classée. Minitab stocke les identificateurs de groupes pour validation croisée dans la colonne VAL AJU X1, avec une ligne pour chaque observation dans les données.