Interprétation de toutes les statistiques et de tous les graphiques pour la fonction Analyse discriminante

Obtenez des définitions et bénéficiez de conseils en matière d'interprétation pour chaque statistique et chaque graphique fournis avec l'analyse discriminante.

Groupe vrai

Groupe dans lequel une observation est réellement classée. Le groupe vrai est déterminé d'après les valeurs de la colonne de groupement de la feuille de travail.

Interprétation

Pour évaluer le classement des observations dans chaque groupe, comparez les groupes où les observations ont été placées avec leurs groupes vrais.

Récapitulatif du classement

Mettre dans
groupe
Groupe vrai
123
15950
21533
30257
Nombre total606060
N correct 595357
Proportion0,9830,8830,950

La colonne 2 de ce tableau Récapitulatif du classement indique que 53 observations du groupe 2 lui ont été correctement affectées. En revanche, 5 observations du groupe 2 ont été placées dans le groupe 1 et 2 observations du groupe 2 ont été placées dans le groupe 3. Ainsi, 7 des observations du groupe 2 ont été classées à tort dans d'autres groupes.

Récapitulatif des observations mal classées

ObservationGroupe vraiGroupe
de préd.
GroupeDistance
quadratique
Probabilité
4**1213,5240,438
      23,0280,562
      325,5790,000
65**2112,7640,677
      24,2440,323
      329,4190,000
71**2113,3570,592
      24,1010,408
      327,0970,000
78**2112,3270,775
      24,8010,225
      329,6950,000
79**2111,5280,891
      25,7320,109
      332,5240,000
100**2115,0160,878
      28,9620,122
      338,2130,000
107**23139,02260,000
      27,36040,032
      30,52490,968
116**23131,8980,000
      27,9130,285
      36,0700,715
123**32130,1640,000
      25,6620,823
      38,7380,177
124**32126,3280,000
      24,0540,918
      38,8870,082
125**32128,5420,000
      23,0590,521
      33,2300,479

La ligne 1 de ce tableau Récapitulatif des observations mal classées indique que l'observation 4 devait appartenir au groupe 2 selon les prévisions, mais appartient en fait au groupe 1.

Mettre dans groupe

Groupe auquel une observation est censée appartenir d'après les prévisions de l'analyse discriminante.

Interprétation

Pour évaluer le classement des observations dans chaque groupe, comparez les groupes où les observations ont été placées avec leurs groupes vrais. Par exemple, la ligne 2 du tableau Récapitulatif du classement ci-dessous indique qu'un total de 57 observations (1 + 53 + 3) ont été mises dans le groupe 2. Sur ces 57 observations, 53 ont été correctement affectées. Toutefois, 1 observation qui a été placée dans le groupe 2 appartenait en réalité au groupe 1, et 3 observations appartenaient au groupe 3. Par conséquent, 4 des observations prévues comme appartenant au groupe 2 provenaient en fait d'autres groupes.

Récapitulatif du classement

Mettre dans
groupe
Groupe vrai
123
15950
21533
30257
Nombre total606060
N correct 595357
Proportion0,9830,8830,950

Nombre total

Nombre total d'observations figurant dans chaque groupe vrai.

N correct

Nombre d'observations correctement placées dans chaque groupe vrai. Minitab affiche le N correct pour chaque groupe vrai et le N correct total pour tous les groupes.

Interprétation

Utilisez la valeur du N correct pour connaître le nombre d'observations de votre fichier de données appartenant au groupe auquel elles ont été affectées selon les prévisions. Par exemple, pour le groupe 1, supposons que la valeur du N correct soit 52 et que le N total soit 60. Cela suggère que 60 valeurs sont identifiées comme appartenant au groupe 1, d'après les valeurs de la colonne de groupement de la feuille de travail. Sur ces 60 observations, 52 sont censées appartenir au groupe 1, d'après la fonction discriminante utilisée pour l'analyse. Le nombre d'observations placées correctement dans chaque groupe vrai est donc égal à 52.

Proportion

Proportion d'observations correctement placées dans chaque groupe vrai.

Interprétation

Utilisez la proportion d'observations correctement placées dans chaque groupe pour déterminer si vos observations sont bien classées. Par exemple, les proportions du tableau Récapitulatif du classement fournissent les indications suivantes :

  • 98,3 % des observations du groupe 1 sont placées correctement.
  • 88,3 % des observations du groupe 2 sont placées correctement.
  • 95 % des observations du groupe 3 sont placées correctement.

Par conséquent, c'est le classement des observations dans le groupe 2 qui présente le plus de problèmes.

Récapitulatif du classement

Mettre dans
groupe
Groupe vrai
123
15950
21533
30257
Nombre total606060
N correct 595357
Proportion0,9830,8830,950

N

Nombre de valeurs présentes dans le fichier de données. N est égal au nombre total d'observations dans tous les groupes.

Proportion correcte

Proportion de classements corrects pour tous les groupes. Cette valeur est égale au nombre d'observations correctement placées (N Correct) divisé par le nombre total d'observations (N).

Distance quadratique entre les groupes

Distance quadratique entre le centre d'un groupe (moyenne) et celui d'un autre groupe (moyenne). Une observation est classée dans un groupe si sa distance quadratique (également appelée distance de Mahalanobis) au centre du groupe (moyenne) est le minimum.

Remarque

Si vous utilisez la fonction quadratique, Minitab affiche le tableau Distance quadratique généralisée. Pour plus d'informations sur le calcul des distances quadratiques pour chaque fonction, reportez-vous à la rubrique Distance et fonctions discriminantes pour la fonction Analyse discriminante.

Interprétation

Bien que les valeurs de distances fournissent peu d'informations, vous pouvez comparer les distances pour observer les différences entre les groupes. Par exemple, les résultats suivants indiquent que la distance entre les groupes 1 et 3 est la plus importante (48,0911). La différence entre les groupes 1 et 2 est de 12,9853 et celle entre les groupes 2 et 3 est de 11,3197.

Distance quadratique entre les groupes

123
10,000012,985348,0911
212,98530,000011,3197
348,091111,31970,0000

Fonction discriminante linéaire pour les groupes

La fonction discriminante linéaire pour les groupes indique l'équation linéaire associée à chaque groupe. Les scores discriminants linéaires de chaque groupe correspondent aux coefficients de régression dans l'analyse de régression multiple.

Interprétation

Utilisez la fonction discriminante linéaire pour les groupes afin de déterminer comment se distinguent les variables de prédiction entre les groupes. Par exemple, lorsque vous disposez de trois groupes, Minitab estime une fonction pour faire la distinction entre les groupes suivants :
  • Le groupe 1 et les groupes 2 et 3.
  • Le groupe 2 et les groupes 1 et 3.
  • Le groupe 3 et les groupes 1 et 2.

Les groupes comportant la fonction discriminante linéaire la plus grande, ou les coefficients de régression les plus grands, contribuent le plus au classement des observations. Par exemple, dans les résultats suivants, le groupe 1 comporte la fonction discriminante linéaire la plus importante (17,4) pour les scores de tests, ce qui indique que les scores de tests du groupe 1 contribuent plus que ceux des groupes 2 ou 3 au classement de l'appartenance aux groupes. Le groupe 3 a la fonction discriminante linéaire la plus importante pour la motivation, ce qui indique que les scores de motivation du groupe 3 contribuent plus que ceux des groupes 1 ou 2 au classement de l'appartenance aux groupes.

Fonction discriminante linéaire pour les groupes

123
Constante-9707,5-9269,0-8921,1
Score du test17,417,016,7
Motivation-3,2-3,7-4,3

Moyenne de regroupement

La moyenne de regroupement est la moyenne pondérée des moyennes de chaque groupe vrai. Pour afficher la moyenne de regroupement, vous devez cliquer sur Options et sélectionner Résultats ci-dessus plus moyenne, écarts types et récapitulatif des covariances lorsque vous effectuez l'analyse.

Interprétation

Utilisez la moyenne de regroupement pour décrire le centre de toutes les observations dans les données. Par exemple, dans les résultats suivants, la moyenne globale des scores de tests pour tous les groupes est égale à 1102,1.

Moyennes de groupe


Moyenne de
regroupement
Moyennes du groupe
Variable123
Score du test1102,11127,41100,61078,3
Motivation47,05653,60047,41740,150

Moyennes du groupe

Somme des valeurs dans chaque groupe véritable divisée par le nombre de valeurs (présentes) dans chacun de ces groupes. Pour afficher les moyennes des groupes, vous devez cliquer sur Options et sélectionner Résultats ci-dessus plus moyenne, écarts types et récapitulatif des covariances lorsque vous effectuez l'analyse.

Interprétation

Utilisez les moyennes de groupes pour décrire chaque vrai groupe avec une seule valeur représentant le centre des données. Par exemple, dans les résultats suivants, le groupe 1 a le score de test moyen le plus élevé (1127,4), tandis que le groupe 3 a le plus faible (1078,3). Le score de test moyen pour le groupe 2 est au milieu (1100,6).

Moyennes de groupe


Moyenne de
regroupement
Moyennes du groupe
Variable123
Score du test1102,11127,41100,61078,3
Motivation47,05653,60047,41740,150

Ecart type de regroupement

L'écart type regroupé est une moyenne pondérée des écarts types de chaque groupe vrai. Pour afficher l'écart type regroupé, vous devez cliquer sur Options et sélectionner Résultats ci-dessus plus moyenne, écarts types et récapitulatif des covariances lorsque vous effectuez l'analyse.

Interprétation

Utilisez l'écart type regroupé pour déterminer la dispersion des points de données individuels par rapport à la moyenne de leur groupe vrai. Par exemple, dans les résultats suivants, l'écart type regroupé des scores de tests de l'ensemble des groupes est égal à 8,109.

Ecarts types de groupe


Ecart type de
regroupement
EcTyp du groupe
Variable123
Score du test8,1098,3089,2666,511
Motivation2,9942,4093,2433,251

Ecart type des groupes

Mesure la plus courante de la dispersion des données par rapport à la moyenne. L'écart type des groupes est l'écart type de chaque vrai groupe. Pour afficher les écarts types des groupes, vous devez cliquer sur Options et sélectionner Résultats ci-dessus plus moyenne, écarts types et récapitulatif des covariances lorsque vous effectuez l'analyse.

Interprétation

Utilisez l'écart type des groupes pour déterminer la dispersion des données par rapport à la moyenne dans chaque véritable groupe. Par exemple, dans les résultats suivants, les scores de tests du groupe 2 présentent l'écart type le plus important (9,266). Cela indique que les scores de tests du groupe 2 ont la variabilité la plus élevée des trois groupes. Le groupe 3 a le plus petit écart type (6,511) et la variabilité la plus faible entre les scores de tests des trois groupes.

Ecarts types de groupe


Ecart type de
regroupement
EcTyp du groupe
Variable123
Score du test8,1098,3089,2666,511
Motivation2,9942,4093,2433,251

Matrice de covariance groupée

Matrice pondérée de la relation entre toutes les observations dans tous les groupes. La matrice de covariance de regroupement est obtenue en calculant la moyenne des matrices de covariance du groupe élément par élément.

Pour afficher la matrice de covariance groupée, vous devez cliquer sur Options et sélectionner Résultats ci-dessus plus moyenne, écarts types et récapitulatif des covariances lorsque vous effectuez l'analyse.

Matrice de covariance

Matrice non normalisée indiquant la relation entre chaque paire de variables. La covariance est semblable au coefficient de corrélation, qui est égal à la covariance divisée par le produit des écarts types des variables.

Pour afficher la matrice de covariance de chaque groupe, vous devez cliquer sur Options et sélectionner Résultats ci-dessus plus moyenne, écarts types et récapitulatif des covariances lorsque vous effectuez l'analyse.

Observation

Numéro de chaque observation. Le numéro d'observation correspond à la ligne de l'observation classée dans la feuille de travail Minitab. Minitab affiche les symboles ** après le numéro d'observation si celle-ci est mal classée (autrement dit, si le groupe vrai est différent du groupe prévu).

Pour afficher le groupe prévu et le groupe vrai pour les observations de votre fichier de données, vous devez cliquer sur Options et sélectionner Résultats ci-dessus plus récapitulatif complet des classements lorsque vous effectuez l'analyse.

Groupe de préd.

Le groupe prévu pour chaque observation correspond à l'appartenance au groupe affectée par Minitab à l'observation en fonction de la distance quadratique prévue. Pour afficher le groupe prévu et le groupe vrai pour chaque observation de votre fichier de données, vous devez cliquer sur Options et sélectionner Résultats ci-dessus plus récapitulatif complet des classements lorsque vous effectuez l'analyse.

Interprétation

Comparez le groupe prévu au groupe vrai pour chaque observation afin de déterminer si l'observation a été classée correctement. Si le groupe prévu est significativement différent du groupe vrai, l'observation a été mal classée.

Groupe de valeurs X

Le groupe prévu avec la validation croisée (Valeur X) correspond à l'appartenance au groupe affectée par Minitab à l'observation en fonction de la distance quadratique prévue avec la validation croisée. Pour afficher le groupe prévu avec la validation croisée pour chaque observation, vous devez sélectionner Utiliser la validation croisée dans la boîte de dialogue principale, puis cliquer sur Options et sélectionner Résultats ci-dessus plus récapitulatif complet des classements lorsque vous effectuez l'analyse.

Interprétation

Comparez le groupe prévu avec la validation croisée et le groupe vrai pour chaque observation afin de déterminer si l'observation a été classée correctement. Si le groupe prévu avec la validation croisée est différent du groupe vrai, l'observation a été mal classée.

Important

Le groupe prévu avec la validation croisée omet une observation pour créer la règle de discrimination, puis pour déterminer si la règle fonctionne bien pour cette observation spécifique. Lorsque vous n'utilisez pas la validation croisée, vous biaisez la règle de discrimination en utilisant cette observation pour créer la règle.

Distance quadratique

Valeurs prévues de la distance quadratique pour chaque observation de chaque groupe. La valeur de distance quadratique indique l'éloignement de l'observation à partir de la moyenne de chaque groupe. Pour afficher la distance quadratique pour chaque observation dans vos données, vous devez cliquer sur Options et sélectionner Résultats ci-dessus plus récapitulatif complet des classements lorsque vous effectuez l'analyse.

Remarque

Si vous utilisez la validation croisée lorsque vous effectuez l'analyse, Minitab calcule la distance quadratique prévue pour chaque observation avec et sans la validation croisée (Valeur X et Prév, respectivement). Pour plus d'informations sur le calcul des distances quadratiques, reportez-vous à la rubrique Distance et fonctions discriminantes pour la fonction Analyse discriminante.