El grupo real en el cual se clasifica una observación. El grupo verdadero es determinado por los valores en la columna de agrupación de la hoja de trabajo.
Para evaluar la clasificación de las observaciones en cada grupo, compare los grupos en los que se colocaron las observaciones con los grupos verdaderos.
Colocar en un grupo | Grupo verdadero | ||
---|---|---|---|
1 | 2 | 3 | |
1 | 59 | 5 | 0 |
2 | 1 | 53 | 3 |
3 | 0 | 2 | 57 |
N Total | 60 | 60 | 60 |
N correcta | 59 | 53 | 57 |
Proporción | 0.983 | 0.883 | 0.950 |
La columna 2 de esta tabla Resumen de clasificación muestra que 53 observaciones fueron asignadas correctamente al Grupo 2. Sin embargo, cinco observaciones del Grupo 2 fueron colocadas en el Grupo 1 y dos observaciones del Grupo 2 fueron colocadas en el Grupo 3. Por lo tanto, siete de las observaciones del Grupo 2 fueron clasificadas erróneamente en otros grupos.
Observación | Grupo verdadero | Grupo de predictores | Grupo | Distancia cuadrada | Probabilidad |
---|---|---|---|---|---|
4** | 1 | 2 | 1 | 3.524 | 0.438 |
2 | 3.028 | 0.562 | |||
3 | 25.579 | 0.000 | |||
65** | 2 | 1 | 1 | 2.764 | 0.677 |
2 | 4.244 | 0.323 | |||
3 | 29.419 | 0.000 | |||
71** | 2 | 1 | 1 | 3.357 | 0.592 |
2 | 4.101 | 0.408 | |||
3 | 27.097 | 0.000 | |||
78** | 2 | 1 | 1 | 2.327 | 0.775 |
2 | 4.801 | 0.225 | |||
3 | 29.695 | 0.000 | |||
79** | 2 | 1 | 1 | 1.528 | 0.891 |
2 | 5.732 | 0.109 | |||
3 | 32.524 | 0.000 | |||
100** | 2 | 1 | 1 | 5.016 | 0.878 |
2 | 8.962 | 0.122 | |||
3 | 38.213 | 0.000 | |||
107** | 2 | 3 | 1 | 39.0226 | 0.000 |
2 | 7.3604 | 0.032 | |||
3 | 0.5249 | 0.968 | |||
116** | 2 | 3 | 1 | 31.898 | 0.000 |
2 | 7.913 | 0.285 | |||
3 | 6.070 | 0.715 | |||
123** | 3 | 2 | 1 | 30.164 | 0.000 |
2 | 5.662 | 0.823 | |||
3 | 8.738 | 0.177 | |||
124** | 3 | 2 | 1 | 26.328 | 0.000 |
2 | 4.054 | 0.918 | |||
3 | 8.887 | 0.082 | |||
125** | 3 | 2 | 1 | 28.542 | 0.000 |
2 | 3.059 | 0.521 | |||
3 | 3.230 | 0.479 |
La fila 1 de esta tabla Resumen de observaciones clasificadas erróneamente muestra que se pronosticó que la observación 4 pertenecería al Grupo 2, pero en realidad pertenece al Grupo 1.
El grupo al que se predice que pertenece una observación con base en el análisis discriminante.
Para evaluar la clasificación de las observaciones en cada grupo, compare los grupos en los que se colocaron las observaciones con los grupos verdaderos. Por ejemplo, la fila 2 de la tabla Resumen de clasificación muestra que un total de 1 + 53 + 3 = 57 observaciones fueron colocadas en el Grupo 2. De esas 57 observaciones, 53 fueron asignadas correctamente al Grupo 2. Sin embargo, una observación que fue puesta en el Grupo 2 era en realidad del Grupo 1 y tres observaciones colocadas en el Grupo 2 eran realmente del Grupo 3. Por lo tanto, cuatro de las observaciones que se pronosticó que pertenecían al Grupo 2 eran en realidad de otros grupos.
Colocar en un grupo | Grupo verdadero | ||
---|---|---|---|
1 | 2 | 3 | |
1 | 59 | 5 | 0 |
2 | 1 | 53 | 3 |
3 | 0 | 2 | 57 |
N Total | 60 | 60 | 60 |
N correcta | 59 | 53 | 57 |
Proporción | 0.983 | 0.883 | 0.950 |
El número total de observaciones en cada grupo verdadero.
El número de observaciones colocadas correctamente en cada grupo verdadero. Minitab muestra el N correcto para cada grupo verdadero y la N correcto total de todos los grupos.
Utilice el valor de N correcto para determinar cuántas observaciones del conjunto de datos se pronosticó que pertenecerían al grupo al que fueron asignadas. Por ejemplo, para el Grupo 1, supongamos que el valor de N correcto es 52 y el valor de N total es 60. Esto indica que 60 valores se identifican como pertenecientes al Grupo 1 con base en los valores de la columna de agrupación de la hoja de trabajo. De esas 60 observaciones, se pronosticó que 52 pertenecerían al Grupo 1 de acuerdo con la función discriminante utilizada para el análisis. Por lo tanto, el número de observaciones que se colocaron correctamente en cada grupo verdadero es 52.
La proporción de observaciones colocadas correctamente en cada grupo verdadero.
Utilice la proporción de observaciones colocadas correctamente en cada grupo para evaluar qué tan bien se clasifican las observaciones. Por ejemplo, las proporciones en la tabla Resumen de clasificación indican lo siguiente:
Por lo tanto, la mayoría de los problemas estuvo en clasificar las observaciones en el grupo 2.
Colocar en un grupo | Grupo verdadero | ||
---|---|---|---|
1 | 2 | 3 | |
1 | 59 | 5 | 0 |
2 | 1 | 53 | 3 |
3 | 0 | 2 | 57 |
N Total | 60 | 60 | 60 |
N correcta | 59 | 53 | 57 |
Proporción | 0.983 | 0.883 | 0.950 |
El número de valores presentes en el conjunto de datos. N es igual al número total de observaciones en todos los grupos.
La proporción de clasificaciones correctas para todos los grupos. Este valor es igual al número de observaciones colocadas correctamente (N correcto) dividido entre el número total de observaciones (N).
La distancia al cuadrado desde el centro de un grupo (media) hasta el centro de otro grupo (media). Una observación se clasifica en un grupo si la distancia al cuadrado (también denominada distancia de Mahalanobis) de la observación hasta el centro del grupo (media) es la distancia mínima.
Si usted utiliza la función cuadrática, Minitab muestra la tabla Distancia al cuadrado generalizada. Para obtener más información sobre cómo calcular las distancias al cuadrado para cada función, vaya a Funciones de distancia y discriminante para Análisis discriminante.
Aunque los valores de distancia no ofrecen mucha información por sí solos, usted puede comparar las distancias para determinar qué tan diferentes entre sí son los grupos. Por ejemplo, los siguientes resultados indican que la mayor distancia está entre los grupos 1 y 3 (48.0911). La diferencia entre los grupos 1 y 2 es 12.9853, mientras que la diferencia entre los grupos 2 y 3 es 11.3197.
1 | 2 | 3 | |
---|---|---|---|
1 | 0.0000 | 12.9853 | 48.0911 |
2 | 12.9853 | 0.0000 | 11.3197 |
3 | 48.0911 | 11.3197 | 0.0000 |
La función discriminante lineal para los grupos indica la ecuación lineal asociada a cada grupo. Las puntuaciones discriminantes lineales para cada grupo corresponden a los coeficientes de regresión en el análisis de regresión múltiple.
Los grupos con la función discriminante lineal o los coeficientes de regresión más grandes son los que más contribuyen a la clasificación de las observaciones. Por ejemplo, en los siguientes resultados, el grupo 1 tiene la función discriminante linear más grande (17.4) para las puntuaciones de prueba, lo que indica que las puntuaciones de prueba del grupo 1 contribuyen más que las del grupo 2 o el grupo 3 a la clasificación de los miembros de los grupos. El grupo 3 tiene la función discriminante lineal más grande para la motivación, lo que indica que las puntuaciones de motivación del grupo 3 contribuyen más que las del grupo 1 o el grupo 2 a la clasificación de los miembros de los grupos.
1 | 2 | 3 | |
---|---|---|---|
Constante | -9707.5 | -9269.0 | -8921.1 |
Puntuación prueba | 17.4 | 17.0 | 16.7 |
Motivación | -3.2 | -3.7 | -4.3 |
La media agrupada es el promedio ponderado de las medias de cada grupo verdadero. Para mostrar la media agrupada, debe hacer clic en Opciones y seleccionar Arriba más media, desv. est. y resumen de covarianza cuando realice el análisis.
Utilice la media agrupada para describir el centro de todas las observaciones en los datos. Por ejemplo, en los siguientes resultados, la media de puntuación general de la prueba para todos los grupos es 1102.1
Media agrupada | Medias de grupo | |||
---|---|---|---|---|
Variable | 1 | 2 | 3 | |
Puntuación prueba | 1102.1 | 1127.4 | 1100.6 | 1078.3 |
Motivación | 47.056 | 53.600 | 47.417 | 40.150 |
La suma de los valores de cada grupo verdadero dividida entre el número de valores (presentes) en cada grupo verdadero. Para mostrar las medias de los grupos, debe hacer clic en Opciones y seleccionar Arriba más media, desv. est. y resumen de covarianza cuando realice el análisis.
Utilice las medias de los grupos para describir cada grupo verdadero con un solo valor que representa el centro de los datos. Por ejemplo, en los siguientes resultados, el grupo 1 tiene la puntuación media más alta de la prueba (1127.4), mientras que el grupo 3 tiene la puntuación media más baja de la prueba (1078.3). La puntuación media de la prueba para el grupo 2 está en el centro (1100.6).
Media agrupada | Medias de grupo | |||
---|---|---|---|---|
Variable | 1 | 2 | 3 | |
Puntuación prueba | 1102.1 | 1127.4 | 1100.6 | 1078.3 |
Motivación | 47.056 | 53.600 | 47.417 | 40.150 |
La desviación estándar agrupada es un promedio ponderado de las desviaciones estándar de cada grupo verdadero. Para mostrar la desviación estándar agrupada, debe hacer clic en Opciones y seleccionar Arriba más media, desv. est. y resumen de covarianza cuando realice el análisis.
Utilice la desviación estándar agrupada para determinar qué tan dispersos están los puntos individuales de los datos con respecto a la media de su grupo verdadero. Por ejemplo, en los siguientes resultados, la desviación estándar agrupada de las puntuaciones de la prueba para todos los grupos es 8.109.
Desv.Est. agrupada | Desv.Est. para grupo | |||
---|---|---|---|---|
Variable | 1 | 2 | 3 | |
Puntuación prueba | 8.109 | 8.308 | 9.266 | 6.511 |
Motivación | 2.994 | 2.409 | 3.243 | 3.251 |
La medida de dispersión más común, que indica qué tan dispersos están los datos alrededor de la media. La desviación estándar de los grupos es la desviación estándar de cada grupo verdadero. Para mostrar las desviaciones estándar de los grupos, debe hacer clic en Opciones y seleccionar Arriba más media, desv. est. y resumen de covarianza cuando realice el análisis.
Utilice la desviación estándar de los grupos para determinar qué tan dispersos están los datos con respecto a la media en cada grupo verdadero. Por ejemplo, en los siguientes resultados, las puntuaciones de la prueba para el Grupo 2 tienen la desviación estándar más alta (9.266). Esto indica que las puntuaciones de la prueba para el Grupo 2 tienen la mayor variabilidad de los tres grupos. El Grupo 3 tiene la menor desviación estándar (6.511) y la menor variabilidad de las puntuaciones de la prueba de los tres grupos.
Desv.Est. agrupada | Desv.Est. para grupo | |||
---|---|---|---|---|
Variable | 1 | 2 | 3 | |
Puntuación prueba | 8.109 | 8.308 | 9.266 | 6.511 |
Motivación | 2.994 | 2.409 | 3.243 | 3.251 |
Una matriz ponderada de las relaciones entre todas las observaciones en todos los grupos. La matriz de covarianza agrupada se calcula al promediar las matrices de covarianza de los grupos individuales elemento por elemento.
Para mostrar la matriz de covarianza agrupada, debe hacer clic en Opciones y seleccionar Arriba más media, desv. est. y resumen de covarianza cuando realice el análisis.
Una matriz no estandarizada que indica la relación entre cada par de variables. La covarianza es similar al coeficiente de correlación, el cual es la covarianza dividida entre el producto de las desviaciones estándar de las variables.
Para mostrar la matriz de covarianza de cada grupo, debe hacer clic en Opciones y seleccionar Arriba más media, desv. est. y resumen de covarianza cuando realice el análisis.
El número de observación para cada observación. El número de observación corresponde a la fila de la observación clasificada en la hoja de trabajo de Minitab. Minitab muestra los símbolos ** después del número de observación si la observación fue clasificada erróneamente (es decir, si el grupo verdadero difiere del grupo pronosticado).
Para ver el grupo pronosticado y verdadero de cada observación del conjunto de datos, debe hacer clic en Opciones y seleccionar Arriba más el resumen de clasificación completo cuando realice el análisis.
El grupo pronosticado para cada observación es el grupo al que Minitab asigna la observación con base en la distancia al cuadrado pronosticada. Para ver el grupo pronosticado y verdadero de cada observación del conjunto de datos, debe hacer clic en Opciones y seleccionar Arriba más el resumen de clasificación completo cuando realice el análisis.
Compare el grupo pronosticado y el grupo verdadero de cada observación para determinar si la observación se clasificó correctamente. Si el grupo pronosticado difiere del grupo verdadero, entonces la observación se clasificó erróneamente.
El grupo pronosticado usando validación cruzada (val-X) es el grupo al que Minitab asigna la observación con base en la distancia al cuadrado pronosticada usando validación cruzada. Para ver el grupo pronosticado al usar validación cruzada para cada observación, debe seleccionar Utilizar validación cruzada en el cuadro de diálogo principal y luego hacer clic en Opciones y seleccionar Arriba más el resumen de clasificación completo cuando realice el análisis.
Compare el grupo pronosticado usando validación cruzada y el grupo verdadero de cada observación para determinar si la observación se clasificó correctamente. Si el grupo pronosticado usando validación cruzada difiere del grupo verdadero, entonces la observación se clasificó erróneamente.
El grupo pronosticado usando validación cruzada omite una observación para crear la regla de discriminación y luego ve qué tan bien funciona la regla para esa observación específica. Cuando no se utiliza validación cruzada, la regla de discriminación se sesga al usar esa observación para crear la regla.
Los valores pronosticados de la distancia al cuadrado para cada observación de cada grupo. El valor de la distancia al cuadrado indica qué tan lejos está una observación con respecto a la media de cada grupo. Para ver la distancia al cuadrado de cada observación de los datos, debe hacer clic en Opciones y seleccionar Arriba más el resumen de clasificación completo cuando realice el análisis.
Si utiliza validación cruzada al realizar el análisis, Minitab calcula la distancia al cuadrado pronosticada para cada observación con validación cruzada (Val-X) o sin validación cruzada (Pred). Para obtener más información sobre cómo calcular las distancias al cuadrado, vaya a Funciones de distancia y discriminante para Análisis discriminante.