Interpretar todos los estadísticos y gráficas para Análisis discriminante

Encuentre definiciones y ayuda para interpretar cada uno de los estadísticos y gráficas que se proporcionan con el análisis discriminante.

En este tema

Grupo verdadero
Colocar en un grupo
N total
N correcto
Proporción
N
Proporción correcta
Distancia al cuadrado entre grupos
Función discriminante lineal para los grupos
Media agrupada

Medias de grupo
Desv.Est. agrupada
Desv.Est. de los grupos
Matriz de covarianza agrupada
Matriz de covarianza
Observación
Grupo pronosticado
Grupo de val-X
Distancia al cuadrado

Grupo verdadero

El grupo real en el cual se clasifica una observación. El grupo verdadero es determinado por los valores en la columna de agrupación de la hoja de trabajo.

Interpretación

Para evaluar la clasificación de las observaciones en cada grupo, compare los grupos en los que se colocaron las observaciones con los grupos verdaderos.

Resumen de clasificación

Colocar en un grupo	Grupo verdadero
Colocar en un grupo	1	2	3
1	59	5	0
2	1	53	3
3	0	2	57
N Total	60	60	60
N correcta	59	53	57
Proporción	0.983	0.883	0.950

La columna 2 de esta tabla Resumen de clasificación muestra que 53 observaciones fueron asignadas correctamente al Grupo 2. Sin embargo, cinco observaciones del Grupo 2 fueron colocadas en el Grupo 1 y dos observaciones del Grupo 2 fueron colocadas en el Grupo 3. Por lo tanto, siete de las observaciones del Grupo 2 fueron clasificadas erróneamente en otros grupos.

Resumen da las observaciones clasificadas incorrectamente

Observación	Grupo verdadero	Grupo de predictores	Grupo	Distancia cuadrada	Probabilidad
4**	1	2	1	3.524	0.438
			2	3.028	0.562
			3	25.579	0.000
65**	2	1	1	2.764	0.677
			2	4.244	0.323
			3	29.419	0.000
71**	2	1	1	3.357	0.592
			2	4.101	0.408
			3	27.097	0.000
78**	2	1	1	2.327	0.775
			2	4.801	0.225
			3	29.695	0.000
79**	2	1	1	1.528	0.891
			2	5.732	0.109
			3	32.524	0.000
100**	2	1	1	5.016	0.878
			2	8.962	0.122
			3	38.213	0.000
107**	2	3	1	39.0226	0.000
			2	7.3604	0.032
			3	0.5249	0.968
116**	2	3	1	31.898	0.000
			2	7.913	0.285
			3	6.070	0.715
123**	3	2	1	30.164	0.000
			2	5.662	0.823
			3	8.738	0.177
124**	3	2	1	26.328	0.000
			2	4.054	0.918
			3	8.887	0.082
125**	3	2	1	28.542	0.000
			2	3.059	0.521
			3	3.230	0.479

La fila 1 de esta tabla Resumen de observaciones clasificadas erróneamente muestra que se pronosticó que la observación 4 pertenecería al Grupo 2, pero en realidad pertenece al Grupo 1.

Colocar en un grupo

El grupo al que se predice que pertenece una observación con base en el análisis discriminante.

Interpretación

Para evaluar la clasificación de las observaciones en cada grupo, compare los grupos en los que se colocaron las observaciones con los grupos verdaderos. Por ejemplo, la fila 2 de la tabla Resumen de clasificación muestra que un total de 1 + 53 + 3 = 57 observaciones fueron colocadas en el Grupo 2. De esas 57 observaciones, 53 fueron asignadas correctamente al Grupo 2. Sin embargo, una observación que fue puesta en el Grupo 2 era en realidad del Grupo 1 y tres observaciones colocadas en el Grupo 2 eran realmente del Grupo 3. Por lo tanto, cuatro de las observaciones que se pronosticó que pertenecían al Grupo 2 eran en realidad de otros grupos.

Resumen de clasificación

Colocar en un grupo	Grupo verdadero
Colocar en un grupo	1	2	3
1	59	5	0
2	1	53	3
3	0	2	57
N Total	60	60	60
N correcta	59	53	57
Proporción	0.983	0.883	0.950

N total

El número total de observaciones en cada grupo verdadero.

N correcto

El número de observaciones colocadas correctamente en cada grupo verdadero. Minitab muestra el N correcto para cada grupo verdadero y la N correcto total de todos los grupos.

Interpretación

Utilice el valor de N correcto para determinar cuántas observaciones del conjunto de datos se pronosticó que pertenecerían al grupo al que fueron asignadas. Por ejemplo, para el Grupo 1, supongamos que el valor de N correcto es 52 y el valor de N total es 60. Esto indica que 60 valores se identifican como pertenecientes al Grupo 1 con base en los valores de la columna de agrupación de la hoja de trabajo. De esas 60 observaciones, se pronosticó que 52 pertenecerían al Grupo 1 de acuerdo con la función discriminante utilizada para el análisis. Por lo tanto, el número de observaciones que se colocaron correctamente en cada grupo verdadero es 52.

Proporción

La proporción de observaciones colocadas correctamente en cada grupo verdadero.

Interpretación

Utilice la proporción de observaciones colocadas correctamente en cada grupo para evaluar qué tan bien se clasifican las observaciones. Por ejemplo, las proporciones en la tabla Resumen de clasificación indican lo siguiente:

El 98.3% de las observaciones del grupo 1 se colocaron correctamente.
El 88.3% de las observaciones del grupo 2 se colocaron correctamente.
El 95% de las observaciones del grupo 3 se colocaron correctamente.

Por lo tanto, la mayoría de los problemas estuvo en clasificar las observaciones en el grupo 2.

Resumen de clasificación

Colocar en un grupo	Grupo verdadero
Colocar en un grupo	1	2	3
1	59	5	0
2	1	53	3
3	0	2	57
N Total	60	60	60
N correcta	59	53	57
Proporción	0.983	0.883	0.950

N

El número de valores presentes en el conjunto de datos. N es igual al número total de observaciones en todos los grupos.

Proporción correcta

La proporción de clasificaciones correctas para todos los grupos. Este valor es igual al número de observaciones colocadas correctamente (N correcto) dividido entre el número total de observaciones (N).

Distancia al cuadrado entre grupos

La distancia al cuadrado desde el centro de un grupo (media) hasta el centro de otro grupo (media). Una observación se clasifica en un grupo si la distancia al cuadrado (también denominada distancia de Mahalanobis) de la observación hasta el centro del grupo (media) es la distancia mínima.

Nota

Si usted utiliza la función cuadrática, Minitab muestra la tabla Distancia al cuadrado generalizada. Para obtener más información sobre cómo calcular las distancias al cuadrado para cada función, vaya a Funciones de distancia y discriminante para Análisis discriminante.

Interpretación

Aunque los valores de distancia no ofrecen mucha información por sí solos, usted puede comparar las distancias para determinar qué tan diferentes entre sí son los grupos. Por ejemplo, los siguientes resultados indican que la mayor distancia está entre los grupos 1 y 3 (48.0911). La diferencia entre los grupos 1 y 2 es 12.9853, mientras que la diferencia entre los grupos 2 y 3 es 11.3197.

Distancia cuadrada entre grupos

	1	2	3
1	0.0000	12.9853	48.0911
2	12.9853	0.0000	11.3197
3	48.0911	11.3197	0.0000

Función discriminante lineal para los grupos

La función discriminante lineal para los grupos indica la ecuación lineal asociada a cada grupo. Las puntuaciones discriminantes lineales para cada grupo corresponden a los coeficientes de regresión en el análisis de regresión múltiple.

Interpretación

Utilice la función discriminante lineal para los grupos para determinar cómo diferencian las variables predictoras entre los grupos. Por ejemplo, cuando usted tiene tres grupos, Minitab estima una función para discriminar entre los siguientes grupos:

Grupo 1 y grupos 2 y 3
Grupo 2 y grupos 1 y 3
Grupo 3 y grupos 1 y 2

Los grupos con la función discriminante lineal o los coeficientes de regresión más grandes son los que más contribuyen a la clasificación de las observaciones. Por ejemplo, en los siguientes resultados, el grupo 1 tiene la función discriminante linear más grande (17.4) para las puntuaciones de prueba, lo que indica que las puntuaciones de prueba del grupo 1 contribuyen más que las del grupo 2 o el grupo 3 a la clasificación de los miembros de los grupos. El grupo 3 tiene la función discriminante lineal más grande para la motivación, lo que indica que las puntuaciones de motivación del grupo 3 contribuyen más que las del grupo 1 o el grupo 2 a la clasificación de los miembros de los grupos.

Función discriminativa lineal para grupos

	1	2	3
Constante	-9707.5	-9269.0	-8921.1
Puntuación prueba	17.4	17.0	16.7
Motivación	-3.2	-3.7	-4.3

Media agrupada

La media agrupada es el promedio ponderado de las medias de cada grupo verdadero. Para mostrar la media agrupada, debe hacer clic en Opciones y seleccionar Arriba más media, desv. est. y resumen de covarianza cuando realice el análisis.

Interpretación

Utilice la media agrupada para describir el centro de todas las observaciones en los datos. Por ejemplo, en los siguientes resultados, la media de puntuación general de la prueba para todos los grupos es 1102.1

Medias de grupo

	Media agrupada	Medias de grupo
Variable	Media agrupada	1	2	3
Puntuación prueba	1102.1	1127.4	1100.6	1078.3
Motivación	47.056	53.600	47.417	40.150

Medias de grupo

La suma de los valores de cada grupo verdadero dividida entre el número de valores (presentes) en cada grupo verdadero. Para mostrar las medias de los grupos, debe hacer clic en Opciones y seleccionar Arriba más media, desv. est. y resumen de covarianza cuando realice el análisis.

Interpretación

Utilice las medias de los grupos para describir cada grupo verdadero con un solo valor que representa el centro de los datos. Por ejemplo, en los siguientes resultados, el grupo 1 tiene la puntuación media más alta de la prueba (1127.4), mientras que el grupo 3 tiene la puntuación media más baja de la prueba (1078.3). La puntuación media de la prueba para el grupo 2 está en el centro (1100.6).

Medias de grupo

	Media agrupada	Medias de grupo
Variable	Media agrupada	1	2	3
Puntuación prueba	1102.1	1127.4	1100.6	1078.3
Motivación	47.056	53.600	47.417	40.150

Desv.Est. agrupada

La desviación estándar agrupada es un promedio ponderado de las desviaciones estándar de cada grupo verdadero. Para mostrar la desviación estándar agrupada, debe hacer clic en Opciones y seleccionar Arriba más media, desv. est. y resumen de covarianza cuando realice el análisis.

Interpretación

Utilice la desviación estándar agrupada para determinar qué tan dispersos están los puntos individuales de los datos con respecto a la media de su grupo verdadero. Por ejemplo, en los siguientes resultados, la desviación estándar agrupada de las puntuaciones de la prueba para todos los grupos es 8.109.

Desviaciones estándar de grupos

	Desv.Est. agrupada	Desv.Est. para grupo
Variable	Desv.Est. agrupada	1	2	3
Puntuación prueba	8.109	8.308	9.266	6.511
Motivación	2.994	2.409	3.243	3.251

Desv.Est. de los grupos

La medida de dispersión más común, que indica qué tan dispersos están los datos alrededor de la media. La desviación estándar de los grupos es la desviación estándar de cada grupo verdadero. Para mostrar las desviaciones estándar de los grupos, debe hacer clic en Opciones y seleccionar Arriba más media, desv. est. y resumen de covarianza cuando realice el análisis.

Interpretación

Utilice la desviación estándar de los grupos para determinar qué tan dispersos están los datos con respecto a la media en cada grupo verdadero. Por ejemplo, en los siguientes resultados, las puntuaciones de la prueba para el Grupo 2 tienen la desviación estándar más alta (9.266). Esto indica que las puntuaciones de la prueba para el Grupo 2 tienen la mayor variabilidad de los tres grupos. El Grupo 3 tiene la menor desviación estándar (6.511) y la menor variabilidad de las puntuaciones de la prueba de los tres grupos.

Desviaciones estándar de grupos

	Desv.Est. agrupada	Desv.Est. para grupo
Variable	Desv.Est. agrupada	1	2	3
Puntuación prueba	8.109	8.308	9.266	6.511
Motivación	2.994	2.409	3.243	3.251

Matriz de covarianza agrupada

Una matriz ponderada de las relaciones entre todas las observaciones en todos los grupos. La matriz de covarianza agrupada se calcula al promediar las matrices de covarianza de los grupos individuales elemento por elemento.

Para mostrar la matriz de covarianza agrupada, debe hacer clic en Opciones y seleccionar Arriba más media, desv. est. y resumen de covarianza cuando realice el análisis.

Matriz de covarianza

Una matriz no estandarizada que indica la relación entre cada par de variables. La covarianza es similar al coeficiente de correlación, el cual es la covarianza dividida entre el producto de las desviaciones estándar de las variables.

Para mostrar la matriz de covarianza de cada grupo, debe hacer clic en Opciones y seleccionar Arriba más media, desv. est. y resumen de covarianza cuando realice el análisis.

Observación

El número de observación para cada observación. El número de observación corresponde a la fila de la observación clasificada en la hoja de trabajo de Minitab. Minitab muestra los símbolos ** después del número de observación si la observación fue clasificada erróneamente (es decir, si el grupo verdadero difiere del grupo pronosticado).

Para ver el grupo pronosticado y verdadero de cada observación del conjunto de datos, debe hacer clic en Opciones y seleccionar Arriba más el resumen de clasificación completo cuando realice el análisis.

Grupo pronosticado

El grupo pronosticado para cada observación es el grupo al que Minitab asigna la observación con base en la distancia al cuadrado pronosticada. Para ver el grupo pronosticado y verdadero de cada observación del conjunto de datos, debe hacer clic en Opciones y seleccionar Arriba más el resumen de clasificación completo cuando realice el análisis.

Interpretación

Compare el grupo pronosticado y el grupo verdadero de cada observación para determinar si la observación se clasificó correctamente. Si el grupo pronosticado difiere del grupo verdadero, entonces la observación se clasificó erróneamente.

Grupo de val-X

El grupo pronosticado usando validación cruzada (val-X) es el grupo al que Minitab asigna la observación con base en la distancia al cuadrado pronosticada usando validación cruzada. Para ver el grupo pronosticado al usar validación cruzada para cada observación, debe seleccionar Utilizar validación cruzada en el cuadro de diálogo principal y luego hacer clic en Opciones y seleccionar Arriba más el resumen de clasificación completo cuando realice el análisis.

Interpretación

Compare el grupo pronosticado usando validación cruzada y el grupo verdadero de cada observación para determinar si la observación se clasificó correctamente. Si el grupo pronosticado usando validación cruzada difiere del grupo verdadero, entonces la observación se clasificó erróneamente.

Important

El grupo pronosticado usando validación cruzada omite una observación para crear la regla de discriminación y luego ve qué tan bien funciona la regla para esa observación específica. Cuando no se utiliza validación cruzada, la regla de discriminación se sesga al usar esa observación para crear la regla.

Distancia al cuadrado

Los valores pronosticados de la distancia al cuadrado para cada observación de cada grupo. El valor de la distancia al cuadrado indica qué tan lejos está una observación con respecto a la media de cada grupo. Para ver la distancia al cuadrado de cada observación de los datos, debe hacer clic en Opciones y seleccionar Arriba más el resumen de clasificación completo cuando realice el análisis.

Nota

Si utiliza validación cruzada al realizar el análisis, Minitab calcula la distancia al cuadrado pronosticada para cada observación con validación cruzada (Val-X) o sin validación cruzada (Pred). Para obtener más información sobre cómo calcular las distancias al cuadrado, vaya a Funciones de distancia y discriminante para Análisis discriminante.