Ingresar los datos para Análisis de los componentes principales

Estadísticas > Análisis multivariado > Componentes principales

Especifique los datos para su análisis, ingrese el número de componentes que se calcularán y especifique el tipo de matriz.

Ingresar los datos

En Variables, especifique las columnas de datos que desea analizar. Debe tener dos o más columnas de datos numéricos, donde cada columna represente una medición diferente. Si hay un valor faltante en cualquiera de las columnas, Minitab ignora toda la fila. Minitab excluye los valores faltantes del cálculo de la matriz de correlación o de covarianzas.

En esta hoja de trabajo, cada columna contiene mediciones para un tipo diferente de información sobre una solicitud de préstamo.

C1 C2 C3 C4 C5 C6 C7 C8
Ingreso Educación Edad Residencia Empleo Ahorros Deudas Tarjetas de crédito
50000 16 28 2 2 5000 1200 2
72000 18 35 10 8 12000 5400 4
61000 18 36 6 5 15000 1000 2
88000 20 35 4 4 980 1100 4
91100 18 38 8 9 20000 0 1
45100 14 41 15 14 3900 22000 4

Número de componentes que se calculará

Ingrese el número de componentes principales que usted desea que Minitab calcule. Si tiene un número grande de variables, se recomienda especificar un número más pequeño de componentes para reducir la cantidad de salida. Si desconoce cuántos componentes ingresar, puede dejar este campo en blanco. Si no especifica un número, Minitab calcula el número máximo de componentes, que es igual al número de variables. Luego puede utilizar la salida para determinar cuántos componentes explican la mayor parte de la variación en las variables originales.

Tipo de matriz

Seleccione el tipo de matriz que se usará para calcular los componentes principales.

  • Correlación: Utilice cuando sus variables tengan diferentes escalas y usted desea ponderar todas las variables por igual. Por ejemplo, si algunas de las variables usan una escala de 1 a 5 y otras una escala de 1 a 10, utilice la matriz de correlación para estandarizar las escalas.
  • Covarianza: Utilice cuando sus variables usan la misma escala o cuando sus variables tengan diferentes escalas, pero usted desea dar mayor énfasis a variables con varianzas más altas.

Por ejemplo, supongamos que usted cuenta diferentes especies de organismos en varios sitios de muestras. Si selecciona la matriz de covarianzas, las especies más comunes mostrarán varianzas más altas y recibirán mayor énfasis. Especies muy raras no afectarán tanto el análisis. Si selecciona una matriz de correlación, todas las especies se ponderan por igual. Por lo tanto, especies muy raras pueden contribuir significativamente a los resultados del análisis. Por lo tanto, la decisión depende del objetivo de su estudio.