Interpretar todos los estadísticos y gráficas para Correlación

Encuentre definiciones y ayuda para interpretar cada uno de los estadísticos y gráficas que se proporcionan con el análisis de correlación.

N

El tamaño (N) de la muestra es el número de puntos de datos completos para un par de variables. Cualquier fila con datos faltantes para una o un par de variables no cuenta para el tamaño de la muestra.

En esta tabla, el tamaño de la muestra para A y B es 6 porque ninguna fila tiene datos faltantes.
  C1 C2
  A B
1 18 2
2 17 20
3 12 16
4 19 22
5 15 32
6 6 25
En esta tabla, el tamaño de la muestra para A y B es 5 porque la tercera fila tiene un valor faltante.
  C1 C2
  A B
1 18 18
2 17 28
3 12 *
4 19 8
5 15 19
6 6 25
En esta tabla, el tamaño de la muestra para A y B es 5 porque solo la tercera fila tiene valores faltantes.
  C1 C2
  A B
1 18 9
2 28 5
3 * *
4 8 23
5 19 11
6 25 25
En esta tabla, el tamaño de la muestra para A y B es 2 porque cuatro filas diferentes tienen valores faltantes.
  C1 C2
  A B
1 18 20
2 28 *
3 * 9
4 8 3
5 19 *
6 * 3

Correlaciones de Pearson

La matriz de correlación muestra los valores de correlación, que miden el grado de relación lineal entre cada par de variables. Los valores de correlación se pueden ubicar entre -1 y +1. Si las dos variables tienden a aumentar o disminuir al mismo tiempo, el valor de correlación es positivo. Si una variable aumenta mientras la otra variable disminuye, el valor de correlación es negativo.

Interpretación

Utilice la matriz de correlación para evaluar la fuerza y dirección de la relación entre dos variables. Un valor de correlación alto y positivo indica que las variables miden la misma característica. Si los elementos no están altamente correlacionados, entonces los elementos pudieran medir diferentes características o no estar claramente definidos.

Correlations Age Residence Employ Savings Debt Residence 0.838 Employ 0.848 0.952 Savings 0.552 0.570 0.539 Debt 0.032 0.186 0.247 -0.393 Credit cards -0.130 0.053 0.023 -0.410 0.474

Existe una relación lineal positiva entre Residencia y Edad, Empleo y Edad y Empleo y Edad. Los coeficientes de correlación de Pearson de estos pares son:
  • Residencia y Edad, 0.838
  • Empleo y Edad, 0.848
  • Empleo y Residencia, 0.952
Estos valores indican que existe una relación positiva moderada entre las variables.
Existe una relación lineal negativa para los siguientes pares, con coeficientes de correlación de Pearson negativos:
  • Deuda y Ahorros, −0.393
  • Tarjetas de crédito y Edad, −0.130
  • Tarjetas de crédito y Ahorros, −0.410
La relación entre estas variables es negativa, lo cual indica que, a medida que aumenta la deuda, la educación y los ahorros disminuyen, e, igualmente, a medida que aumenta el número de tarjetas de crédito, los ahorros disminuyen.

Correlaciones de Spearman

Utilice el coeficiente de correlación de Spearman para examinar la fuerza y la dirección de la relación monótona entre dos variables continuas u ordinales. En una relación monótona, las variables tienden a moverse en la misma dirección relativa, pero no necesariamente a un ritmo constante. Para calcular la correlación de Spearman, Minitab jerarquiza los datos sin procesar. Luego, Minitab calcula el coeficiente de correlación con los datos jerarquizados.

Resistencia

El valor del coeficiente de correlación puede variar de −1 a +1. Mientras mayor sea el valor absoluto del coeficiente, más fuerte será la relación entre las variables.

Para la correlación de Spearman, un valor absoluto de 1 indica que los datos ordenados por rango son perfectamente lineales. Por ejemplo, una correlación de Spearman de −1 significa que el valor más alto de la Variable A está asociado con el valor más bajo de la Variable B, el segundo valor más alto de la Variable A está asociado con el segundo valor más bajo de la Variable B y así sucesivamente.

Dirección:

El signo del coeficiente indica la dirección de la relación. Si ambas variables tienden a aumentar o disminuir a la vez, el coeficiente es positivo y la línea que representa la correlación forma una pendiente hacia arriba. Si una variable tiende a incrementarse mientras la otra disminuye, el coeficiente es negativo y la línea que representa la correlación forma una pendiente hacia abajo.

Las siguientes gráficas muestran datos con valores específicos del coeficiente de correlación de Spearman para ilustrar diferentes patrones en la fuerza y la dirección de las relaciones entre las variables.

Ninguna relación: Rho de Spearman = 0

Los puntos se ubican de forma aleatoria en la gráfica, lo que indica que no existe relación entre las variables.

Relación positiva fuerte: Rho de Spearman = 0,948

Los puntos se ubican cerca de la línea, lo que indica que existe una fuerte relación entre las variables. La relación es positiva porque las variables aumentan al mismo tiempo.

Relación negativa fuerte: Rho de Spearman = 1,0

Los puntos se ubican cerca de la línea, lo que indica que existe una fuerte relación entre las variables. La relación es negativa porque a medida que una variable aumenta, la otra variable disminuye.

Nunca se debe concluir que los cambios en una variable causan cambios en otra basándose solamente en la correlación. Solo los experimentos controlados adecuadamente permiten determinar si una relación es causal.

Interpretación

Correlation: Age, Residence, Employ, Savings, Debt, Credit cards

Correlations Age Residence Employ Savings Debt Residence 0.824 Employ 0.830 0.912 Savings 0.570 0.571 0.496 Debt -0.198 -0.142 -0.056 -0.605 Credit cards -0.179 0.069 0.036 -0.480 0.353
Pairwise Spearman Correlations Sample 1 Sample 2 Correlation 95% CI for ρ P-Value Residence Age 0.824 ( 0.624, 0.922) 0.000 Employ Age 0.830 ( 0.636, 0.926) 0.000 Savings Age 0.570 ( 0.236, 0.783) 0.001 Debt Age -0.198 (-0.524, 0.178) 0.293 Credit cards Age -0.179 (-0.508, 0.197) 0.345 Employ Residence 0.912 ( 0.798, 0.963) 0.000 Savings Residence 0.571 ( 0.237, 0.784) 0.001 Debt Residence -0.142 (-0.479, 0.232) 0.454 Credit cards Residence 0.069 (-0.300, 0.419) 0.719 Savings Employ 0.496 ( 0.144, 0.737) 0.005 Debt Employ -0.056 (-0.408, 0.311) 0.768 Credit cards Employ 0.036 (-0.328, 0.392) 0.849 Debt Savings -0.605 (-0.804, -0.283) 0.000 Credit cards Savings -0.480 (-0.726, -0.124) 0.007 Credit cards Debt 0.353 (-0.020, 0.639) 0.056

En estos resultados, la correlación de Spearman entre Residencia y Edad es 0.824, lo que indica que existe una relación positiva entre las variables. El intervalo de confianza de rho es de 0.624 a 0.922. El valor p es 0.000, lo que indica que la relación es estadísticamente significativa en el nivel de α = 0.05.

La correlación de Spearman entre Deuda y Ahorros es -0.605 y entre Tarjetas de crédito y Ahorros es -0.480. La relación entre estas variables es negativa, lo que indica que a medida que Deuda y Tarjetas de crédito aumentan, Ahorros disminuye.

Filas utilizadas

Cuando los datos tienen valores presentes, el número de filas utilizadas es el mismo que el número de filas con datos. Cuando los datos tienen valores faltantes, el número puede ser un rango. El último número en el rango es el número de filas utilizadas para los pares de columnas con la menor cantidad de pares completos de puntos de datos. El número más grande en el rango es el número de filas utilizadas para los pares de columnas con los pares más completos de puntos de datos. Para ver el número de filas para cada par de columnas,muestre el Tabla de correlaciones en parejas.

Intervalos de confianza para Correlación

El intervalo de confianza proporciona un rango de valores probables para los coeficientes de correlación. Puesto que las muestras son aleatorias, es poco probable que dos muestras de una población produzcan intervalos de confianza idénticos. Sin embargo, si usted repitiera muchas veces la muestra, un determinado porcentaje de los intervalos o bordes de confianza resultantes contendría el coeficiente de correlación desconocido. El porcentaje de estos intervalos o bordes de confianza que contiene el coeficiente de correlación es el nivel de confianza del intervalo.

Por ejemplo, un nivel de confianza de 95% indica que si usted toma 100 muestras aleatorias de la población, podría esperar que aproximadamente 95 de las muestras produzcan intervalos que contengan el coeficiente de correlación.

Un borde superior define un valor en comparación con el cual es probable que la diferencia de población sea menor. Un borde inferior define un valor en comparación con el cual es probable que la diferencia de población sea mayor.

Los intervalos de confianza para la correlación de Pearson son sensibles a la normalidad de la distribución bivariada subyacente. Si los datos se desvían de la normalidad, entonces los intervalos de confianza podrían ser inexactos, independientemente de la magnitud del tamaño de la muestra.

Los intervalos de confianza para las correlaciones de Spearman se basan en rangos y son menos sensibles al supuesto de la distribución bivariada subyacente.

Interpretación

El intervalo de confianza ayuda a evaluar la significancia práctica de los resultados. Utilice su conocimiento especializado para determinar si el intervalo de confianza incluye valores que tienen significancia práctica para su situación. Si el intervalo es demasiado amplio para ser útil, considere aumentar el tamaño de la muestra. Para obtener más información, vaya a Maneras de obtener un intervalo de confianza más preciso.

Correlation: Age, Residence, Employ, Savings, Debt, Credit cards

Pairwise Pearson Correlations Sample 1 Sample 2 Correlation 95% CI for ρ P-Value Residence Age 0.838 ( 0.684, 0.920) 0.000 Employ Age 0.848 ( 0.702, 0.926) 0.000 Savings Age 0.552 ( 0.240, 0.761) 0.002 Debt Age 0.032 (-0.332, 0.388) 0.865 Credit cards Age -0.130 (-0.468, 0.242) 0.494 Employ Residence 0.952 ( 0.901, 0.977) 0.000 Savings Residence 0.570 ( 0.264, 0.772) 0.001 Debt Residence 0.186 (-0.187, 0.512) 0.326 Credit cards Residence 0.053 (-0.313, 0.406) 0.779 Savings Employ 0.539 ( 0.222, 0.753) 0.002 Debt Employ 0.247 (-0.125, 0.557) 0.189 Credit cards Employ 0.023 (-0.340, 0.380) 0.906 Debt Savings -0.393 (-0.660, -0.038) 0.032 Credit cards Savings -0.410 (-0.671, -0.059) 0.024 Credit cards Debt 0.474 ( 0.138, 0.713) 0.008

En estos resultados, Residencia y Edad tienen una correlación lineal positiva de 0.838. Usted puede estar 95% seguro de que el coeficiente de correlación de la población está entre aproximadamente 0.684 y 0.920. Generalmente, cuando la correlación es más fuerte, el intervalo de confianza es más estrecho. Por ejemplo, Tarjetas de crédito y Edad tienen una débil correlación y el intervalo de confianza de 95% varía de -0.468 a 0.242.

Valor p

El valor p es una probabilidad que mide la evidencia en contra de la hipótesis nula. Un valor p más pequeño proporciona una evidencia más fuerte en contra de la hipótesis nula.

Interpretación

Utilice el valor p para determinar si el coeficiente de correlación es estadísticamente significativo.

Para determinar si el coeficiente de correlación es estadísticamente significativo, compare el valor p con el nivel de significancia. Por lo general, un nivel de significancia (denotado como α o alfa) de 0.05 funciona adecuadamente. Un nivel de significancia de 0.05 indica un riesgo de 5% de concluir que existe una diferencia cuando no hay una diferencia real.
Valor p ≤ α: La correlación entre las medias es estadísticamente significativa (Rechace H0)
Si el valor p es menor que o igual al nivel de significancia, la decisión es rechazar la hipótesis nula. Se puede concluir que la correlación es estadísticamente significativa. Utilice su conocimiento especializado para determinar si la diferencia es significativa desde el punto de vista práctico. Para obtener más información, vaya a Significancia estadística y práctica.
Valor p > α: La correlación no es estadísticamente significativa (No puede rechazar H0)
Si el valor p es mayor que el nivel de significancia, la decisión es que no se puede rechazar la hipótesis nula. No cuenta con suficiente evidencia para concluir que la correlación es estadísticamente significativa.

Los procedimientos del valor p para tanto la correlación de Pearson como la correlación de Spearman son robustos ante desviaciones de la normalidad. Los valores p generalmente son exactos para n ≥ 25, independientemente de la población de origen de la población.

Correlation: Age, Residence, Employ, Savings, Debt, Credit cards

Pairwise Pearson Correlations Sample 1 Sample 2 Correlation 95% CI for ρ P-Value Residence Age 0.838 ( 0.684, 0.920) 0.000 Employ Age 0.848 ( 0.702, 0.926) 0.000 Savings Age 0.552 ( 0.240, 0.761) 0.002 Debt Age 0.032 (-0.332, 0.388) 0.865 Credit cards Age -0.130 (-0.468, 0.242) 0.494 Employ Residence 0.952 ( 0.901, 0.977) 0.000 Savings Residence 0.570 ( 0.264, 0.772) 0.001 Debt Residence 0.186 (-0.187, 0.512) 0.326 Credit cards Residence 0.053 (-0.313, 0.406) 0.779 Savings Employ 0.539 ( 0.222, 0.753) 0.002 Debt Employ 0.247 (-0.125, 0.557) 0.189 Credit cards Employ 0.023 (-0.340, 0.380) 0.906 Debt Savings -0.393 (-0.660, -0.038) 0.032 Credit cards Savings -0.410 (-0.671, -0.059) 0.024 Credit cards Debt 0.474 ( 0.138, 0.713) 0.008

En estos resultados, hay muchos valores p que son menores que el nivel de significancia de 0.05, lo cual indica que los coeficientes de correlación de Pearson son estadísticamente significativos.

Nota

Hay casos en que, debido a puntos de datos extremos, el valor p pudiera ser pequeño, pero el intervalo de confianza es muy ancho. Por ejemplo, con Tarjetas de crédito y Deuda, el IC de 95% es muy ancho, pero el valor p es pequeño. Cuando usted examina la gráfica de matriz, puede ver un punto de los datos extremo.

Gráfica de matriz

Una gráfica de matriz es un arreglo de gráficas de dispersión. Cada gráfica de dispersión en la matriz grafica las puntuaciones de un par de elementos en los ejes X y Y.

Interpretación

Utilice la gráfica para evaluar visualmente la relación entre cada combinación de variables. Las relaciones pueden ser lineales, monótonas o ninguna de estas. Utilice también la gráfica de matriz para buscar valores atípicos que pueden influir en gran medida en los resultados. Para obtener más información sobre los tipos de relaciones, vaya a Relaciones lineales, no lineales y monótonas.

Esta gráfica de matriz sugiere que todos los pares de elementos tienen una relación lineal positiva.

Al utilizar este sitio, usted acepta el uso de cookies para efectos de análisis y contenido personalizado.  Leer nuestra política