Consideraciones acerca de los datos para Prueba de Kruskal-Wallis

Para asegurarse de que los resultados sean válidos, tenga en cuenta las siguientes directrices al recopilar datos, realizar el análisis e interpretar los resultados.

Nota

Si usted utiliza un análisis paramétrico como alternativa a la prueba de Kruskal-Wallis, debe verificar que sus datos cumplan los requisitos de datos de ese análisis. Los requisitos de datos para análisis paramétricos no siempre son compatibles con los requisitos para análisis no paramétricos, tales como la prueba de Kruskal-Wallis.

Los datos deben incluir únicamente una variable categórica que sea un factor fijo

Para obtener más información acerca de los factores, vaya a Factores y niveles de factores y a Factores fijos y aleatorios.

La variable de respuesta debe ser continua
Si la variable de respuesta es categórica, es menos probable que su modelo cumpla con los supuestos del análisis, que describa con exactitud sus datos o que haga predicciones útiles.
  • Si la variable de respuesta tiene dos categorías, como pasa y no pasa, utilice Ajustar modelo logístico binario.
  • Si la variable de respuesta contiene tres o más categorías que tienen un orden natural, como por ejemplo completamente en desacuerdo, en desacuerdo, neutral, de acuerdo, completamente de acuerdo, utilice Regresión logística ordinal.
  • Si la variable de respuesta contiene tres o más categorías que no tienen un orden natural, como por ejemplo raya, hendidura y rotura, utilice Regresión logística nominal.
  • Si la variable de respuesta cuenta con ocurrencias, como el número de defectos, utilice Ajustar modelo de Poisson.
Los datos de la muestra no necesitan estar distribuidos normalmente
Las distribuciones de los grupos deben tener la misma forma y dispersión y no contener valores atípicos.
El tamaño de la muestra debe ser inferior a 15 o 20 observaciones o su proceso estaría mejor representado por la mediana

Las pruebas no paramétricas tienden a tener menos potencia que las pruebas paramétricas. Además, las pruebas paramétricas pueden funcionar adecuadamente con datos no normales si el tamaño de la muestra es lo suficientemente grande. Considere utilizar una prueba paramétrica incluso con datos no normales, a menos que el tamaño de la muestra sea muy pequeño o si la mediana es más significativa para el estudio.

Si los datos cumplen con los siguientes lineamientos del tamaño de la muestra, considere utilizar ANOVA de un solo factor, porque funcionará muy bien con distribuciones asimétricas y no normales y tiene más potencia.
  • Los datos contienen de 2 a 9 grupos y el tamaño de la muestra para cada grupo es por lo menos 15.
  • Los datos contienen de 10 a 12 grupos y el tamaño de la muestra para cada grupo es por lo menos 20.
El tamaño de la muestra para cada grupo debe ser por lo menos cinco
Si una muestra tiene menos de cinco observaciones, el valor p puede ser inexacto.
Cada observación debería ser independiente de todas las demás observaciones
Si las observaciones son dependientes, los resultados podrían no ser válidos. Considere los siguientes puntos para determinar si las observaciones son independientes:
  • Si una observación no proporciona información sobre el valor de otra observación, las observaciones son independientes.
  • Si una observación proporciona información sobre el valor de otra observación, las observaciones son dependientes.

Si tiene observaciones dependientes, vaya a Analizar un diseño de medidas repetidas. Para obtener más información, vaya a ¿Qué diferencia hay entre las muestras dependientes e independientes?.

Recolecte los datos utilizando las mejores prácticas
Para asegurar que los resultados sean válidos, considere las siguientes pautas:
  • Asegúrese de que los datos representen a la población de interés.
  • Recolecte suficiente datos para proporcionar la precisión necesaria.
  • Mida las variables con tanta exactitud y precisión como sea posible.
  • Registre los datos en el orden de recolección.