Consideraciones acerca de los datos para ANOVA de un solo factor

Para asegurar que los resultados sean válidos, considere las siguientes pautas al recopilar datos, realizar el análisis e interpretar los resultados.

Los datos deben incluir solo una variable categórica que sea un factor fijo

Para obtener más información sobre los factores, vaya a Factores y niveles de factor y Factores fijos y aleatorios.

La variable de respuesta debe ser continua
Si la variable de respuesta es categórica, es menos probable que el modelo cumpla con los supuestos del análisis, que describa con exactitud los datos o que haga predicciones útiles.
  • Si la variable de respuesta tiene dos categorías, como pasa y no pasa, utilice Ajustar modelo logístico binario.
  • Si la variable de respuesta contiene tres o más categorías que tienen un orden natural, como por ejemplo completamente en desacuerdo, en desacuerdo, neutral, de acuerdo, completamente de acuerdo, utilice Regresión logística ordinal.
  • Si la variable de respuesta contiene tres o más categorías que no tienen un orden natural, como por ejemplo raya, hendidura y rotura, utilice Regresión logística nominal.
  • Si la variable de respuesta cuenta ocurrencias, tales como el número de defectos, utilice Ajustar modelo de Poisson.
Los datos de la muestra deben proceder de una población normal o cada muestra debe ser > 15 o 20

Si el tamaño de la muestra es mayor que 15 o 20, la prueba funciona muy bien con distribuciones asimétricas y no normales. Si el tamaño de la muestrea es menor que 15 o 20, los resultados podrían ser engañosos con distribuciones no normales.

El tamaño de la muestra real que usted necesita depende del número de grupos en los datos, de la siguiente manera:
  • Si tiene de 2 a 9 grupos, el tamaño de la muestra para cada grupo debe ser por lo menos 15.
  • Si tiene de 10 a 12 grupos, el tamaño de la muestra para cada grupo debe ser por lo menos 20.

Si usted no está seguro de que los datos siguen una distribución normal y no cumple con las directrices de tamaño de la muestra, utilice Prueba de Kruskal-Wallis.

Cada observación debe ser independiente de todas las demás observaciones
Si las observaciones son dependientes, los resultados podrían no ser válidos. Considere los siguientes puntos para determinar si las observaciones son independientes:
  • Si una observación no proporciona información sobre el valor de otra observación, las observaciones son independientes.
  • Si una observación proporciona información sobre el valor de otra observación, las observaciones son dependientes.

Si usted tiene observaciones dependientes, vaya a Análisis de un diseño de medidas repetidas. Para obtener más información sobre las muestras, vaya a ¿Qué son muestras independientes?.

Recolecte los datos utilizando las mejores prácticas
Para asegurar que los resultados sean válidos, considere las siguientes pautas:
  • Asegúrese de que los datos representen a la población de interés.
  • Recolecte suficiente datos para proporcionar la precisión necesaria.
  • Mida las variables con tanta exactitud y precisión como sea posible.
  • Registre los datos en el orden de recolección.
El modelo debe proveer un ajuste adecuado a los datos

Si el modelo no se ajusta a los datos, los resultados pueden ser engañosos. En la salida, utilice las gráficas de residuos, los estadísticos de diagnóstico para observaciones poco comunes y los estadísticos de resumen del modelo para determinar qué tan bien se ajusta el modelo a los datos.