Métodos y fórmulas para el análisis de varianza en Analizar respuesta binaria para diseño de cribado definitivo

Análisis de varianza

La desviación mide la discrepancia entre el modelo actual y el modelo completo. El modelo completo es el modelo que tiene n parámetros, un parámetro por observación. El modelo completo maximiza la función de log-verosimilitud. El modelo completo proporciona un punto de comparación para los modelos con menos de n parámetros. Las comparaciones con el modelo completo utilizan la desviación de escala.
La siguiente ecuación proporciona la contribución a la desviación de escala para un modelo binomial:

La tabla de desviación se construye con base en el siguiente resultado general que presupone que se conoce el valor de ϕ. Si DI es la desviación asociada a un modelo inicial y DS es la desviación asociada a un subconjunto de términos del modelo inicial, entonces, bajo ciertas condiciones de regularidad, existe la siguiente relación:

La diferencia entre las desviaciones se distribuye asintóticamente como una distribución de chi-cuadrada con d grados de libertad. Estos estadísticos se calculan para el análisis ajustado (tipo III) y el análisis secuencial (tipo I). El estadístico de desviación ajustada y el estadístico de chi-cuadrada que contiene la tabla de desviación son iguales. La desviación media ajustada es la desviación ajustada dividida entre los grados de libertad.

Para el análisis secuencial, la salida depende del orden en que los predictores entran al modelo. La desviación secuencial es la única parte de la desviación que es explicada por un predictor, dado que ya haya otros predictores en el modelo. Si usted tiene un modelo con tres predictores, X1, X2 y X3, la desviación secuencial para X3 muestra qué tanto de la desviación restante es explicada por X3 dado que X1 y X2 ya están en el modelo. Para obtener una desviación secuencial diferente, repita el procedimiento de regresión ingresando los predictores en un orden diferente.

Si no se conoce ϕ, para las respuestas que siguen una distribución normal, entonces, bajo ciertas condiciones de regularidad, la relación cambia a lo siguiente:

En este caso, la diferencia entre las desviaciones se distribuye asintóticamente como una distribución F con d grados de libertad para el numerador y np grados de libertad para el denominador. Para estimar el parámetro de dispersión, utilice el modelo inicial.

Notación

TérminoDescription
yiel número de eventos para la iésima fila
la respuesta media estimada de la iésima fila
miel número de ensayos para la iésima fila
Lfla log-verosimilitud del modelo completo
Lcla log-verosimilitud del modelo con un subconjunto de términos del modelo completo
dlos grados de libertad son la diferencia entre el número de parámetros de los modelos que se compararán
ϕel parámetro de dispersión, que se sabe que es 1 para el modelo binomial
nel número de filas en los datos
plos grados de libertad para la regresión en el modelo inicial

Grados de libertad (GL)

Diferentes sumas de cuadrados tienen diferentes grados de libertad.

GL para un factor numérico = 1

GL para un factor categórico = b - 1

GL para un término cuadrático = 1

GL para bloques = c - 1

GL para error = n - p

GL total = n − 1

Para las interacciones entre los factores, multiplique los grados de libertad de los términos incluidos en los factores. Por ejemplo, si los factores son A y B, entonces la interacción AB tiene estos grados de libertad:
Para hallar los grados de libertad de un tipo de término, sume los grados de libertad de los términos. Por ejemplo, si los factores son A y B, entonces los efectos principales en el modelo tienen esta cantidad de grados de libertad:
Nota

Los factores categóricos en los diseños de cribado en Minitab tienen 2 niveles. De este modo, los grados de libertad para un factor categórico son 2 – 1 = 1. Por extensión, las interacciones entre los factores también tienen 1 grado de libertad.

Notación

TérminoDescription
bEl número de niveles en el factor
cEl número de bloques
nEl número total de filas en el diseño
niEl número de observaciones para la iésima combinación de nivel de factores
mEl número de combinaciones de niveles de factores
pEl número de coeficientes

Log-verosimilitud

Las funciones de log-verosimilitud se parametrizan en términos de las medias. La siguiente es la forma general de las funciones:

La siguiente es la forma general de las contribuciones individuales:

La siguiente ecuación proporciona la forma específica de las contribuciones individuales para el modelo binomial:

Notación

TérminoDescription
yiel número de eventos para la iésima fila
miel número de ensayos para la iésima fila
la respuesta media estimada de la iésima fila

Valor p (P)

Se utilizan en las pruebas de hipótesis como ayuda para decidir si se puede rechazar o no una hipótesis nula. El valor p es la probabilidad de obtener un estadístico de prueba que sea por lo menos tan extremo como el valor real calculado, si la hipótesis nula es verdadera. Un valor de corte que se utiliza comúnmente para el valor p es 0.05. Por ejemplo, si el valor p calculado de un estadístico de prueba es menor que 0.05, usted rechaza la hipótesis nula.