Matriz de diseño para el modelo lineal general (GLM) en Minitab

El Modelo lineal general utiliza un método de regresión para ajustar el modelo que se especifique. Primero Minitab crea una matriz de diseño a partir de los factores y las covariables, y el modelo que se especifique. Las columnas de esta matriz son los predictores de la regresión.

La matriz de diseño tiene n filas, donde n es igual al número de observaciones, y un bloque de columnas, a las que frecuentemente se les denomina variables de indicador, por cada término del modelo. Un bloque tiene tantas columnas como grados de libertad para el término. El primer bloque se reserva para la constante y contiene una columna, una de todas las columnas. El bloque de una covariable también contiene una columna, la propia columna de la covariable.

Supongamos que A es un factor con 4 niveles y que el modelo utiliza una codificación -1, 0, +1. Luego, supongamos que tiene 3 grados de libertad y que su bloque contiene 3 columnas, que llamaremos A1, A2, A3. Cada fila tiene uno de los siguientes códigos:
Nivel de A A1 A2 A3
1 1 0 0
2 0 1 0
3 0 0 1
4 -1 -1 -1
Supongamos que el factor B tiene 3 niveles anidados dentro de cada nivel de A. Entonces su bloque contiene (3 - 1) x 4 = 8 columnas, las llamaremos B11, B12, B21, B22, B31, B32, B41, B42, codificadas como sigue:
Nivel de A Nivel de B B11 B12 B21 B22 B31 B32 B41 B42
1 1 1 0 0 0 0 0 0 0
1 2 0 1 0 0 0 0 0 0
1 3 -1 -1 0 0 0 0 0 0
2 1 0 0 1 0 0 0 0 0
2 2 0 0 0 1 0 0 0 0
2 3 0 0 -1 -1 0 0 0 0
3 1 0 0 0 0 1 0 0 0
3 2 0 0 0 0 0 1 0 0
3 3 0 0 0 0 -1 -1 0 0
4 1 0 0 0 0 0 0 1 0
4 2 0 0 0 0 0 0 0 1
4 3 0 0 0 0 0 0 -1 -1

Para calcular las variables de indicador de un término de interacción, multiplique todas las variables simuladas correspondientes por los factores y/o las covariables en la interacción. Por ejemplo, supongamos que el factor A tiene 6 niveles, C tiene 3 niveles, D tiene 4 niveles y Z y W son covariables. Luego el término A * C * D *Z * W * W tiene 5 x 2 x 3 x 1 x 1 x 1 = 30 variables de indicador. Para obtenerlas, multiplique cada variable de indicador de A por cada variable simulada de C, por cada variable simulada de D, por las covariables de Z una vez y de W dos veces.