¿Qué son los esquemas de codificación para predictores categóricos?

Cuando usted realiza un análisis de regresión de mínimos cuadrados, logística o de Poisson con predictores categóricos, Minitab utiliza un esquema de codificación para crear variables indicadoras con el predictor categórico. El esquema predeterminado de codificación 1, 0 (también conocida como codificación binaria o simulada) se utiliza comúnmente en los análisis de regresión.
  • Cuando se usa la codificación 1, 0, los coeficientes representan la distancia entre los niveles de los factores y el nivel de referencia.
  • Cuando se usa la codificación 1, 0, -1, los coeficientes representan la distancia entre los niveles de los factores y la media general.
Para los predictores con codificación 1, 0, por opción predeterminada, Minitab establece los siguientes niveles de referencia con base en el tipo de datos:
  • Para los predictores categóricos numéricos, el nivel de referencia es el nivel con el menor valor numérico.
  • Para los predictores categóricos de fecha/hora, el nivel de referencia es el nivel con la fecha/hora más temprana.
  • Para los predictores categóricos de texto, el nivel de referencia es el primer nivel en el orden de los valores, que es el orden alfabético de manera predeterminada.
Para los predictores con codificación -1, 0, 1, por opción predeterminada, Minitab establece los siguientes niveles de referencia con base en el tipo de datos:
  • Para los predictores categóricos numéricos, el nivel de referencia es el nivel con el mayor valor numérico.
  • Para los predictores categóricos de fecha/hora, el nivel de referencia es el nivel con la fecha/hora más tardía.
  • Para los predictores categóricos de texto, el nivel de referencia es el último nivel en orden alfabético.

Cómo cambiar el esquema de codificación

En los análisis de regresión, incluyendo Ajustar modelo de regresión y Ajustar modelo logístico binario, Minitab utiliza la codificación 1, 0 por opción predeterminada. Si desea cambiar el esquema de codificación a -1, 0, 1, vaya al cuadro de diálogo secundario Codificación. Para Regresión de cuadrados mínimos parciales, puede cambiar el nivel de referencia en el cuadro de diálogo secundario Opciones.

Cómo funcionan los esquemas de codificación

Para incluir predictores categóricos en su modelo de regresión general, Minitab codifica las categorías para que se puedan incluir en la ecuación de regresión. La regresión hace esto de manera automática, creando columnas para los predictores categóricos con base en el esquema de codificación utilizado. Una columna de códigos se crea para cada nivel de factor, excepto para el nivel de referencia. Minitab crea columnas y asigna un 1 cuando una fila pertenece al grupo de columnas. No se crea ninguna columna para el nivel de referencia. Para obtener más información sobre el esquema de codificación y la matriz de diseño, vaya a Cómo utiliza Minitab la matriz de diseño para regresión.

Los siguientes ejemplos muestran cómo funcionan los esquemas de codificación para una predictor categórico de Ubicación con tres niveles: Hong Kong, Londres y New York. Si el esquema de codificación es -1, 0, 1, el nivel de referencia predeterminado es New York. No se crea ninguna columna para New York y no aparece ningún coeficiente para New York en la tabla de coeficientes de la salida. Se crea una columna para Hong Kong y Londres y, si una fila de cualquier columna corresponde a New York (el nivel de referencia), se le asigna un -1.

Si la ubicación es Hong Kong Londres
Hong Kong 1 0
Londres 0 1
New York -1 -1

Si el esquema de codificación es 1, 0, el nivel de referencia predeterminado es Hong Kong, porque es el primero en orden alfabético. No se crea ninguna columna para Hong Kong y no aparece ningún coeficiente para Hong Kong en la tabla de coeficientes de la salida. Se crea una columna para Londres y New York.

Si la ubicación es Londres New York
Hong Kong 0 0
Londres 1 0
New York 0 1

Para obtener más información sobre cómo interpretar los coeficientes para el modelo de regresión ajustado, vaya a Interpretación de los predictores categóricos.

Para obtener más información sobre cómo interpretar los coeficientes para la regresión logística binaria ajustada, vaya a Interpretación de los coeficientes estimados en la regresión logística binaria.