Especifique la codificación para variables categóricas y continuas para Ajustar modelo de regresióny Regresión lineal

Estadísticas > Regresión > Regresión > Ajustar modelo de regresión > Codificación

Módulo de análisis predictivo > Regresión lineal > Codificación

Codificación para las variables categóricas

Codificación para predictores categóricos
Para realizar el análisis, Minitab necesita recodificar los predictores categóricos utilizando uno de dos métodos. Considere cambiar el método dependiendo de si desea comparar los niveles del predictor con la media general o la media de un nivel de referencia. El esquema de codificación no cambia la prueba del efecto general del predictor. Para obtener más información, vaya a Esquemas de codificación para predictores categóricos.
  • (-1, 0, +1): Elegir estimar la diferencia entre cada media de nivel y la media general.
  • (1, 0): Elegir estimar la diferencia entre cada media de nivel y la media del nivel de referencia. Si elige el esquema de codificación (1, 0), la tabla del nivel de referencia se convierte en la tabla activa en el cuadro de diálogo.
Tabla del nivel de referencia
Predictor categórico
Esta columna de la tabla muestra todos los nombres de los predictores categóricos incluidos en el modelo. Esta columna no admite ingreso de datos.
Nivel de referencia

Minitab compara las medias del nivel que no es de referencia con las del nivel de referencia. Cambiar el nivel de referencia no afecta la significancia general, pero puede hacer que la interpretación de los coeficientes sea más significativa.

Para los predictores con codificación 1, 0, por opción predeterminada, Minitab establece los siguientes niveles de referencia con base en el tipo de datos:
  • Para los predictores categóricos numéricos, el nivel de referencia es el nivel con el menor valor numérico.
  • Para los predictores categóricos de fecha/hora, el nivel de referencia es el nivel con la fecha/hora más temprana.
  • Para los predictores categóricos de texto, el nivel de referencia es el primer nivel en el orden de los valores, que es el orden alfabético de manera predeterminada. Para obtener más información sobre cómo cambiar el orden de los valores para las variables de texto, vaya a Cambiar el orden de presentación de los valores de texto en la salida de Minitab.

Estandarizar predictores continuos

Usted puede optar por estandarizar los predictores continuos incluidos en el modelo. Los predictores estandarizados solo se utilizan para ajustar el modelo y no se almacenan en la hoja de trabajo.

La estandarización de los predictores continuos puede mejorar la interpretación del modelo para condiciones específicas.
  1. Centrar los predictores continuos restando la media: Este método ayuda a reducir la multicolinealidad, lo que mejora la precisión de las estimaciones de los coeficientes. Este método es útil cuando el modelo contiene predictores muy correlacionados, términos de orden superior y términos de interacción. Cada coeficiente representa el cambio esperado en la respuesta dado un cambio de una unidad en el predictor, utilizando la escala de medición original.
  2. Estandarizar la escala de los predictores continuos dividiendo entre la desviación estándar: Este método hace que los rangos de los predictores sean más homogéneos para que se pueda comparar el tamaño de los coeficientes. Este enfoque es útil cuando se desea saber qué predictores tienen mayor efecto, controlando al mismo tiempo las diferencias en la escala. Sin embargo, cada coeficiente representa el cambio esperado en la respuesta dado un cambio de una desviación estándar en el predictor.
Utilice uno de los siguientes métodos para estandarizar los predictores continuos:
  • No estandarizar: Utilice los datos originales para los predictores continuos.
  • Especificar niveles bajos y altos para codificar como -1 y +1: Utilícese tanto para centrar los predictores como para colocarlos en una escala comparable. Minitab utiliza este método en el diseño de experimentos (DOE). Todos los valores de datos que se encuentran entre los valores bajo y alto que usted especifica, se transforman para que estén entre −1 y +1. En la tabla, ingrese los valores bajo y alto o utilice los valores mínimo y máximo de la muestra.
    Predictor continuo
    Muestra los nombres de todos los predictores continuos incluidos en el modelo. Esta columna no acepta ninguna entrada.
    Bajo
    Ingrese un valor para codificarlo como −1. El valor predeterminado es el valor mínimo de la muestra.
    Alto
    Ingrese un valor para codificarlo como +1. El valor predeterminado es el valor máximo de la muestra.
  • Restar la media y dividir entre la desviación estándar: Utilícese tanto para centrar los predictores como para colocarlos en una escala comparable.
  • Restar la media: Utilícese para centrar los predictores.
  • Dividir entre la desviación estándar: Utilice una escala comparable para todos los predictores.
  • Restar un valor especificado, luego dividir entre otro: Especifique otros valores en lugar de usar las estimaciones de la media y la desviación estándar de la muestra.
    Predictor continuo
    Muestra los nombres de todos los predictores continuos incluidos en el modelo. Esta columna no acepta ninguna entrada.
    Restar
    Ingrese el valor que se restará de cada predictor continuo.
    Dividir entre
    Ingrese el valor que Minitab utilizará para dividir el resultado de la resta.