Especificar la configuración predeterminada para Regresión CART®

Archivo > Opciones > Analítica predictiva > Regresión CART®

Especifique los métodos predeterminados para los árboles de regresión. Los cambios que haga en los valores predeterminados se mantendrán vigentes hasta que los cambie de nuevo, incluso después de salir de Minitab.

Node splitting method
Elija el método de división para generar el árbol de decisión. Puede comparar los resultados de ambos métodos de división para determinar la mejor opción para la aplicación.
  • Cuadrado mínimo del error: El método del mínimo cuadrado del error es el método predeterminado que funciona bien en muchas aplicaciones. El método del mínimo cuadrado del error minimiza la suma de los errores cuadráticos.
  • Desviación absoluta mínima: El método de desviación absoluta mínima minimiza la suma de los valores absolutos de los errores.
Criterion for selecting optimal tree
Cuando Cuadrado mínimo del error es el criterio para el método de división de nodos, elija entre estos criterios para producir el árbol en los resultados. Puede comparar resultados de diferentes árboles para determinar la mejor opción para su aplicación.
R-cuadrado máximo
Seleccione esta opción para mostrar los resultados del árbol con el valor de R-cuadrado máximo.
Within K standard errors of maximum R-squared; K=
Seleccione esta opción para que Minitab elija el árbol más pequeño con un valor de R2 que se ubique a menos de K errores estándares del árbol con el valor de R2 máximo. De forma predeterminada, K=1, por lo que el árbol de los resultados es el árbol de clasificación más pequeño con un valor de R2 dentro de 1 error estándar del valor de R2 máximo.
Cuando se selecciona Desviación absoluta mínima como método de división de nodos, elija entre estos criterios para seleccionar el árbol en los resultados. Puede comparar los resultados de diferentes árboles para determinar la mejor opción para su aplicación.
Desviación absoluta media mínima
Seleccione esta opción para mostrar los resultados del árbol con la desviación absoluta media mínima.
Within K standard errors of least mean absolute deviation; K=
Seleccione esta opción para que Minitab elija un árbol con un valor de desviación absoluta media que se ubique a menos de K errores estándares del árbol con el valor de desviación absoluta media mínimo. Por defecto, K = 1, por lo que el árbol en los resultados es el árbol de clasificación más pequeño con un valor de desviación absoluta media dentro de 1 error estándar del valor mínimo de desviación absoluta.
Número mínimo de casos para dividir un nodo interno
Ingrese un valor para representar el número mínimo de casos en que se dividirá un nodo interno. El valor predeterminado es 10. Con tamaños de muestra más grandes, es conveniente aumentar este mínimo. Por ejemplo, si un nodo interno tiene 10 o más casos, Minitab intentará realizar una división. Si el nodo interno tiene 9 casos o menos, Minitab no intentará realizar una división.
El límite del nodo interno debe ser al menos el doble del límite del nodo terminal, pero las relaciones más grandes son mejores. Los límites del nodo interno de al menos 3 veces los límites del nodo terminal permiten un número razonable de divisores.
El valor predeterminado es 10.
Número mínimo de casos permitidos para un nodo terminal
Introduzca un valor para representar el número mínimo de casos que se pueden separar en un nodo terminal. El valor predeterminado es 3. Con tamaños de muestra más grandes, es conveniente aumentar este mínimo. Por ejemplo, si una división crea un nodo con menos de 3 casos, Minitab no realizará una división.
El valor predeterminado es 3.
Penalización por valor faltante
Indique un valor de penalización para un predictor con valores faltantes Debido a que es más fácil ser un buen divisor con menos datos, los predictores con datos faltantes tienen una ventaja sobre los predictores sin datos faltantes. Utilice esta opción para penalizar a los predictores con datos faltantes.
0.0 ≤ K ≤ 2.0, por ejemplo:
  • K = 0: Especifica que no hay penalización.
  • K = 2: Especifica la penalización más alta.
Penalización por categoría de nivel alto
Introduzca un valor de penalización para predictores categóricos que tengan muchos valores. Debido a que los predictores categóricos con muchos niveles pueden distorsionar un árbol debido a su mayor poder de división, tienen una ventaja sobre los predictores con menos niveles. Utilice esta opción para penalizar los predictores con muchos niveles.
0.0 ≤ K ≤ 5.0, por ejemplo:
  • K = 0: Especifica que no hay penalización.
  • K = 5: Especifica la penalización más alta.
Visualización de gráficos y tablas
Residuals for plots
Especifique el tipo de residuos que se mostrarán en la gráfica de caja de gráficas de residuos.
  • Regular: De forma predeterminada, la gráfica de caja muestra residuos regulares.
  • Porcentaje: Especifique que se mostrará el porcentaje de residuos en la gráfica de caja.
Terminal node type
Elija si desea mostrar los mejores nodos, los peores nodos o ambos para la tabla Ajustes y estadísticas de error y la tabla Criterios para clasificar sujetos.
  • El mejor: Por opción predeterminada, Minitab muestra los mejores nodos terminales. Los mejores nodos tienen los valores más bajos de MSE o MAD.
  • El peor: Seleccione esta opción para mostrar los peores nodos terminales. Los peores nodos tienen los valores más altos de MSE o MAD.
  • El mejor y el peor: Seleccione esta opción para mostrar los mejores y peores nodos terminales.