Seleccionar las opciones de análisis para Regresión CART®

Estadísticas > Analítica predictiva > Regresión CART® > Opciones

Seleccione las opciones de análisis.

Node splitting method
Elija el método de división para generar el árbol de decisión. Puede comparar los resultados de ambos métodos de división para determinar la mejor opción para la aplicación.
  • Cuadrado mínimo del error: El método del mínimo cuadrado del error es el método predeterminado que funciona bien en muchas aplicaciones. El método del mínimo cuadrado del error minimiza la suma de los errores cuadráticos.
  • Desviación absoluta mínima: El método de desviación absoluta mínima minimiza la suma de los valores absolutos de los errores.
Criterion for selecting optimal tree
Cuando Cuadrado mínimo del error es el criterio para el método de división de nodos, elija entre estos criterios para producir el árbol en los resultados. Puede comparar resultados de diferentes árboles para determinar la mejor opción para su aplicación.
R-cuadrado máximo
Seleccione esta opción para mostrar los resultados del árbol con el valor de R-cuadrado máximo.
Within K standard errors of maximum R-squared; K=
Seleccione esta opción para que Minitab elija el árbol más pequeño con un valor de R2 que se ubique a menos de K errores estándares del árbol con el valor de R2 máximo. De forma predeterminada, K=1, por lo que el árbol de los resultados es el árbol de regresión más pequeño con un valor de R2 a menos de 1 error estándar del valor máximo de R2.
Cuando se selecciona Desviación absoluta mínima como método de división de nodos, elija entre estos criterios para seleccionar el árbol en los resultados. Puede comparar los resultados de diferentes árboles para determinar la mejor opción para su aplicación.
Desviación absoluta media mínima
Seleccione esta opción para mostrar los resultados del árbol con la desviación absoluta media mínima.
Within K standard errors of least mean absolute deviation; K=
Seleccione esta opción para que Minitab elija un árbol con un valor de desviación absoluta media que se ubique a menos de K errores estándares del árbol con el valor de desviación absoluta media mínimo. De forma predeterminada, K=1, por lo que el árbol de los resultados es el árbol de regresión más pequeño con un valor de desviación absoluta media a menos de 1 error estándar del valor de desviación absoluta mínimo.
Número de sustitutos para un predictor con valores faltantes
Ingrese el número de sustitutos que Minitab busca cuando un predictor tiene valores faltantes. Cuando muchos predictores tienen patrones similares de valores faltantes, se debe aumentar el número de sustitutos.
Este número representa el número máximo de sustitutos que se buscarán; sin embargo, este número de sustitutos puede no ser encontrado realmente.
El valor predeterminado es 10.
Número mínimo de casos para dividir un nodo interno
Ingrese un valor para representar el número mínimo de casos en que se dividirá un nodo interno. El valor predeterminado es 10. Con tamaños de muestra más grandes, es conveniente aumentar este mínimo. Por ejemplo, si un nodo interno tiene 10 o más casos, Minitab intenta realizar una división. Si el nodo interno tiene 9 casos o menos, Minitab no intenta realizar una división.
El límite del nodo interno debe ser al menos el doble del límite del nodo terminal, pero las relaciones más grandes son mejores. Los límites del nodo interno de al menos 3 veces los límites del nodo terminal permiten un número razonable de divisores.
Número mínimo de casos permitidos para un nodo terminal
Ingrese un valor que represente el número mínimo de casos que se pueden dividir en un nodo terminal. El valor predeterminado es 3. Con tamaños de muestra más grandes, es conveniente aumentar este mínimo. Por ejemplo, si una división crearía un nodo con menos de 3 casos, Minitab no realiza una división.
Profundidad máxima del árbol
Introduzca un valor para representar la profundidad máxima de un árbol. El nodo raíz corresponde a una profundidad de 1. Si desea asegurarse de obtener el mejor árbol, debe permitir un árbol más profundo, aunque este puede ralentizar el procesamiento.
Ponderaciones
Escriba una columna que contenga las ponderaciones del caso. La columna debe tener el mismo número de filas que la columna de respuestas. Los valores deben ser ≥ 0. Minitab omite del análisis las filas que contienen valores faltantes o ceros.