Total de predictores

El número total de predictores disponibles para el árbol. Esta es la suma de los predictores continuos y los predictores categóricos que especifique.

Predictores importantes

El número de predictores importantes en el árbol. Los predictores importantes son las variables que se utilizan como divisores principales o sustitutos.

Interpretación

Puede utilizar la gráfica de Importancia relativa de las variables para mostrar el orden de Importancia relativa de las variables. Por ejemplo, supongamos que 10 de 20 predictores son importantes en el árbol, la gráfica de Importancia relativa de las variables muestra las variables en orden de importancia.

Número de nodos terminales

Un nodo terminal es un nodo final que no se puede dividir más.

Interpretación

Puede utilizar la información del nodo terminal para realizar predicciones.

Tamaño mínimo del nodo terminal

El tamaño mínimo del nodo terminal es el nodo terminal con el menor número de casos.

Interpretación

Por opción predeterminada, Minitab establece el número mínimo de casos permitidos para un nodo terminal en 3 casos; sin embargo, el tamaño mínimo del nodo terminal de un árbol puede ser mayor que el número mínimo que permite el análisis. Puede cambiar este valor umbral en el cuadro de diálogo secundario Opciones.

R-cuadrado

R2 es el porcentaje de variación en la respuesta explicado por el modelo. Los valores atípicos tienen un mayor efecto en R2 que en MAD y MAPE.

Cuando se utiliza un método de validación, la tabla incluye una estadística de R2 para el conjunto de datos de entrenamiento y una estadística de R2 para el conjunto de datos de prueba. Cuando el método de validación es la validación cruzada con K pliegues, el conjunto de datos de prueba es cada pliegue cuando la construcción del árbol excluye ese pliegue. El estadístico R2 de prueba suele ser una mejor medida de cómo funciona el modelo para nuevos datos.

Interpretación

Utilice R2 para determinar qué tan bien se ajusta el modelo a sus datos. Cuanto mayor sea el valor de R2, mejor se ajusta el modelo a los datos. R2 siempre está entre 0% y 100%.

Puede ilustrar gráficamente el significado de diferentes valores de R2. La primera gráfica ilustra un modelo de regresión simple que explica el 85.5% de la variación en la respuesta. La segunda gráfica ilustra un modelo que explica el 22.6% de la variación en la respuesta. Cuanta más variación explique el modelo, más cerca estarán los puntos de datos de los valores ajustados. En teoría, si un modelo puede explicar el 100% de la variación, los valores ajustados siempre serían iguales a los valores observados y todos los puntos de datos se ubicarían en la línea y = x.

Un R2 de prueba que es sustancialmente menor que el R2de entrenamiento indica que el árbol podría no predecir los valores de respuesta para nuevos casos al igual que el árbol se ajusta al conjunto de datos actual.

Raíz de los cuadrados medios del error (RMSE)

La raíz de los cuadrados medios del error (RMSE) mide la exactitud del árbol. Los valores atípicos tienen un mayor efecto en la RMSE que en la MAD y el MAPE.

Cuando se utiliza un método de validación, la tabla incluye una estadística RMSE para el conjunto de datos de entrenamiento y una estadística RMSE para el conjunto de datos de prueba. Cuando el método de validación es la validación cruzada con K pliegues, el conjunto de datos de prueba es cada pliegue cuando la construcción del árbol excluye ese pliegue. La estadística RMSE de prueba suele ser una mejor medida de cómo funciona el modelo para nuevos datos.

Interpretación

Se utiliza para comparar los ajustes de diferentes árboles. Valores más pequeños indican un mejor ajuste. Una RMSE de prueba que es sustancialmente mayor que la RMSE de entrenamiento indica que el árbol podría no predecir los valores de respuesta para nuevos casos al igual que el árbol se ajusta al conjunto de datos actual.

Cuadrado medio del error (MSE)

El cuadrado medio del error (MSE) mide la exactitud del árbol. Los valores atípicos tienen un mayor efecto en el MSE que en la MAD y el MAPE.

Cuando se utiliza un método de validación, la tabla incluye una estadística MSE para el conjunto de datos de entrenamiento y una estadística MSE para el conjunto de datos de prueba. Cuando el método de validación es la validación cruzada con K pliegues, el conjunto de datos de prueba es cada pliegue cuando la construcción del árbol excluye ese pliegue. El estadístico MSE de prueba suele ser una mejor medida de cómo funciona el modelo para nuevos datos.

Interpretación

Se utiliza para comparar los ajustes de diferentes árboles. Valores más pequeños indican un mejor ajuste. Un MSE de prueba que es sustancialmente mayor que el MSE de entrenamiento indica que el árbol podría no predecir los valores de respuesta para nuevos casos al igual que el árbol se ajusta al conjunto de datos actual.

Desviación absoluta media (MAD)

La desviación absoluta media (MAD) expresa la exactitud en las mismas unidades que los datos, lo que ayuda a conceptualizar la cantidad de error. Los valores atípicos tienen menos efecto en la MAD que en R2, RMSE y MSE.

Cuando se utiliza un método de validación, la tabla incluye una estadística MAD para el conjunto de datos de entrenamiento y una estadística MAD para el conjunto de datos de prueba. Cuando el método de validación es la validación cruzada con K pliegues, el conjunto de datos de prueba es cada pliegue cuando la construcción del árbol excluye ese pliegue. El estadístico MAD de prueba suele ser una mejor medida de cómo funciona el modelo para nuevos datos.

Interpretación

Se utiliza para comparar los ajustes de diferentes árboles. Valores más pequeños indican un mejor ajuste. Un MAD de prueba sustancialmente mayor que el MAD de entrenamiento indica que el árbol podría no predecir los valores de respuesta para nuevos casos tan adecuadamente como se ajusta al conjunto de datos actual.

Media del error porcentual absoluto (MAPE)

El error porcentual absoluto medio (MAPE) expresa la exactitud como un porcentaje del error. Debido a que MAPE es un porcentaje, puede ser más fácil de entender que las otras estadísticas de medición de exactitud. Por ejemplo, si el MAPE, en promedio, es 0.05, la relación promedio entre el error ajustado y el valor real en todos los casos es de 5%. Los valores atípicos tienen menos efecto en el MAPE que en el R2, la RMSE y el MSE.

Sin embargo, a veces puede ver un valor MAPE muy grande aunque el árbol parezca ajustar bien los datos. Examine la gráfica de valores de respuesta ajustados vs. reales para ver si hay valores de datos cercanos a 0. Dado que el MAPE divide el error absoluto entre los datos reales, los valores cercanos a 0 pueden inflar en gran medida el MAPE.

Cuando se utiliza un método de validación, la tabla incluye una estadística MAPE para el conjunto de datos de entrenamiento y una estadística MAPE para el conjunto de datos de prueba. Cuando el método de validación es la validación cruzada con K pliegues, el conjunto de datos de prueba es cada pliegue cuando la construcción del árbol excluye ese pliegue. El estadístico MAPE de prueba suele ser una mejor medida de cómo funciona el modelo para nuevos datos.

Interpretación

Se utiliza para comparar los ajustes de diferentes árboles. Valores más pequeños indican un mejor ajuste. Un MAPE de prueba que sea sustancialmente mayor que el MAPE de entrenamiento indica que el árbol podría no predecir los valores de respuesta para nuevos casos de forma tan adecuada como el árbol que se ajusta al conjunto de datos actual.