Total de predictores

El número total de predictores disponibles para el árbol. Esta es la suma de los predictores continuos y los predictores categóricos que especifique.

Predictores importantes

El número de predictores importantes en el árbol. Los predictores importantes son las variables que se utilizan como divisores principales o sustitutos.

Interpretación

Puede utilizar la gráfica de importancia relativa de la variable para mostrar el orden de importancia relativa de la variable. Por ejemplo, supongamos que 10 de 20 predictores son importantes en el árbol, la gráfica de importancia relativa de la variable muestra las variables en orden de importancia.

Número de nodos terminales

Un nodo terminal es un nodo final que no se puede dividir más.

Interpretación

Puede utilizar la información del nodo terminal para realizar predicciones.

Tamaño mínimo del nodo terminal

El tamaño mínimo del nodo terminal es el nodo terminal con el menor número de casos.

Interpretación

Por opción predeterminada, Minitab establece el número mínimo de casos permitidos para un nodo terminal en 3 casos; sin embargo, el tamaño mínimo del nodo terminal de un árbol puede ser mayor que el número mínimo que permite el análisis. Puede cambiar este valor umbral en el cuadro de diálogo secundario Opciones.

R-cuadrado

El R2 es el porcentaje de variación en la respuesta explicado por el modelo. Los valores atípicos tienen un mayor efecto en el R2 que en la MAD y el MAPE.

Cuando se utiliza un método de validación, la tabla incluye un estadístico R2 para el conjunto de datos de entrenamiento y un estadístico R2 para el conjunto de datos de prueba. Cuando el método de validación es la validación cruzada con K pliegues, el conjunto de datos de prueba es cada pliegue cuando la construcción del árbol excluye ese pliegue. El estadístico R2 de prueba suele ser una mejor medida de cómo funciona el modelo para nuevos datos.

Interpretación

Utilice el R2 para determinar qué tan bien ajusta los datos el modelo. Cuanto mayor sea el valor del R2, mejor ajusta los datos el modelo. El R2 siempre está entre 0% y 100%.

Puede ilustrar gráficamente el significado de diferentes valores de R2. La primera gráfica ilustra un modelo de regresión simple que explica el 85.5% de la variación en la respuesta. La segunda gráfica ilustra un modelo que explica el 22.6% de la variación en la respuesta. Cuanta más variación explique el modelo, más cerca estarán los puntos de datos de los valores ajustados. En teoría, si un modelo puede explicar el 100% de la variación, los valores ajustados siempre serían iguales a los valores observados y todos los puntos de datos se ubicarían en la línea y = x.

Un R2 de prueba que es sustancialmente menor que el R2de entrenamiento indica que el árbol podría no predecir los valores de respuesta para nuevos casos al igual que el árbol se ajusta al conjunto de datos actual.

Raíz de los cuadrados medios del error (RMSE)

La raíz de los cuadrados medios del error (RMSE) mide la exactitud del árbol. Los valores atípicos tienen un mayor efecto en la RMSE que en la MAD y el MAPE.

Cuando se utiliza un método de validación, la tabla incluye un estadístico RMSE para el conjunto de datos de entrenamiento y un estadístico RMSE para el conjunto de datos de prueba. Cuando el método de validación es la validación cruzada con K pliegues, el conjunto de datos de prueba es cada pliegue cuando la construcción del árbol excluye ese pliegue. El estadístico RMSE de prueba suele ser una mejor medida de cómo funciona el modelo para nuevos datos.

Interpretación

Se utiliza para comparar los ajustes de diferentes árboles. Los valores más pequeños indican un mejor ajuste. Una RMSE de prueba que es sustancialmente menor que la RMSE de entrenamiento indica que el árbol podría no predecir los valores de respuesta para nuevos casos al igual que el árbol se ajusta al conjunto de datos actual.

Cuadrado medio del error (MSE)

El cuadrado medio del error (MSE) mide la exactitud del árbol. Los valores atípicos tienen un mayor efecto en el MSE que en la MAD y el MAPE.

Cuando se utiliza un método de validación, la tabla incluye un estadístico MSE para el conjunto de datos de entrenamiento y un estadístico MSE para el conjunto de datos de prueba. Cuando el método de validación es la validación cruzada con K pliegues, el conjunto de datos de prueba es cada pliegue cuando la construcción del árbol excluye ese pliegue. El estadístico MSE de prueba suele ser una mejor medida de cómo funciona el modelo para nuevos datos.

Interpretación

Se utiliza para comparar los ajustes de diferentes árboles. Los valores más pequeños indican un mejor ajuste. Un MSE de prueba que es sustancialmente menor que el MSE de entrenamiento indica que el árbol podría no predecir los valores de respuesta para nuevos casos al igual que el árbol se ajusta al conjunto de datos actual.

Desviación absoluta media (MAD)

La desviación absoluta media (MAD) expresa la exactitud en las mismas unidades que los datos, lo que ayuda a conceptualizar la cantidad de error. Los valores atípicos tienen menos efecto en la MAD que en el R2, la RMSE y el MSE.

Cuando se utiliza un método de validación, la tabla incluye un estadístico MAD para el conjunto de datos de entrenamiento y un estadístico MAD para el conjunto de datos de prueba. Cuando el método de validación es la validación cruzada con K pliegues, el conjunto de datos de prueba es cada pliegue cuando la construcción del árbol excluye ese pliegue. El estadístico MAD de prueba suele ser una mejor medida de cómo funciona el modelo para nuevos datos.

Interpretación

Se utiliza para comparar los ajustes de diferentes árboles. Los valores más pequeños indican un mejor ajuste. Una MAD de prueba que es sustancialmente menor que la MAD de entrenamiento indica que el árbol podría no predecir los valores de respuesta para nuevos casos al igual que el árbol se ajusta al conjunto de datos actual.

Media del error porcentual absoluto (MAPE)

El error porcentual absoluto medio (MAPE) expresa la exactitud como un porcentaje del error. Dado que el MAPE es un porcentaje, puede ser más fácil de entender que los otros estadísticos de medición de exactitud. Por ejemplo, si el MAPE es 5, en promedio, el ajuste está errado en un 5%. Los valores atípicos tienen menos efecto en el MAPE que en el R2, la RMSE y el MSE.

Sin embargo, a veces puede ver un valor MAPE muy grande aunque el árbol parezca ajustar bien los datos. Examine la gráfica de valores de respuesta ajustados vs. reales para ver si hay valores de datos cercanos a 0. Dado que el MAPE divide el error absoluto entre los datos reales, los valores cercanos a 0 pueden inflar en gran medida el MAPE.

Cuando se utiliza un método de validación, la tabla incluye un estadístico MAPE para el conjunto de datos de entrenamiento y un estadístico MAPE para el conjunto de datos de prueba. Cuando el método de validación es la validación cruzada con K pliegues, el conjunto de datos de prueba es cada pliegue cuando la construcción del árbol excluye ese pliegue. El estadístico MAPE de prueba suele ser una mejor medida de cómo funciona el modelo para nuevos datos.

Interpretación

Se utiliza para comparar los ajustes de diferentes árboles. Los valores más pequeños indican un mejor ajuste. Un MAPE de prueba que es sustancialmente menor que el MAPE de entrenamiento indica que el árbol podría no predecir los valores de respuesta para nuevos casos al igual que el árbol se ajusta al conjunto de datos actual.

Al utilizar este sitio, usted acepta el uso de cookies para efectos de análisis y contenido personalizado.  Leer nuestra política