Sumário do modelo para Regressão CART^®

Encontre definições e interpretações para cada estatística na tabela Sumário do modelo.

Neste tópico

Preditores totais
Preditores importantes
Número de nós terminais
Tamanho mínimo do nó terminal
R-quadrado

Raiz do quadrado médio do erro (RMSE)
Erro quadrado médio (MSE)
Desvio absoluto médio (MAD)
Erro percentual absoluto médio (MAPE)

Preditores totais

O número de preditores totais disponíveis para a árvore. Esta é a soma dos preditores contínuos e dos preditores categóricos especificados por você.

Preditores importantes

O número de preditores importantes na árvore. Os preditores importantes são as variáveis usadas como divisores primários ou substitutos.

Interpretação

Você pode usar o gráfico de Importância Relativa da Variável para exibir a ordem de importância relativa da variável. Por exemplo, suponha que 10 dos 20 preditores sejam importantes na árvore, o gráfico de Importância Relativa da Variável exibe as variáveis em ordem de importância.

Número de nós terminais

Um nó terminal é um nó final que não pode continuar a ser dividido.

Interpretação

Você pode usar informações do nó terminal para fazer previsões.

Tamanho mínimo do nó terminal

O tamanho mínimo do nó terminal é o nó terminal com o menor número de casos.

Interpretação

Por padrão, o Minitab define o número mínimo de casos permitidos para um nó terminal como 3; no entanto, o tamanho mínimo do nó terminal em uma árvore pode ser maior do que o número mínimo que a análise permite. Você pode alterar esse valor de limite na subcaixa de diálogo Opções.

R-quadrado

R² é a porcentagem de variação na resposta que o modelo explica. Os outliers têm um efeito maior no R² do que no MAD e MAPE.

Quando você usa um método de validação, a tabela inclui uma estatística R² para o conjunto de dados de treinamento e uma estatística R² para o método de validação. Quando o método de validação é a validação cruzada k-fold, a validação usa cada fold quando a construção da árvore exclui essa fold. A estatística R² dos resultados de validação normalmente é uma medida melhor de como o modelo funciona para novos dados.

Interpretação

Use o R² para determinar se o modelo ajusta bem seus dados. Quanto maior o valor R², melhor o modelo ajusta seus dados. R² está sempre entre 0% e 100%.

Você pode ilustrar graficamente o significado de diferentes valores de R². O primeiro gráfico ilustra um modelo de regressão simples que explica 85,5% da variação na resposta. O segundo gráfico ilustra um modelo que explica 22,6% da variação da resposta. Quanto mais variação for explicada pelo modelo, mais perto dos valores ajustados caem os pontos de dados. Teoricamente, se um modelo puder explicar 100% da variação, os valores ajustados sempre equivaleriam aos valores observados e todos os pontos de dados cairiam sobre a linha y = x.

Um validação R² substancialmente menor do que o R² de treinamento indica que a árvore pode não predizer os valores de resposta para novos casos tão bem quanto a árvore ajusta o conjunto de dados atual.

Raiz do quadrado médio do erro (RMSE)

A raiz do quadrado médio do erro (RMSE) mede a exatidão da árvore. Os outliers exercem um efeito maior sobre o RMSE do que sobre o MAD e o MAPE.

Quando você usa um método de validação, a tabela inclui uma estatística RMSE para o conjunto de dados de treinamento e uma estatística RMSE para os resultados da validação. Quando o método de validação é a validação cruzada k-fold, a validação usa cada fold quando a construção da árvore exclui essa fold. A estatística RMSE de validação normalmente é uma medida melhor de como o modelo funciona para novos dados.

Interpretação

Use para comparar os ajustes de árvores diferentes. Valores menores indicam um ajuste melhor. Um RMSE de teste que seja substancialmente maior que o RMSE de treinamento indica que a árvore pode não prever os valores de resposta para novos casos, pois a árvore se ajusta ao conjunto de dados atual.

Erro quadrado médio (MSE)

O erro quadrado médio (MSE) mede a exatidão da árvore. Os outliers exercem um efeito maior sobre o MSE do que sobre o MAD e o MAPE.

Quando você usa um método de validação, a tabela inclui uma estatística MSE para o conjunto de dados de treinamento e uma estatística MSE para os resultados da validação. Quando o método de validação é a validação cruzada k-fold, a validação usa cada fold quando a construção do modelo exclui essa fold. A estatística MSE de validação normalmente é uma medida melhor de como o modelo funciona para novos dados.

Interpretação

Use para comparar os ajustes de árvores diferentes. Valores menores indicam um ajuste melhor. Um MSE de validação que seja substancialmente maior que o MSE de treinamento indica que a árvore pode não prever os valores de resposta para novos casos, pois a árvore se ajusta ao conjunto de dados atual.

Desvio absoluto médio (MAD)

O desvio absoluto médio (MAD) expressa exatidão nas mesmas unidades que os dados, o que ajuda a conceituar a quantidade de erro. Os outliers têm menos efeito sobre o DAM do que sobre o R², RMSE e MSE.

Quando você usa um método de validação, a tabela inclui uma estatística MAD para o conjunto de dados de treinamento e uma estatística MAD para os resultados da validação. Quando o método de validação é a validação cruzada k-fold, a validação usa cada fold quando a construção do modelo exclui essa fold. A estatística MAD de validação normalmente é uma medida melhor de como o modelo funciona para novos dados.

Interpretação

Use para comparar os ajustes de árvores diferentes. Valores menores indicam um ajuste melhor. Um MAD de validação que seja substancialmente maior que o MAD de treinamento indica que a árvore pode não prever os valores de resposta para novos casos, pois a árvore se ajusta ao conjunto de dados atual.

Erro percentual absoluto médio (MAPE)

O erro percentual absoluto médio (MAPE) expressa exatidão como um percentual do erro. Como o MAPE é um percentual, pode ser mais fácil de entender do que a outra estatística de medida de exatidão. Por exemplo, se o MAPE, em média, é de 0,05, então a relação média entre o erro ajustado e o valor real em todos os casos é de 5%. Outliers têm menos efeito no MAPE do que no R², RMSE e MSE.

No entanto, às vezes você pode ver um valor MAPE muito grande, mesmo que a árvore pareça ajustar bem os dados. Examine o gráfico de valores ajustados versus valores de resposta real para ver se algum valor de dados está próximo de 0. Como o MAPE divide o erro absoluto pelos dados reais, os valores próximos a 0 podem inflar muito o MAPE.

Quando você usa um método de validação, a tabela inclui uma estatística MAPE para o conjunto de dados de treinamento e uma estatística MAPE para os resultados da validação. Quando o método de validação é a validação cruzada k-fold, a validação usa cada fold quando a construção do modelo exclui essa fold. A estatística MAPE de validação normalmente é uma medida melhor de como o modelo funciona para novos dados.

Interpretação

Use para comparar os ajustes de árvores diferentes. Valores menores indicam um ajuste melhor. Um MAPE de validação que seja substancialmente maior que o MAPE de treinamento indica que a árvore pode não prever os valores de resposta para novos casos, pois a árvore se ajusta ao conjunto de dados atual.

Sumário do modelo para Regressão CART®

Neste tópico

Preditores totais

Preditores importantes

Interpretação

Número de nós terminais

Interpretação

Tamanho mínimo do nó terminal

Interpretação

R-quadrado

Interpretação

Raiz do quadrado médio do erro (RMSE)

Interpretação

Erro quadrado médio (MSE)

Interpretação

Desvio absoluto médio (MAD)

Interpretação

Erro percentual absoluto médio (MAPE)

Interpretação

Sumário do modelo para Regressão CART^®