Sumário do modelo para Regressão CART^®

Encontre definições e interpretações para cada estatística na tabela Sumário do modelo.

Neste tópico

Preditores totais
Preditores importantes
Número de nós terminais
Tamanho mínimo do nó terminal
R-quadrado

Raiz do quadrado médio do erro (RMSE)
Erro quadrado médio (MSE)
Desvio absoluto médio (MAD)
Erro percentual absoluto médio (MAPE)

Preditores totais

O número de preditores totais disponíveis para a árvore. Esta é a soma dos preditores contínuos e dos preditores categóricos especificados por você.

Preditores importantes

O número de preditores importantes na árvore. Os preditores importantes são as variáveis usadas como divisores primários ou substitutos.

Interpretação

Você pode usar o gráfico de Importância Relativa da Variável para exibir a ordem de importância relativa da variável. Por exemplo, suponha que 10 dos 20 preditores sejam importantes na árvore, o gráfico de Importância Relativa da Variável exibe as variáveis em ordem de importância.

Número de nós terminais

Um nó terminal é um nó final que não pode continuar a ser dividido.

Interpretação

Você pode usar as informações dos nós terminais para fazer predições.

Tamanho mínimo do nó terminal

O tamanho mínimo do nó terminal é o nó terminal com o menor número de casos.

Interpretação

Por padrão, o Minitab define o número mínimo de casos permitidos para um nó terminal como 3; no entanto, o tamanho mínimo do nó terminal em uma árvore pode ser maior do que o número mínimo que a análise permite. Você pode alterar esse valor de limite na subcaixa de diálogo Opções.

R-quadrado

R² é a porcentagem de variação na resposta que o modelo explica. Os outliers têm um efeito maior no R² do que no MAD e MAPE.

Quando você usa um método de validação, a tabela inclui uma estatística R² para o conjunto de dados de treinamento e uma estatística R² para o conjunto de dados de teste. Quando o método de validação é uma validação cruzada de K dobras, o conjunto de dados de teste é cada dobra quando a construção da árvore exclui essa dobra. Normalmente, a estatística do teste R² é uma medida melhor de como o modelo funciona para novos dados.

Interpretação

Use o R² para determinar se o modelo ajusta bem seus dados. Quanto maior o valor R², melhor o modelo ajusta seus dados. R² está sempre entre 0% e 100%.

Você pode ilustrar graficamente o significado de diferentes valores de R². O primeiro gráfico ilustra um modelo de regressão simples que explica 85,5% da variação na resposta. O segundo gráfico ilustra um modelo que explica 22,6% da variação da resposta. Quanto mais variação for explicada pelo modelo, mais perto dos valores ajustados caem os pontos de dados. Teoricamente, se um modelo puder explicar 100% da variação, os valores ajustados sempre equivaleriam aos valores observados e todos os pontos de dados cairiam sobre a linha y = x.

Um teste R² substancialmente menor do que o R² de treinamento indica que a árvore pode não predizer os valores de resposta para novos casos tão bem quanto a árvore ajusta o conjunto de dados atual.

Raiz do quadrado médio do erro (RMSE)

A raiz do quadrado médio do erro (RMSE) mede a exatidão da árvore. Os outliers exercem um efeito maior sobre o RMSE do que sobre o MAD e o MAPE.

Quando você usa um método de validação, a tabela inclui uma estatística RMSE para o conjunto de dados de treinamento e uma estatística RMSE para o conjunto de dados de teste. Quando o método de validação é uma validação cruzada de K dobras, o conjunto de dados de teste é cada dobra quando a construção da árvore exclui essa dobra. Normalmente, a estatística do teste RMSE é uma medida melhor de como o modelo funciona para novos dados.

Interpretação

Use para comparar os ajustes de árvores diferentes. Valores menores indicam um ajuste melhor. Um teste RMSE substancialmente maior do que o RMSE de treinamento indica que a árvore pode não predizer os valores de resposta para novos casos tão bem quanto a árvore ajusta o conjunto de dados atual.

Erro quadrado médio (MSE)

O erro quadrado médio (MSE) mede a exatidão da árvore. Os outliers exercem um efeito maior sobre o MSE do que sobre o MAD e o MAPE.

Quando você usa um método de validação, a tabela inclui uma estatística MSE para o conjunto de dados de treinamento e uma estatística MSE para o conjunto de dados de teste. Quando o método de validação é uma validação cruzada de K dobras, o conjunto de dados de teste é cada dobra quando a construção da árvore exclui essa dobra. Normalmente, a estatística do teste MSE é uma medida melhor de como o modelo funciona para novos dados.

Interpretação

Use para comparar os ajustes de árvores diferentes. Valores menores indicam um ajuste melhor. Um teste MSE substancialmente maior do que o MSE de treinamento indica que a árvore pode não predizer os valores de resposta para novos casos tão bem quanto a árvore ajusta o conjunto de dados atual.

Desvio absoluto médio (MAD)

O desvio absoluto médio (MAD) expressa exatidão nas mesmas unidades que os dados, o que ajuda a conceituar a quantidade de erro. Os outliers têm menos efeito sobre o MAD do que sobre o R², RMSE e MSE.

Quando você usa um método de validação, a tabela inclui uma estatística MAD para o conjunto de dados de treinamento e uma estatística MAD para o conjunto de dados de teste. Quando o método de validação é uma validação cruzada de K dobras, o conjunto de dados de teste é cada dobra quando a construção da árvore exclui essa dobra. Normalmente, a estatística do teste MAD é uma medida melhor de como o modelo funciona para novos dados.

Interpretação

Use para comparar os ajustes de árvores diferentes. Valores menores indicam um ajuste melhor. Um teste MAD substancialmente maior do que o MAD de treinamento indica que a árvore pode não predizer os valores de resposta para novos casos tão bem quanto a árvore ajusta o conjunto de dados atual.

Erro percentual absoluto médio (MAPE)

O erro percentual absoluto médio (MAPE) expressa exatidão como um percentual do erro. Como o MAPE é um percentual, pode ser mais fácil de entender do que a outra estatística de medida de exatidão. Por exemplo, se o MAPE, em média, é de 0,05, então a relação média entre o erro ajustado e o valor real em todos os casos é de 5%. Os outliers têm menos efeito sobre o MAPE do que sobre o R², RMSE e MSE.

No entanto, às vezes você pode ver um valor MAPE muito grande, mesmo que a árvore pareça ajustar bem os dados. Examine o gráfico de valor de resposta ajustado versus real para ver se algum dos valores de dados estão próximos de 0. Como o MAPE divide o erro absoluto pelos dados reais, os valores próximos a 0 podem inflar muito o MAPE.

Quando você usa um método de validação, a tabela inclui uma estatística MAPE para o conjunto de dados de treinamento e uma estatística MAPE para o conjunto de dados de teste. Quando o método de validação é uma validação cruzada de K dobras, o conjunto de dados de teste é cada dobra quando a construção da árvore exclui essa dobra. Normalmente, a estatística do teste MAPE é uma medida melhor de como o modelo funciona para novos dados.

Interpretação

Use para comparar os ajustes de árvores diferentes. Valores menores indicam um ajuste melhor. Um teste MAPE substancialmente maior do que o MAPE de treinamento indica que a árvore pode não predizer os valores de resposta para novos casos tão bem quanto a árvore ajusta o conjunto de dados atual.

Sumário do modelo para Regressão CART®

Neste tópico

Preditores totais

Preditores importantes

Interpretação

Número de nós terminais

Interpretação

Tamanho mínimo do nó terminal

Interpretação

R-quadrado

Interpretação

Raiz do quadrado médio do erro (RMSE)

Interpretação

Erro quadrado médio (MSE)

Interpretação

Desvio absoluto médio (MAD)

Interpretação

Erro percentual absoluto médio (MAPE)

Interpretação

Sumário do modelo para Regressão CART^®