O Minitab exibe um gráfico de valores de Desvio Absoluto Médio (MAD) em relação ao número de nós terminais na árvore para que seja possível selecionar uma árvore a ser avaliada em maior profundidade. Se você usar um conjunto de dados de teste ou validação cruzada de K dobras para validar o desempenho da árvore, então o valor de MAD é para os dados de validação.
O Gráfico de MAD vs número de nós terminais exibe o valor de MAD para cada árvore. Este gráfico aparece quando o método de divisão do nó é Desvio absoluto mínimo. Por padrão, a árvore de regressão inicial é a menor árvore com um valor de MAD dentro de 1 erro padrão do valor de MAD mínimo. Quando a análise usa validação cruzada ou um conjunto de dados de teste, o valor de MAD é da amostra de validação. Os valores para a amostra de validação normalmente nivelam e, em algum momento, começam a aumentar à medida que a árvore cresce.
Clique em Selecionar uma árvore alternativa para abrir um gráfico interativo que inclui uma tabela de estatística de sumário do modelo. Use o gráfico para investigar árvores alternativas com desempenho semelhante.
Normalmente, você seleciona uma árvore alternativa por uma das duas razões a seguir:
A árvore que o Minitab seleciona faz parte de um padrão em que o critério melhora. Uma ou mais árvores que têm mais alguns nós fazem parte do mesmo padrão. Normalmente, é aconselhável fazer predições de uma árvore com o máximo de exatidão de predição possível.
A árvore que o Minitab seleciona faz parte de um padrão em que o critério é relativamente plano. Uma ou mais árvores com estatística semelhantes de sumário do modelo têm muito menos nós do que a árvore ótima. Normalmente, uma árvore com menos nós terminais proporcionam uma visão mais clara de como cada variável preditora afeta os valores de resposta. Uma árvore menor também facilita a identificação de alguns grupos-alvo para a realização de estudos adicionais. Se a diferença na exatidão da predição para uma árvore menor for insignificante, você também pode usar a árvore menor para avaliar as relações entre a resposta e as variáveis preditoras