Este comando está disponível com o Módulo de análise preditiva. Clique aqui saber mais sobre como ativar o módulo.
Termo | Descrição |
---|---|
valor da variável resposta para a linha i | |
linhas numéricas que aparecem nos dados out-of-bag sobre toda a floresta | |
previsão out-of-bag para a linha i |
Em seguida, permute aleatoriamente os valores de uma variável xm através dos dados out-of-bag. Deixe os valores de resposta e os outros valores do preditor iguais. Em seguida, use os mesmos passos para calcular o erro quadrado médio para os dados permutados, .
A importância para a variável xm vem da diferença dos dois erros quadrados médios:
O Minitab arredonda valores menores que 10–7 para 0.
Os cálculos preditos para as seguintes medidas de precisão do modelo dependem do método de validação. As predições out-of-bag vêm apenas das árvores nas quais uma linha está out-of-bag. Para uma determinada árvore j, na análise, prediga os dados out-of-bag com a árvore. Repita a predição para cada árvore da floresta. Em seguida, calcule a média das predições out-of-bag para cada linha que aparece pelo menos uma vez nos dados out-of-bag. Para a avaliação do modelo com os dados out-of-bag, a média da variável de resposta é a média em todas as linhas nos dados out-of-bag.
Para o conjunto de dados de teste, use cada árvore na floresta para prever cada valor no conjunto de dados de teste. Em seguida, a média das previsões de todas as árvores para obter a predição para o modelo. Para a avaliação do modelo com o conjunto de teste, a resposta média é a média das linhas no conjunto de teste.
O cálculo de R2 usa os dados out-of-bag ou os dados de teste. As predições diferem nesses dois casos. Em geral, a fórmula para R2 tem a seguinte forma:
Termo | Descrição |
---|---|
yi | valor de resposta observado |
resposta média | |
valor de resposta previsto para a linha | |
N | número de linhas |