Para o percentual da estatística de erros, o valor depende do percentual dos maiores resíduos no cálculo. Nas fórmulas a seguir, os cálculos assumem que os resíduos estão ordenados por valor absoluto, de tal forma que i = 1 representa o resíduo com maior valor absoluto e i = N representa o resíduo com o menor valor absoluto.
Quando você usa a validação cruzada de K dobras, a estatística de treinamento incluem os valores ajustados da árvore final do conjunto de dados completo. A estatística de teste utilizam os valores ajustados no processo de validação que podem ter árvores diferentes para cada dobra.
Quando você usa um conjunto de dados de teste para validação, a estatística de teste usam os valores ajustados apenas para o conjunto de dados de teste.
Termo | Descrição |
---|---|
c | contagem de maiores resíduos para o percentual |
yi | i o valor de resposta observado |
resposta média | |
resposta instalada i o | |
N | número de registros |