Este comando está disponível com o Módulo de análise preditiva. Clique aqui saber mais sobre como ativar o módulo.
Regressão Random Forests® usa validação fora da sacola para cada análise. Se você selecionar validação com um conjunto de teste, além da validação fora da sacola, então a tabela exibirá a coluna que identifica o conjunto de teste ou a porcentagem dos dados nos conjuntos de teste e treinamento.
O número de amostras por bootstrap indica o número de árvores na análise. Quando você usa a única validação fora da sacola, o tamanho da amostra é o mesmo que o número de linhas na análise. Quando você usa validação com um conjunto de teste, o tamanho padrão da amostra é o mesmo que o tamanho dos dados de treinamento. Se você optar por usar um tamanho amostral menor do que o tamanho dos dados de treinamento, a tabela exibirá esse tamanho.
Esta linha indica se a divisão do nó considera cada preditor em cada nó ou um subconjunto aleatório dos preditores. Se a divisão do nó usar um subconjunto aleatório, esta linha indica a escolha para o número de preditores a serem considerados.
Se você usar todos os preditores inicialmente, considere se deve usar um subconjunto de preditores nos modelos subsequentes para comparar o desempenho dos modelos.
O tamanho mínimo do nó interno indica o número mínimo de casos que um nó pode ter e ainda se dividir em mais nós. Se o desempenho do modelo for inadequado, pondere sobre aumentar esse valor para ver o efeito sobre o desempenho.
Por padrão, a análise não tem uma penalidade de valor faltante e esta linha não está presente. A penalidade de valor faltante penaliza uma variável preditora com base na proporção de valores faltantes. Uma variável com uma penalidade alta é menos propensa a se tornar o divisor de um nó.
Por padrão, a análise não tem uma penalidade de categoria de alto nível e esta linha não está presente. A penalidade de categoria de nível superior penaliza a variável com base no número de níveis categóricos em relação ao tamanho do nó para cada nó. Assim, um concorrente com muitos níveis em um nó tem menos probabilidade de se tornar o divisor desse nó.
O número de observações de resposta presentes na análise que ajusta e avalia o modelo.
O número de observações de resposta faltantes.