Selecione os critérios para determinar o melhor modelo e especifique opções para os diferentes tipos de modelos. Você também pode especificar uma base para o gerador de números aleatórios.

Critério para selecionar o melhor modelo

Escolha o critério para determinar o melhor tipo de modelo. Você pode comparar os resultados de vários métodos para determinar a melhor escolha para sua aplicação.
  • R-quadrado máximo: O método padrão funciona bem em muitos aplicativos. Esse método minimiza a soma dos erros ao quadrado.
  • Desvio absoluto médio mínimo: Este método minimiza a soma dos valores absolutos dos erros.

Usar a função de perda de Huber com o valor de comutação K para ajustar modelos de Regressão TreeNet®: K =

A função de Huber é um híbrido das funções de R ao quadrado máximo e de desvio absoluto médio mínimo. Com a função Huber, especifique um valor de comutação. A função de perda começa como a função de erro quadrado. A função de perda permanece como erro quadrado, desde que o valor seja menor que o valor de comutação. Se o erro quadrado exceder o valor de comutação, então a função de perda se tornará uma função de desvio absoluto. Se o desvio absoluto se tornar menor que o valor de comutação, então a função de perda se torna uma função de erro quadrado novamente.

Opções para modelos de regressão TreeNet®

Especifique opções para o modelo TreeNet®.

Número de árvores
Insira um valor entre 1 e 5000, para indicar o número de árvores a serem construídas. O valor padrão de 300 produz resultados iniciais úteis.
Se o modelo inicial selecionado estiver próximo do número de árvores especificadas, pondere sobre o aumento do número de árvores para procurar um modelo melhor.
Máximo de nós terminais por árvore E o Profundidade máxima da árvore
Você também pode limitar o tamanho das árvores. Escolha uma das seguintes opções para limitar o tamanho das árvores.
  • Máximo de nós terminais por árvore: Digite um valor entre 2 e 2000 para representar o número máximo de nós terminais de uma árvore. Normalmente, o valor padrão de 6 proporciona um bom equilíbrio entre a velocidade de cálculo e a investigação das interações entre as variáveis. Um valor de 2 elimina a investigação das interações.
  • Profundidade máxima da árvore: Digite um valor entre 2 e 1000 para representar a profundidade máxima de uma árvore. O nó raiz corresponde a uma profundidade de 1. A profundidade padrão é 4. Em muitas aplicações, profundidades de 4 a 6 dão modelos razoavelmente bons.
Taxa de aprendizado
Especifique até 10 taxas de aprendizado.
Por padrão, a análise avalia 3 taxas de aprendizagem. A análise geralmente sintoniza os hiperparmetros com 3 valores de K: 0,001, 0,1 e máximo (0,01, 0,1 * min(1.0, N/10000)), onde N = número de linhas na coluna de resposta. Se max (0,01, 0,1 * min (1.0, N/10000)) = 0,001 ou 0,1, então a análise sintoniza os hiperparmetros com 0,001, 0,01 e 0,1.
Fração da subamostra
Especifique até 10 frações de subsample. A cada iteração, o procedimento seleciona um subconjunto diferente que contém esta fração dos dados para construir uma árvore. A subsamtração protege da superequipamento. Insira um número maior que 0 e menor que ou igual a 1. Os valores comuns são 0,5 e 0,7.
Número de preditores para divisão do nó
Especifique o número de preditores a serem considerados para cada divisão de nó. Normalmente, a análise funciona bem quando você considera todos os preditores em cada nó. No entanto, alguns conjuntos de dados têm associações entre os preditores que levam a um melhor desempenho do modelo quando a análise leva em conta um subconjunto aleatório diferente de preditores em cada nó. Para tais casos, a raiz quadrada do número total de preditores é um ponto de partida típico. Depois de usar a raiz quadrada e visualizar o modelo, você pode considerar se deve especificar um número maior ou menor de preditores com uma porcentagem do total.
  • Número total de preditores: Selecione para usar todos os preditores para dividir nós.
  • Raiz quadrada do número total de preditores: Selecione para usar a raiz quadrada do número total de preditores para dividir os nós.
  • K por cento do número total de preditores; K =: Selecione para usar uma porcentagem de preditores para dividir os nós.

Opções para modelos de regressão Random Forests®

Especifique opções para o modelo Random Forests®.

Número de amostras por bootstrap para cultivar árvores
Insira um valor para determinar o número de amostras por bootstrap e o número de árvores produzidas pela análise. Insira um valor entre 3 e 3000.
Especifique um tamanho amostral de Bootstrap menor que o tamanho dos dados de treinamento
Selecione para inserir um valor que define o tamanho da amostra por bootstrap. Insira um valor maior que ou igual a 5. Se você inserir um tamanho maior do que o tamanho dos dados de treinamento, o Minitab usará um tamanho de amostra igual ao tamanho dos dados de treinamento.
Número de preditores para divisão do nó
Especifique o número de preditores a serem considerados para cada divisão de nó. Normalmente, a análise funciona bem quando você considera a raiz quadrada do número total de preditores. No entanto, alguns conjuntos de dados têm associações entre os preditores que levam a um melhor desempenho do modelo quando a análise considera um número maior ou menor de preditores para cada nó. Depois de usar a raiz quadrada e visualizar o modelo, verifique se deve alterar o número de preditores para tentar melhorar o desempenho do modelo.
  • Número total de preditores: Selecione para usar todos os preditores para dividir nós. A floresta criada por essa opção é chamada de floresta de bootstrap.
  • Raiz quadrada do número total de preditores: Selecione para usar a raiz quadrada do número total de preditores para dividir os nós.
  • K por cento do número total de preditores; K =: Selecione para usar uma porcentagem de preditores para dividir os nós.
Número mínimo de casos para dividir um nó interno
Especifique de 1 a 3 números mínimos. Por padrão, a análise avalia 2, 5 e 8. O padrão é 2, de modo que todos os nós podem ser divididos em nós menores até que outra divisão seja impossível. Se o desempenho do modelo for inadequado, pondere sobre alterar esse valor para ver o efeito sobre o desempenho.

Opções para modelos de regressão CART®

Especifique opções para o modelo CART®.

Critério para seleção da árvore ótima
Escolha entre esses critérios para produzir a árvore nos resultados. Você pode comparar resultados de diferentes árvores para determinar a melhor escolha para sua aplicação.
Dentro de K erros padrão do R-quadrado máximo; K=
Selecione esta opção para que o Minitab escolha a menor árvore com um valor de R2 que caia dentro de K erros padrão da árvore com o valor máximo de R2. Por padrão, K=1, então a árvore nos resultados é a menor árvore de regressão com um valor de R2 dentro de 1 erro padrão do valor máximo de R2.
R-quadrado máximo
Selecione esta opção para exibir resultados para a árvore com o valor máximo de R-quadrado.
Número mínimo de casos para dividir um nó interno
Digite o número mínimo de casos que um nó pode ter e ainda ser dividido em mais nós. O padrão é 10. Com tamanhos amostrais maiores, você pode querer aumentar esse número mínimo. Por exemplo, se um nó interno tiver 10 ou mais casos, o Minitab tenta realizar uma divisão. Se o nó interno tiver 9 casos ou menos, o Minitab não tenta realizar uma divisão.
O limite de nó interno só é relevante quando o valor é pelo menos o dobro do limite do nó terminal. Os limites internos do nó de pelo menos 3 vezes os limites do nó terminal permitem um número razoável de divisores. Normalmente, limites maiores são razoáveis para conjuntos de dados maiores.
Número mínimo de casos permitidos para um nó terminal
Digite o número mínimo de casos que podem estar em um nó terminal. O padrão é 3. Com tamanhos amostrais maiores, você pode querer aumentar esse número mínimo. Por exemplo, se uma divisão criar um nó com menos de 3 casos, o Minitab não realiza uma divisão.

Opções para modelos de regressão CART®

Especifique opções para o modelo MARS®.

Número máximo de funções base
Especifique o número de réplicas O valor padrão de 30 funciona bem na maioria dos casos. Considere um valor maior quando 30 funções de base parecerem muito pequenas para os dados. Por exemplo, considere um valor maior quando você acredita que mais de 30 preditores são importantes.
Se você não tiver certeza se 30 é suficiente, revise os resultados iniciais. Por exemplo, é mais provável que um valor maior melhore o ajuste do modelo se o valor do quadrado R tende para cima à medida que a análise adiciona funções de base.
Número mínimo de observações entre nós
Permitir que a MARS® escolha
A análise usa o tamanho da amostra e a complexidade do modelo para selecionar automaticamente um valor. O valor automático funciona bem na maioria dos casos.
λ especificado pelo usuário
Um valor de 1 indica que pontos de dados consecutivos são elegíveis para serem pontos em que a função de base é alterada. O valor de 1 permite as mudanças mais rápidas nas previsões do modelo. Considere valores diferentes para ver o efeito no ajuste do modelo. Por exemplo, para alguns dados, valores maiores criam modelos mais suaves com menor probabilidade de sobreajustar os dados de treinamento. Esses modelos mais suaves às vezes são menos precisos em certos intervalos dos dados.
Interações com preditor permitidos

Permita interações preditoras até a ordem que você especificar. Uma interação significa que o efeito de um preditor depende do valor de outros preditores. Por exemplo, a taxa na qual o grão seca em um forno depende do tempo no forno, mas o efeito do tempo depende da temperatura do forno. As variáveis de tempo e temperatura interagem.

Não permitir interações (modelo aditivo)
Não permitir interações dos preditores. Nesse caso, o Minitab usa o modelo aditivo em que as funções de base não interagem.
Permitir todas as interações até a ordem 2
Order especifica o número de preditores diferentes que podem estar em uma função base. Por exemplo, uma ordem de 2 indica que o efeito de um preditor pode depender do valor de 1 outro preditor. As seguintes funções de base são um exemplo de uma interação de ordem 2:
  • BF1 = máx(0, X1 − 800)
  • BF2 = máx(0, X2 − 50) * BF1

Base para o gerador de números aleatórios

Você pode especificar uma base para o gerador de números aleatórios a fim de selecionar aleatoriamente as subamostras e o subconjunto de preditores. Normalmente, você não precisa mudar a base. Você pode alterar a base para explorar o grau de sensibilidade dos resultados em relação às seleções aleatórias ou para garantir a mesma seleção aleatória para análises repetidas.