Um preditor de gráficos de dependência parcial para Regressão MARS®

Observação

Este comando está disponível com o Módulo de análise preditiva. Clique aqui saber mais sobre como ativar o módulo.

Suponha que existam preditores m em um conjunto de dados de treinamento, denotado como x1, x2, ..., xm. Primeiro, classifique os valores distintos do preditor X1 no conjunto de dados de treinamento em ordem crescente. Denote x11 como o primeiro valor distinto de X1. Denote x1N como o último valor distinto de X1. Em seguida, x11 será a coordenada x para o ponto mais à esquerda no gráfico.

Use as etapas a seguir para localizar a coordenada y em x11 .
  1. Encontre o valor ajustado para x11 apenas a partir das funções de base que envolvem o preditor para o gráfico.
  2. Encontre o valor ajustado em pontos distribuídos uniformemente de x11 a x1N
  3. Subtraia o valor mínimo ajustado do ajuste em x11.
Por exemplo, suponha que um modelo tenha as seguintes 2 funções de base:
  • BF 1 = máx(0, x1 − 350)
  • BF 2 = máx(0, x2 − 500)

Suponha também que o modelo tenha a seguinte equação de regressão:

Y = 1000 - 5 * BF1 + 3 * BF2

Por último, suponha que x11 = 400 e que o ajuste mínimo dos pontos distribuídos uniformemente seja 100.

Para encontrar a coordenada y para um gráfico de dependência parcial para X1, considere apenas as funções de base que envolvem X1. Então o ajuste para x11 que considera apenas a função base para X1 vem de:

1000 − 5 * (max(0, 400 - 350)) = 1000 − 5*50 = 750.

Então a coordenada y para x11 é 750 - 100 = 650.

Substituindo x11 por valores distribuídos uniformemente de X1 a XN, obtemos as coordenadas y para o resto dos pontos no gráfico. Esses pontos permitem que você investigue as coordenadas y no gráfico em detalhes. Os padrões no gráfico são aproximadamente os mesmos que um gráfico com linhas que conectam pontos onde as funções de base mudam. Os cálculos para o resto dos preditores são feitos da mesma forma.