O que são os esquemas de codificação para preditores categóricos?

Quando você efetua uma análise de regressão dos mínimos quadrados, logística ou de Poisson com preditores categóricos, o Minitab usa um esquema de codificação para extrair variáveis indicadoras do preditor categórico. O esquema de codificação padrão é 1, 0 (também conhecido como codificação binária e fictícia) é comumente usado em análises de regressão.
  • Com a codificação 1, 0, os coeficientes representam a distância entre níveis de fatores e seu nível de referência.
  • Usando codificação 1, 0, 1, os coeficientes representam a distância entre níveis de fatores e a média geral.
Para preditoras com codificação 1, 0, por padrão, o Minitab define os seguintes níveis de referência com base no tipo dos dados:
  • Para as preditoras categóricas numéricas, o nível de referência é o nível com o menor valor numérico.
  • Para as preditoras categóricas de data/hora, o nível de referência é o nível com a data/hora mais antiga.
  • Para as preditoras categóricas de texto, o nível de referência é o nível que está em primeiro na ordem de valor, que é a ordem alfabética, por padrão.
Para preditores com codificação -1, 0, 1, por padrão, o Minitab define os seguintes níveis de referência com base no tipo dos dados:
  • Para os preditores categóricos numéricos, o nível de referência é o nível com o maior valor numérico.
  • Para os preditores categóricos de data/hora, o nível de referência é o nível com a data/hora mais recente.
  • Para os preditores categóricos de texto, o nível de referência é o nível que está em último lugar na ordem alfabética.

Como alterar o esquema de codificação

Em análises de regressão, incluindo Ajuste do modelo de regressão e Ajustar modelo logístico binário, Minitab usa a codificação 1, 0 por padrão. Se você deseja alterar o esquema de codificação para -1, 0, 1, vá para a subcaixa de diálogo Codificando. Para Regressão de mínimos quadrados parciais, você pode alterar o nível de referência na Opções subcaixa de diálogo .

Como os esquemas de codificação funcionam

Para incluir preditores categóricos em seu modelo de regressão geral, o Minitab codifica as categorias para que elas possam ser incluídas na equação de regressão. A regressão faz isso automaticamente, criando colunas para os preditores categóricos com base no esquema de codificação que é usado. Uma coluna de códigos é criada para cada nível de fator exceto pelo nível de referência. O Minitab cria colunas e atribui um "1" quando uma linha pertence ao grupo de colunas. Nenhuma coluna é criada para o nível de referência. Para obter mais informações sobre o esquema de codificação e a matriz de, acesse Como o Minitab usa a matriz de planejamento para regressão.

Os exemplos a seguir mostram como os esquemas de codificação funcionam para um preditor categórico para Localização com três níveis: Hong Kong, Londres e Nova York. Se o esquema de codificação for -1, 0, 1, o nível de referência padrão é Nova York. Nenhuma coluna é criada para Nova York e nenhum coeficiente para Nova York aparece na tabela de coeficientes na saída. Uma coluna é criada para Hong Kong e Londres, e se a linha de alguma coluna corresponder a Nova York (o nível de referência), é atribuído um "-1".

Se a localização for Hong Kong Londres
Hong Kong 1 0
Londres 0 1
Nova York -1 -1

Se o esquema de codificação for 1, 0, o nível de referência padrão é Hong Kong, porque é o primeiro em ordem alfabética. Nenhuma coluna é criada para Hong Kong e nenhum coeficiente para Hong Kong aparece na tabela de coeficientes na saída. Uma coluna é criada para Londres e Nova Iorque.

Se a localização for Londres Nova York
Hong Kong 0 0
Londres 1 0
Nova York 0 1

Para obter mais informações sobre a interpretação dos coeficientes para o modelo de regressão ajustado, vá para Interpretando preditores categóricos.

Para obter mais informações sobre a interpretação dos coeficientes para a regressão logística binária ajustada, vá para Interpretando os coeficientes estimados em regressão logística binária.