Interpretar todas as estatísticas e gráficos para Análise discriminante

Encontre definições e orientações de interpretação para cada estatística e gráfico fornecido com a análise discriminante.

Grupo real

O grupo verdadeiro no qual uma observação é classificada. O grupo real é determinado pelos valores na coluna de agrupamento da worksheet.

Interpretação

Para avaliar a classificação das observações em cada grupo, compare os grupos nos quais as observações foram colocadas com seus grupos reais.

Sumário de classificações

Alocado no
Grupo
Grupo Verdadeiro
123
15950
21533
30257
Total de N606060
N correto 595357
Proporção0,9830,8830,950

A coluna 2 desta tabela de Resumo da classificação mostra que 53 observações foram corretamente atribuídas ao Grupo 2. Contudo, 5 observações do Grupo 2 foram, em vez disso, colocadas no Grupo 1, e 2 observações do Grupo 2 foram colocadas no Grupo 3. Portanto, 7 das observações do Grupo 2 foram incorretamente classificadas em outros grupos.

Sumário de Observações Classificadas Incorretamente

ObservaçãoGrupo
Verdadeiro
Grupo PredGrupoDistância
Quadrática
Probabilidade
4**1213,5240,438
      23,0280,562
      325,5790,000
65**2112,7640,677
      24,2440,323
      329,4190,000
71**2113,3570,592
      24,1010,408
      327,0970,000
78**2112,3270,775
      24,8010,225
      329,6950,000
79**2111,5280,891
      25,7320,109
      332,5240,000
100**2115,0160,878
      28,9620,122
      338,2130,000
107**23139,02260,000
      27,36040,032
      30,52490,968
116**23131,8980,000
      27,9130,285
      36,0700,715
123**32130,1640,000
      25,6620,823
      38,7380,177
124**32126,3280,000
      24,0540,918
      38,8870,082
125**32128,5420,000
      23,0590,521
      33,2300,479

A Linha 1 dessa tabela de Resumo de observações de falsa resposta mostra que a observação 4 foi predita para pertencer ao Grupo 2, mas, na verdade, ela pertence ao Grupo 1.

Colocar no grupo

O grupo no qual uma observação é predita para pertencer com base na análise discriminante.

Interpretação

Para avaliar a classificação das observações em cada grupo, compare os grupos nos quais as observações foram colocadas com seus grupos reais. Por exemplo, a linha 2 da seguinte tabela Resumo de classificação mostra que um total de 1 + 53 + 3 = 57 observações foram colocadas no Grupo 2. Daquelas 57 observações, 53 observações foram corretamente atribuídas ao Grupo 2. Contudo, 1 observação que foi colocada no Grupo 2 foi, na verdade, do Grupo 1, e 3 observações que foram colocadas no Grupo 2 foram, na verdade, do Grupo 3. Portanto, 4 das observações preditas para pertencerem ao Grupo 2 foram, na verdade, de outros grupos.

Sumário de classificações

Alocado no
Grupo
Grupo Verdadeiro
123
15950
21533
30257
Total de N606060
N correto 595357
Proporção0,9830,8830,950

N total

O número total de observações em cada grupo verdadeiro.

N corretas

O número de observações corretamente posicionadas em cada grupo real. O Minitab exibe o N corretas para cada grupo real e o N corretas total para todos os grupos.

Interpretação

Use o valor N corretas para determinar quantas observações em seu conjunto de dados são preditas para pertencer ao grupo ao qual elas foram atribuídas. Por exemplo, para o Grupo 1, suponha que o valor N corretas é 52 e o valor N total é 60. Isso indica que 60 valores são identificados como pertencendo ao Grupo 1 com base nos valores na coluna de agrupamento da worksheet. Dessas 60 observações, 52 são preditas para pertencer ao Grupo 1 com base na função discriminante usada para a análise. Portanto, o número de observações que são corretamente posicionados em cada grupo real é 52.

Proporção

A proporção de observações corretamente posicionada em cada grupo real.

Interpretação

Use a proporção de observações corretamente posicionada em cada grupo para avaliar quão bem suas observações são classificadas. Por exemplo, as proporções no Resumo da tabela de classificação indicam o seguinte:

  • 98,3% das observações no grupo 1 estão corretamente posicionadas.
  • 88,3% das observações no grupo 2 estão corretamente posicionadas.
  • 95% das observações no grupo 3 estão corretamente posicionadas.

Portanto, as observações classificadas no grupo 2 têm a maioria dos problemas.

Sumário de classificações

Alocado no
Grupo
Grupo Verdadeiro
123
15950
21533
30257
Total de N606060
N correto 595357
Proporção0,9830,8830,950

N

O número de valores não faltantes no conjunto de dados. N é igual ao número total de observações em todos os grupos.

Proporção correta

A proporção de classificações corretas para todos os grupos. Este valor é igual ao número de observações corretamente posicionadas (N corretas) dividido pelo número total de observações (N).

Distância quadrada entre grupos

A distância quadrática de um centro de grupo (média) para outro centro de grupo (média). Uma observação é classificada em um grupo se o quadrado da distância (também chamada distância de Mahalanobis) da observação ao centro do grupo é mínima.

Observação

Se você usa a função quadrática, o Minitab exibe a tabela Distância quadrada generalizada. Para obter mais informações sobre como as distâncias quadradas são calculadas para cada função, vá para Distância e funções discriminantes para Análise discriminante.

Interpretação

Apesar dos valores de distância não serem muito informativos por si mesmos, você pode comparar as distâncias para ver quão diferentes os grupos são. Por exemplo, os resultados a seguir indicam que a maior distância é entre os grupos 1 e 3 (48,0911). A diferença entre os grupos 1 e 2 é 12,9853 e a diferença entre os grupos 2 e 3 é 11,3197.

Distância Quadrática Entre Grupos

123
10,000012,985348,0911
212,98530,000011,3197
348,091111,31970,0000

Função discriminante linear para grupos

A função discriminante linear para grupos indica a equação linear associada com cada grupo. Os escores discriminantes lineares para cada grupo correspondem aos coeficientes de regressão na análise de regressão múltipla.

Interpretação

Use a função discriminante linear para grupos para determinar como as variáveis preditoras se diferenciam entre os grupos. Por exemplo, quando você tem três grupos, o Minitab estima uma função para discriminação entre os seguintes grupos:
  • Grupo 1 e grupos 2 e 3
  • Grupo 2 e grupos 1 e 3
  • Grupo 3 e grupos 1 e 2

Os grupos com a maior função discriminante linear ou coeficientes de regressão, contribuem mais para a classificação das observações. Por exemplo, nos seguintes resultados, o grupo 1 tem a maior função discriminante linear (17,4) para escores de teste, o que indica que os escores de teste do grupo 1 contribuem mais do que aqueles do grupo 2 ou do grupo 3 para a classificação da identificação do grupo. O grupo 3 tem a maior função discriminante linear para motivação, o que indica que os escores de motivação do grupo 3 contribuem mais do que aqueles do grupo 1 ou do grupo 2 para a classificação da identificação do grupo.

Função Discriminante Linear para Grupos

123
Constante-9707,5-9269,0-8921,1
Pontuação do teste17,417,016,7
Motivação-3,2-3,7-4,3

Média combinada

A média combinada é a média ponderada das médias de cada grupo verdadeiro. Para exibir a média combinada, você deve clicar Opções e selecionar Acima mais média, desv. pad. e sumário de covariância quando realizar a análise.

Interpretação

Use a média combinada para descrever o centro de todas as observações nos dados. Por exemplo, nos resultados a seguir, a média geral dos escores de teste de todos os grupos é 1102,1.

Médias dos Grupos


Média
Combinada
Médias dos Grupos
Variável123
Pontuação do teste1102,11127,41100,61078,3
Motivação47,05653,60047,41740,150

Médias do grupo

A soma dos valores em cada grupo real dividida pelo número de valores (não faltantes) em cada grupo real. Para exibir as médias para grupos, você deve clicar em Opções e selecionar Acima mais média, desv. pad. e sumário de covariância quando realizar a análise.

Interpretação

Use as médias de grupo para descrever cada grupo real com um único valor que representa o centro dos dados. Por exemplo, nos resultados a seguir, o grupo 1 tem o maior escore de teste médio (1127,4), enquanto o grupo 3 tem o menor escore de teste médio (1078,3). O escore de teste médio para o grupo 2 está no meio (1100,6).

Médias dos Grupos


Média
Combinada
Médias dos Grupos
Variável123
Pontuação do teste1102,11127,41100,61078,3
Motivação47,05653,60047,41740,150

StDev combinado

O desvio padrão combinado é uma média ponderada dos desvios padrão de cada grupo real. Para exibir o desvio padrão combinado, você deve clicar em Opções e selecionar Acima mais média, desv. pad. e sumário de covariância quando realizar a análise.

Interpretação

Use o desvio padrão combinado para determinar o grau de dispersão dos pontos de dados individuais com relação à sua média do grupo real. Por exemplo, nos resultados a seguir, o desvio padrão combinado para os escores de teste de todos os grupos é 8,109.

Desvios Padrão do Grupo


DesvPad
Combinado
DesvPad do Grupo
Variável123
Pontuação do teste8,1098,3089,2666,511
Motivação2,9942,4093,2433,251

DesvPad para grupos

A medida mais comum de dispersão, ou o quanto os dados estão dispersos sobre a média. O desvio padrão dos grupos é o desvio padrão de cada grupo real. Para exibir os desvios padrão, você deve clicar em Opções e selecionar Acima mais média, desv. pad. e sumário de covariância quando realizar a análise.

Interpretação

Use o desvio padrão para os grupos para determinar o grau de dispersão dos dados a partir da média em cada grupo real. Por exemplo, nos resultados a seguir, os escores de teste do grupo 2 têm o maior desvio padrão (9,266). Isso indica que os escores de teste do grupo 2 têm a maior variabilidade dos três grupos. O grupo 3 tem o menor desvio padrão (6,511) e a menor variabilidade dos três grupos.

Desvios Padrão do Grupo


DesvPad
Combinado
DesvPad do Grupo
Variável123
Pontuação do teste8,1098,3089,2666,511
Motivação2,9942,4093,2433,251

Matriz de covariância combinada

Uma matriz ponderada da relação entre todas as observações em todos os grupos. A matriz de covariância combinada é calculada extraindo-se a média das matrizes de covariância de grupos individuais elemento por elemento.

Para exibir a matriz de covariância combinada, você deve clicar em Opções e selecionar Acima mais média, desv. pad. e sumário de covariância quando realizar a análise.

Matriz de covariância

Uma matriz não padronizada que indica a relação linear entre cada par de variáveis. A covariância é similar ao coeficiente de correlação, que é a covariância dividida pelo produto dos desvios padrão das variáveis.

Para exibir a matriz de covariância de cada grupo, você deve clicar em Opções e selecionar Acima mais média, desv. pad. e sumário de covariância quando realizar a análise.

Observação

Número de observação de cada observação. O número de observação corresponde à linha da observação classificada na worksheet do Minitab. O Minitab exibe os símbolos ** após o número da observação se a observação tiver fornecido uma falsa resposta (isto é, se o grupo real diferir do grupo predito).

Para ver o grupo predito e o grupo real para todas as observações em seu conjunto de dados, você deve clicar em Opções e selecionar Acima mais sumário de classificação completo quando realizar a análise.

Grupo Pred

O grupo predito para cada observação é o identificador do grupo que o Minitab atribui à observação com base na distância quadrada predita. Para ver o grupo predito e o grupo real para cada observação em seu conjunto de dados, você deve clicar em Opções e selecionar Acima mais sumário de classificação completo quando realizar a análise.

Interpretação

Compare o grupo predito e o grupo real para cada observação para determinar se a observação foi classificada corretamente. Se o grupo predito diferir do grupo real, então a observação teve uma falsa resposta.

Grupo X-val

O grupo predito usando-se validação cruzada (X-val) é o identificador de grupo que o Minitab atribui à observação com base na distância quadrada predita usando-se validação cruzada. Para ver o grupo predito usando-se validação cruzada para cada observação, você deve selecionar Usar validação cruzada na caixa de diálogo principal e, depois, clicar em Opções e selecionar Acima mais sumário de classificação completo, quando você realiza a análise.

Interpretação

Compare o grupo predito usando a validação cruzada e o grupo real para cada observação para determinar se a observação foi classificada corretamente. Se o grupo predito usando validação cruzada difere do grupo verdadeiro, então a observação teve uma falsa resposta.

Importante

O grupo predito usando validação cruzada omite uma observação para criar a regra de discriminação e depois vê quão bem a regra funciona para aquela observação específica. Ao não usar a validação cruzada, você vicia a regra de discriminação usando aquela observação para criar a regra.

Distância quadrada

Os valores da distância quadrada prevista para cada observação de cada grupo. O valor da distância quadrada indica quão longe uma observação está de cada média de grupo. Para ver a distância quadrada para cada observação em seus dados, você deve clicar em Opções e selecionar Acima mais sumário de classificação completo quando realizar a análise.

Observação

Se você usa validação cruzada ao realizar a análise, o Minitab calcula a distância quadrada predita para cada observação com validação cruzada (X-val) e sem validação cruzada (Pred). Para obter mais informações sobre como as distâncias quadradas são calculadas, vá para Distância e funções discriminantes para Análise discriminante.