O gráfico de seleção de modelo é um gráfico de dispersão dos valores R2 e R2 preditos como uma função do número de componentes que estão ajustados ou que tiveram a validação cruzada. Ele é uma exibição gráfica da tabela Seleção e Validação do Modelo. Se você não usar a validação cruzada, os valores R2 preditos não aparecem em seu gráfico. O Minitab fornece um gráfico de seleção de modelo por resposta.
Use este gráfico para comparar a modelagem e o poder de predição dos diferentes modelos para determinar o número apropriado de componentes a reter em seu modelo. A linha vertical no gráfico indica o número de componentes que o Minitab selecionou para o modelo PLS.
O gráfico de resposta é um gráfico de dispersão dos valores ajustados versus as respostas atuais. Se você realizar a validação cruzada, o gráfico também inclui os valores ajustados versus os valores ajustados da validação cruzada. O Minitab fornece um gráfico de resposta por resposta.
Um modelo com excelente capacidade preditiva normalmente tem uma inclinação de 1 e intercepta o eixo-y no 0.
O gráfico de coeficientes é um gráfico de dispersão projetado que mostra os coeficientes não-padronizados de cada preditora. O Minitab fornece um gráfico de coeficientes por resposta.
Use o gráfico de coeficientes, junto com a saída dos coeficientes de regressão para comparar o sinal e a magnitude dos coeficientes de cada preditora. O gráfico facilita identificar rapidamente as preditoras que são mais ou menos importantes no modelo.
Como o gráfico exibe coeficientes padronizados, você só pode fazer comparações entre a magnitude das relações entre preditoras e a resposta se suas preditoras estiverem na mesma escala (por exemplo dados espectrais). Caso contrário, use o gráfico de coeficientes padronizados ou use o gráfico de cargas fatoriais para comparar os pesos das preditoras usadas para calcular os componentes.
O gráfico de coeficiente é um gráfico de dispersão projetado mostrando os coeficientes padronizados de cada preditora. O Minitab fornece um gráfico de coeficiente padronizado por resposta.
Use este gráfico, junto com a saída dos coeficientes de regressão para comparar o sinal e a magnitude dos coeficientes de cada preditora. O gráfico facilita identificar rapidamente as preditoras que são mais ou menos importantes no modelo.
Como o gráfico exibe os coeficientes padronizados, você pode fazer comparações entre a magnitude das relações entre preditoras e a resposta mesmo se suas preditoras não estiverem na mesma escala.
Se suas preditoras estiverem na mesma escala, o padrão dos coeficientes nos gráficos padronizados e não-padronizados parecem similares. Esses gráficos podem não parecer idênticos, contudo, porque as preditoras estão altamente correlacionadas, fazendo com que os coeficientes estejam instáveis e por causa das diferenças entre desvios padrão das amostras e desvios padrão da população.
O gráfico de distância é um gráfico de dispersão da distância de cada observação dos modelos x e y. As distâncias do modelo-y medem quão bem uma observação é ajustada no espaço-y. As distâncias do modelo-x medem quão bem uma observação é ajustada no espaço-x.
Ao examinar este gráfico, procure pontos com distâncias maiores do que outros pontos no eixo-x ou no eixo-y. As observações com maiores distâncias do modelo-y podem ser outliers e observações com maiores distâncias do modelo-x e podem ser pontos de leverage.
O histograma dos resíduos padronizados mostra a distribuição dos resíduos padronizados para todas as observações.
Padrão | O que o padrão pode indicar |
---|---|
Uma longa cauda em uma direção | Assimetria |
Uma barra que está longe das outras barras | Um outlier |
Como a aparência de um histograma depende do número de intervalos usado para agrupar os dados, não use um histograma para avaliar a normalidade dos resíduos. Em vez disso, use um gráfico de probabilidade normal. Um histograma é mais eficaz quando você tem aproximadamente 20 ou mais pontos de dados. Se a amostra é muito pequena, então cada barra no histograma não contém pontos de dados suficientes para confiavelmente mostrar assimetria ou outliers.
O gráfico de probabilidade normal dos resíduos mostra os resíduos padronizados versus seus valores esperados quando a distribuição é normal.
Use o gráfico de probabilidade normal de resíduos para verificar a pressuposição de que os resíduos são distribuídos normalmente. O gráfico de probabilidade normal dos resíduos deve seguir aproximadamente uma linha reta.
Se você vir um padrão não-normal, use os outros gráficos residuais para verificar outros problemas com o modelo, tais como termos faltantes ou um efeito de ordem de tempo. Se os resíduos não seguirem uma distribuição normal, os intervalos de confiança e os valores-p podem ser inexatos.
Os gráficos de resíduos versus ajustes representam os resíduos padronizados no eixo-y e os valores ajustados no eixo-x.
Use o gráfico de resíduos versus ajustes para verificar a pressuposição de que os resíduos são aleatoriamente distribuídos e têm variância constante. De maneira ideal, os pontos devem cair aleatoriamente em ambos os lados de 0, sem padrões reconhecíveis nos pontos.
Padrão | O que o padrão pode indicar |
---|---|
Dispersão grande ou irregular de resíduos entre valores ajustados | Variância não constante |
Curvilíneo | Um termo de ordem mais alta ausente |
Um ponto que está distante de zero | Um outlier |
Um ponto que é distante dos outros pontos na direção x | Um ponto influente |
O gráfico de resíduos versus leverage é um diagrama de dispersão dos resíduos padronizados versus o leverage de cada observação.
O gráfico de resíduos versus ordem mostra os resíduos padronizados na ordem em que os dados foram coletados.
O gráfico de escores é um gráfico de dispersão dos escores-x dos primeiro e segundo componentes do modelo.
Se os primeiros dois componentes explicarem a maioria da variância nas preditoras, a configuração dos pontos neste gráfico reflete de perto a configuração multidimensional original dos seus dados. Para verificar quanta variância nas preditoras o modelo explica, examine os valores de variância-x na tabela Seleção e Validação do Modelo. Se o valor da variância-x for alto, o modelo explica a variância da significância nas preditoras.
Se o seu modelo contiver mas de dois componentes, você pode querer representar graficamente os escores-x de outros componentes usando a Gráfico de dispersão. Para fazer isso, armazene a matriz de escores-x e depois copie a matriz para colunas usando . Se seu modelo tiver somente um componente, este gráfico não aparecerá em sua saída.
O gráfico de escores 3D é um gráfico de dispersão tridimensional dos escores-x dos primeiro, segundo e terceiro componentes do modelo. Se os primeiros três componentes explicarem a maioria da variância nas preditoras, a configuração dos pontos neste gráfico reflete de perto a configuração multidimensional original dos seus dados. Para verificar quanta variância o modelo explica, examine os valores de variância-x na tabela Seleção e Validação do Modelo. Se o valor da variância-x for alto, o modelo explica a variância da significância nas preditoras.
Você também deve usar as ferramentas de gráfico 3D, que lhe permitirão rotacionar o gráfico para que você possa visualizá-lo de diferentes perspectivas. Isso lhe dará uma imagem mais completa dos seus dados e permitirá identificar com mais exatidão os pontos de leverage e clusters de pontos.
O gráfico de cargas fatoriais é um gráfico de dispersão das preditoras projetadas para o primeiro e o segundo componentes do modelo. Ele mostra as cargas fatoriais-x do segundo componente representadas contra as cargas fatoriais-x do primeiro componente. Cada ponto, representa uma preditora, está conectado a (0,0) no gráfico.
O gráfico de cargas fatoriais mostra quão importante são as preditoras para os primeiros dois componentes e é particularmente útil quando suas preditoras estão em diferentes escalas. Se os componentes explicarem a maioria da variância-x, que é mostrada na tabela Seleção do modelo e validação, o gráfico de cargas fatoriais indica quão importantes são as preditoras no espaço-x. Quando considerarem a importância das preditoras no modelo inteiro, você também deverá considerar quanta variância os componentes explicam as respostas. Para confirmar isso, examine os valores R2 e R2 preditos na Seleção de Modelo e Validação.
Se o seu modelo contiver mas de dois componentes, você pode querer representar graficamente as cargas de x de outros componentes usando a Gráfico de dispersão. Para fazer isso, armazene a matriz de cargas fatoriais-x e depois copie a matriz para colunas usando .
O gráfico X de resíduos é um gráfico de linhas dos resíduos-x versus as preditoras. Cada linha representa uma observação e tem vários pontos conforme ela tem preditoras.
Use o gráfico da matriz de resíduos-x para identificar observações ou preditoras que o modelo descreve de forma insuficiente. Este gráfico é muito útil com preditoras que estão na mesma escala.
Use o gráfico da matriz dos resíduos-x para examinar padrões nos resíduos e identificar áreas onde existem problemas. Depois, examine os resíduos-x exibidos na saída para determinar quais observações e preditoras o modelo descreve de forma insuficiente.
O gráfico X calculado é um gráficos de linhas dos valores-x calculados versus as preditoras. Cada linha representa uma observação e tem tantos pontos quanto preditoras.
Use este gráfico para identificar observações ou preditoras que o modelo descreve de forma insuficiente. Este gráfico é muito útil com preditoras que estão na mesma escala.
O gráfico X calculado complementa o gráfico x de resíduos. A soma de ambos os gráficos resulta em um gráfico dos valores de preditora original. Uma preditora com valores x calculados que são muito menores ou maiores do que os valores-x originais não é bem descrito pelo modelo.