Compreendendo as covariáveis

O que é uma covariável?

Covariáveis são normalmente utilizadas na ANOVA e DOE. Nestes modelos, uma covariável é qualquer variável contínua, que geralmente não é controlada durante a coleta de dados. Com a inclusão de covariáveis, o modelo permite incluir e ajustar para variáveis de entrada que foram medidas, mas não aleatorizadas ou controladas no experimento. A adição de co-variáveis pode melhorar significativamente a precisão do modelo e pode afetar significativamente os resultados das análises finais. Incluindo uma covariável no modelo pode reduzir o erro no modelo para aumentar o poder dos testes de fatores. Covariáveis comuns incluem temperatura ambiente, umidade e características de uma peça ou sujeitos antes de um tratamento ser aplicado.

Por exemplo, um engenheiro quer estudar o nível de corrosão em quatro tipos de vigas de ferro. O engenheiro expõe cada feixe a um tratamento líquido para acelerar a corrosão, mas não pode controlar a temperatura do líquido. A temperatura é uma covariável que deve ser considerada no modelo.

Em um DOR, um engenheiro pode estar interessado no efeito da temperatura ambiente da covariável sobre o tempo de secagem de dois tipos diferentes de pintura.

Exemplo de adição de uma covariável a um modelo linear geral

A empresa têxtil usa três máquinas diferentes para a fabricação de fibras de monofilamento. Eles querem determinar se a resistência à ruptura da fibra varia de acordo com a máquina usada. Eles coletam dados sobre a força e diâmetro para 5 fibras selecionadas aleatoriamente a partir de cada máquina. Como a resistência das fibras está relacionada ao seu diâmetro, eles também registram o diâmetro da fibra para utilização como uma possível covariável.

C1 C2 C3
Máquina Diâmetro Resistência
1 20 36
1 25 41
1 24 39
1 25 42
1 32 49
2 22 40
2 28 48
2 22 39
2 30 45
2 28 44
3 21 35
3 23 37
3 26 42
3 21 34
3 15 32
  1. Verifique se a covariável e a resposta se relacionam linearmente. Isso pode ser feito no Minitab analisando os dados com um gráfico de linha fixa.
    1. Selecione Estat > Regressão > Gráfico de Linha Ajustada.
    2. Em Resposta (Y) insira Resistência.
    3. Em Preditor (X) insira Diâmetro.
    4. Avalie a proximidade dos dados para a linha ajustada e a proximidade de R2 de um "ajuste perfeito" (100%).

    O gráfico de linha ajustada indica uma forte relação linear (87,2%) entre diâmetro e resistência.

  2. Faça a análise GLM com a covariável.
    1. Selecione Estat > ANOVA > Modelo Linear Generalizado > Ajuste de Modelo Linear Generalizado.
    2. Em Respostas, insira Resistência.
    3. Em Fatores, insira Máquina.
    4. Em Covariáveis, insira Diâmetro.
    5. Clique em OK.

    Para os dados de produção de fibras, o Minitab exibe os seguintes resultados:

    Modelo Linear Generalizado: Resistência versus Diâmetro; Máquina

    Análise de Variância Fonte GL SQ (Aj.) QM (Aj.) Valor F Valor-P Diâmetro 1 178,014 178,014 69,97 0,000 Máquina 2 13,284 6,642 2,61 0,118 Erro 11 27,986 2,544 Falta de ajuste 7 18,486 2,641 1,11 0,487 Erro puro 4 9,500 2,375 * * Total 14 346,400

    A estatística F para máquinas é 2,61 e o valor de p é 0,118. Como o valor de p > 0,05, você deixa de rejeitar a hipótese nula de que as resistências da fibra não variam com base na máquina usada no nível de significância de 5%. É possível assumir que as resistências da fibra são as mesmas em todas as máquinas. Observe que a estatística F para o diâmetro (covariável) é 69,97 com um valor de p de 0,000. Isto indica que o efeito da covariável é significativo. Isto é, o diâmetro tem um impacto estatisticamente significativo sobre a resistência da fibra.

    Agora suponha que você execute a análise novamente omitindo a covariável. Isso gerará a seguinte saída:

    Modelo Linear Generalizado: Resistência versus Máquina

    Análise de Variância Fonte GL SQ (Aj.) QM (Aj.) Valor F Valor-P Máquina 2 140,4 70,20 4,09 0,044 Erro 12 206,0 17,17 Total 14 346,4

    Observe que a estatística F é 4,09 com um valor de p de 0,044. Sem a covariável no modelo, você rejeita a hipótese nula no nível de significância de 5% e conclui que a resistência das fibras varia em função da máquina usada.

    Esta conclusão é completamente oposta à conclusão à qual você chega quando realiza a análise com a covariável. Este exemplo mostra como não incluir uma covariável pode produzir resultados equivocados da análise.

Ao usar esse site, você concorda com a utilização de cookies para análises e conteúdo personalizado.  Leia nossa política