Interpretar todas as estatísticas e gráficos para Teste para 2 variâncias

Encontre definições e orientações de interpretação para cada estatística e gráfico fornecido com a análise de 2 variâncias.

Hipótese nula e hipótese alternativa

As hipóteses nula e alternativa são duas declarações mutuamente exclusivas sobre uma população. Um teste de hipótese usa dados amostrais para determinar se deve rejeitar a hipótese nula.
Hipótese nula
A hipótese nula afirma que um parâmetro da população (como a média, o desvio padrão, e assim por diante) é igual a um valor hipotético. A hipótese nula é, muitas vezes, uma afirmação inicial baseado em análises anteriores ou no conhecimento especializado.
Hipótese alternativa
A hipótese alternativa afirma que um parâmetro da população é menor, maior ou diferente do valor hipotético na hipótese nula. A hipótese alternativa é aquela que você acredita que pode ser verdadeira ou espera provar ser verdadeira.

Interpretação

Na saída, as hipóteses nula e alternativa ajudam a verificar se você inseriu o valor correto para a razão hipotética.

Nível de significância

O nível de significância (indicado como α ou alfa) é o nível de risco máximo aceitável para rejeitar a hipótese nula quando ela é verdadeira (erro tipo I). Normalmente, você escolhe o nível de significância antes de analisar os dados. No Minitab, é possível escolher o nível de significância, especificando o nível de confiança, já que o nível de significância é igual a 1 menos o nível de confiança. Como o nível de confiança padrão no Minitab é de 0,95, o nível de significância padrão é 0,05.

Interpretação

Compare o nível de significância com o valor de p para decidir se deve rejeitar ou deixar de rejeitar a hipótese nula (H0). Se o valor de p for menor do que o nível de significância, a interpretação comum é que os resultados são estatisticamente significativos, e você rejeita H0.

Geralmente, um nível de significância (denotado como α ou alfa) de 0,05 funciona bem. Um nível de significância de 0,05 indica que o risco de se concluir que existe uma diferença, quando, na verdade, não existe nenhuma diferença real, é de 5%.
  • Escolha um nível de significância mais elevado, como 0,10, para ter mais certeza de que seja detectada qualquer possível diferença existente. Por exemplo, um engenheiro de qualidade compara a estabilidade de novos rolamentos de esferas com a estabilidade dos rolamentos atuais. Ele deve ter um alto grau de certeza de que os novos rolamentos de esferas são estáveis, porque rolamentos de esferas instáveis podem causar um desastre. O engenheiro escolhe um nível de significância de 0,10 para ter mais certeza de detectar qualquer possível diferença na estabilidade dos rolamentos de esferas.
  • Escolha um nível de significância mais baixo, como 0,01, para ter mais certeza de que seja detectada apenas uma diferença que realmente existe. Por exemplo, um cientista em uma empresa farmacêutica deve ter um alto grau de certeza sobre uma afirmação de que novo medicamento da empresa reduz significativamente os sintomas. O cientista escolhe um nível de significância de 0,001 para ter mais a certeza de que qualquer diferença significativa nos sintomas realmente exista.

N

O tamanho amostral (N) é o número total de observações na amostra.

Interpretação

O tamanho amostral afeta o intervalo de confiança e o poder do teste.

Normalmente, um tamanho amostral grande resulta em um intervalo mais estreito. Uma amostra maior também proporciona ao teste mais poder para detectar uma diferença. Para obter mais informações, vá para O que é potência?.

StDev

O desvio padrão é a medida mais comum de dispersão, ou o quanto os dados estão dispersos sobre a média. O símbolo σ (sigma) é frequentemente usado para representar o desvio padrão de uma população, enquanto s é usado para representar o desvio padrão de uma amostra. A variação que é aleatória ou natural de um processo é frequentemente referida como ruído.

O desvio padrão usa as mesmas unidades que os dados.

Interpretação

O desvio padrão de cada amostra é uma estimativa do desvio padrão de cada população. O Minitab usa o desvio padrão para estimar a razão nos desvios padrão da população. Você deve se concentrar nesta razão.

O desvio padrão também pode ser usado para estabelecer um benchmark para estimativa da variação global de um processo.
Hospital 1
Hospital 2
Tempos de alta de hospital

Os administradores controlam o tempo gasto na alta de pacientes tratados nos departamentos de emergência de dois hospitais. Apesar de os tempos médios de alta serem quase os mesmos (35 minutos), os desvios padrão são significativamente diferentes. O desvio padrão do hospital 1 é de cerca de 6. Em média, o tempo de alta de um paciente se desvia da média (linha tracejada) em cerca de 6 minutos. O desvio padrão do hospital 2 é de cerca de 20. Na média, um tempo de alta de um paciente se desvia da média (linha tracejada) em cerca de 20 minutos.

Variância

A variância mede o quanto os dados estão dispersos em relação à sua média. A variância é igual ao desvio padrão ao quadrado.

Interpretação

A variância de cada amostra é uma estimativa da variância de cada população. O Minitab usa as variâncias para estimar a razão nas variâncias da população. Você deve se concentrar nesta razão.

Razão estimada dos desvios padrão

A razão dos desvios padrão é o desvio padrão da primeira amostra dividida pelo desvio padrão da segunda amostra.

Interpretação

A razão estimada dos desvios padrão dos dados das amostras é uma estimativa da razão em desvios padrão da população.

Como a razão estimada está baseada em dados da amostra e não na população total, é improvável que a razão da amostra seja igual à razão da população. Para estimar melhor a razão, use o intervalo de confiança.

Razão de variâncias estimada

A razão das variâncias é a variância da primeira amostra dividida pela variância da segunda amostra.

Interpretação

A razão estimada das variâncias dos dados das amostras é uma estimativa da razão nas variâncias da população.

Como a razão estimada está baseada em dados da amostra e não na população total, é improvável que a razão da amostra seja igual à razão da população. Para estimar melhor a razão, use o intervalo de confiança.

Intervalo de confiança (IC) e limites

O intervalo de confiança fornece um intervalo de valores possíveis para a razão da população. Como as amostras são aleatórias, é improvável que duas amostras de uma população produzam intervalos de confiança idênticos. Porém, se você repetir sua amostra muitas vezes, uma certa porcentagem dos intervalos ou fronteiras de confiança resultantes contém a diferença de população desconhecida. A porcentagem destes intervalos de confiança ou fronteiras que contêm a razão é o nível de confiança do intervalo. Por exemplo, um nível de confiança de 95% indica que, se você extrair 100 amostras aleatórias da população, poderia esperar que, aproximadamente, 95 das amostras produza intervalos que contêm a razão da população.

Uma fronteira superior define um valor provável que a diferença da população seja menor. Uma fronteira inferior define um valor provável que o parâmetro da população seja maior.

O intervalo de confiança ajuda a avaliar a significância prática de seus resultados. Use seu conhecimento especializado para determinar se o intervalo de confiança inclui valores que tenham significância prática para a sua situação. Se o intervalo for muito amplo para ser útil, pense em aumentar o tamanho da amostra. Para obter mais informações, vá para Como obter um intervalo de confiança mais preciso.

Por padrão, o teste de 2 variâncias exibe os resultados para o método de Levene e o método de Bonett. Em geral, o método de Bonett é mais confiável que o método de Levene. No entanto, para distribuições extremamente assimétricas e distribuições com caudas pesadas, o método de Levene é geralmente mais confiável do que o método de Bonett. Use o teste F somente se tiver certeza de que os dados seguem uma distribuição normal. Qualquer pequeno desvio da normalidade pode afetar muito os resultados do teste F. Para obter mais informações, vá para Devo usar o método de Bonett ou o método de Levene para Teste para 2 variâncias ?.

Razão de desvios padrão

Razão
Estimada
95% IC da Razão
usando Bonett
95% IC da Razão
usando Levene
0,658241(0,372; 1,215)(0,378; 1,296)

Nesses resultados, a estimativa para a razão da população de desvios padrão para taxas de dois hospitais é de 0,658. Usando o método de Bonett, você pode ter 95% de confiança que a razão da população dos desvios padrão para as taxas de hospital está entre 0,372 e 1,215.

DF

Os graus de liberdade (DF) são a quantidade de informação que seus dados fornecem que você pode "gastar" para estimar os valores de parâmetros populacionais desconhecidos, e calcular a variabilidade dessas estimativas. Para um teste com 2 variâncias, os graus de liberdade são determinados pelo número de observações em sua amostra e também depende do método que o Minitab utiliza.

Interpretação

O Minitab usa os graus de liberdade para determinar a estatística de teste. Os graus de liberdade são determinados pelo tamanho amostral. Aumentar o tamanho da amostra fornece mais informações sobre a população, que aumenta os graus de liberdade.

Estatística de teste para o método de Bonett

A estatística de teste é uma estatística que o Minitab calcula para o método de Bonett invertendo o intervalo de confiança. A estatística de teste para o método de Bonett não está disponível para os dados resumidos ou para dados que não estão balanceados.

Interpretação

É possível comparar a estatística de teste com valores críticos de distribuição do qui-quadrado para determinar se deve rejeitar a hipótese nula. No entanto, o uso do valor-p do teste para fazer a mesma determinação é geralmente mais prático e conveniente. O valor-p tem o mesmo significado para qualquer tamanho de teste, mas a mesma estatística de qui-quadrado pode indicar conclusões opostas, dependendo do tamanho da amostra.

Para determinar se deve rejeitar a hipótese nula, compare a estatística de teste com seus valores críticos. Você pode calcular o valor crítico no Minitab ou encontrar o valor crítico de uma tabela Qui-quadrado na maioria dos livros de estatística. Para obter mais informações, acesse Usando a função de distribuição cumulativa inversa (ICDF) e clique em "Usar o ICDF para calcular valores críticos".
  • Para um teste de bilateral, os valores críticos são e . Se a estatística de teste for menor que o primeiro valor ou maior do que o segundo valor, você deve rejeitar a hipótese nula. Se a estatística de teste estiver entre o primeiro e segundo valores, você não deve rejeitar a hipótese nula.
  • Para um teste unilateral com uma hipótese alternativa de "menor que", o valor crítico é . Se a estatística de teste for inferior ao valor crítico, você rejeita a hipótese nula. Caso contrário, você não deve rejeitar a hipótese nula.
  • Para um teste unilateral de "maior que", o valor crítico é . Se a estatística de teste for maior que o valor crítico, você rejeita a hipótese nula. Caso contrário, você não deve rejeitar a hipótese nula.

A estatística de teste é utilizada para calcular o valor-p.

Estatística de teste para o método de Levene

O teste de utiliza a estatística de F para ANOVA com um fator aplicada ao desvio da mediana absoluta das observações. Portanto, a aplicação do método de Levene é equivalente a aplicar o procedimento de ANOVA com um fator para o desvio da mediana absoluto das observações. Para problemas com 2 amostras, este método também é equivalente a aplicar o procedimento de t para 2 amostras para o desvio da mediana absoluto das observações.

Interpretação

É possível comparar a estatística de teste com valores críticos de distribuição F para determinar se deve rejeitar a hipótese nula. No entanto, o uso do valor-p do teste para fazer a mesma determinação é geralmente mais prático e conveniente.

Para determinar se deve rejeitar a hipótese nula, compare a estatística de teste com seus valores críticos. É possível calcular o valor crítico no Minitab ou encontrar o valor crítico de uma tabela distribuição F na maioria dos livros de estatísticas. Para obter mais informações, acesse Usando a função de distribuição cumulativa inversa (ICDF) e clique em "Usar o ICDF para calcular valores críticos".
  • Para um teste de bilateral, os valores críticos são e . Se a estatística de teste for menor que o primeiro valor ou maior do que o segundo valor, você deve rejeitar a hipótese nula. Se a estatística de teste estiver entre o primeiro e segundo valores, você não deve rejeitar a hipótese nula.
  • Para um teste unilateral com uma hipótese alternativa de "menor que", o valor crítico é . Se a estatística de teste for inferior ao valor crítico, você rejeita a hipótese nula. Caso contrário, você não deve rejeitar a hipótese nula.
  • Para um teste unilateral de "maior que", o valor crítico é . Se a estatística de teste for maior que o valor crítico, você rejeita a hipótese nula. Caso contrário, você não deve rejeitar a hipótese nula.

A estatística de teste é utilizada para calcular o valor-p.

Estatística de teste para o método F

A estatística de teste é uma estatística para testes F que mede a relação entre as variâncias observadas.

Interpretação

É possível comparar a estatística de teste com valores críticos de distribuição F para determinar se deve rejeitar a hipótese nula. No entanto, o uso do valor-p do teste para fazer a mesma determinação é geralmente mais prático e conveniente.

Para determinar se deve rejeitar a hipótese nula, compare o valor observado da estatística de teste (sob a hipótese nula) com o seu valor crítico. É possível calcular o valor crítico no Minitab ou encontrar o valor crítico de uma tabela distribuição F na maioria dos livros de estatísticas. Para obter mais informações, acesse Usando a função de distribuição cumulativa inversa (ICDF) e clique em "Usar o ICDF para calcular valores críticos".
  • Para um teste de bilateral, os valores críticos são e . Se a estatística de teste for menor que o primeiro valor ou maior do que o segundo valor, você deve rejeitar a hipótese nula. Se a estatística de teste estiver entre o primeiro e segundo valores, você não deve rejeitar a hipótese nula.
  • Para um teste unilateral com uma hipótese alternativa de "menor que", o valor crítico é . Se a estatística de teste for inferior ao valor crítico, você rejeita a hipótese nula. Caso contrário, você não deve rejeitar a hipótese nula.
  • Para um teste unilateral de "maior que", o valor crítico é . Se a estatística de teste for maior que o valor crítico, você rejeita a hipótese nula. Caso contrário, você não deve rejeitar a hipótese nula.

A estatística de teste é utilizada para calcular o valor-p.

Valor de p

O valor de p é uma probabilidade que mede a evidência contra a hipótese nula. Um valor de p menor fornece uma evidência mais forte contra a hipótese nula.

Interpretação

Use o valor de p para determinar se a diferença nos desvios padrão ou variâncias da população é estatisticamente significativa.

Para determinar se a diferença entre os desvios padrão ou variâncias da população é estatisticamente significativa, compare o valor de p com o nível de significância.Geralmente, um nível de significância (denotado como α ou alfa) de 0,05 funciona bem. Um nível de significância de 0,05 indica que o risco de se concluir que existe uma diferença, quando, na verdade, não existe nenhuma diferença real, é de 5%.
Valor de p ≤ α: A proporção entre os desvios padrão ou variâncias é estatisticamente significativa (rejeite H0)
Se o valor de p for menor ou igual ao nível de significância, você deve rejeitar a hipótese nula. É possível concluir que a proporção dos desvios padrão ou variâncias da população não é igual à proporção hipotética. Se você não especificar uma proporção hipotética, o Minitab testa se não há nenhuma diferença entre os desvios padrão ou variâncias (Razão hipotética = 1). Use seu conhecimento especializado para determinar se a diferença é praticamente significativa. Para obter mais informações, acesse Significância estatística e prática.
Valor de p > α: A proporção entre os desvios padrão ou variâncias não é estatisticamente significativa (não deve rejeitar H0)
Se o valor de p for maior do que o nível de significância, você não deve rejeitar a hipótese nula. Não há evidências suficientes para concluir que a proporção dos desvios padrão ou variâncias da população é estatisticamente significativa. Certifique-se de que o teste tenha poder suficiente para detectar uma diferença que seja significativa na prática. Para obter mais informações, acesse Poder e tamanho de amostra para 2 variâncias.
Por padrão, o teste com 2 variâncias mostra os valores de p para o método de Levene e método de Bonett. Se você usar o teste para a distribuição normal, o Minitab exibe o valor de p para o teste F. Escolha um teste sobre as propriedades de distribuição dos dados, como a seguir:
  • O teste de Bonnet é preciso para qualquer distribuição contínua e não necessita que os dados sejam normais. Em geral, o teste de Bonett é mais confiável do que o teste de Levene.
  • O teste de Levene, também é preciso com qualquer distribuição contínua. Para distribuições de cauda extremamente assimétrica e pesada, o método de Levene tende a ser mais confiável do que o método de Bonett.
  • O teste F é exato apenas para dados distribuídos normalmente. Qualquer pequeno desvio da normalidade pode causar imprecisões no teste F, mesmo com grandes amostras. No entanto, se os dados estiverem em boa conformidade com a distribuição normal, o teste F normalmente será mais poderoso do que o teste de Bonett ou teste de Levene.

Para obter mais informações, vá para Devo usar o método de Bonett ou o método de Levene para Teste para 2 variâncias ?.

Gráfico de resumo

O gráfico de resumo mostra intervalos de confiança para os intervalos de razão e confiança para os desvios padrão ou variâncias de cada amostra. O gráfico de resumo também mostra boxplots dos dados de amostra e valores de p para os testes de hipóteses.

Intervalos de confiança

O intervalo de confiança fornece um intervalo de valores possíveis para a razão da população. Como as amostras são aleatórias, é improvável que duas amostras de uma população produzam intervalos de confiança idênticos. Porém, se você repetir sua amostra muitas vezes, uma certa porcentagem dos intervalos ou fronteiras de confiança resultantes contém a diferença de população desconhecida. A porcentagem destes intervalos de confiança ou fronteiras que contêm a razão é o nível de confiança do intervalo. Por exemplo, um nível de confiança de 95% indica que, se você extrair 100 amostras aleatórias da população, poderia esperar que, aproximadamente, 95 das amostras produza intervalos que contêm a razão da população.

Uma fronteira superior define um valor provável que a diferença da população seja menor. Uma fronteira inferior define um valor provável que o parâmetro da população seja maior.

Interpretação

O intervalo de confiança ajuda a avaliar a significância prática de seus resultados. Use seu conhecimento especializado para determinar se o intervalo de confiança inclui valores que tenham significância prática para a sua situação. Se o intervalo for muito amplo para ser útil, pense em aumentar o tamanho da amostra. Para obter mais informações, vá para Como obter um intervalo de confiança mais preciso.

Por padrão, o teste de 2 variâncias exibe os resultados para o método de Levene e o método de Bonett. Em geral, o método de Bonett é mais confiável que o método de Levene. No entanto, para distribuições extremamente assimétricas e distribuições com caudas pesadas, o método de Levene é geralmente mais confiável do que o método de Bonett. Use o teste F somente se tiver certeza de que os dados seguem uma distribuição normal. Qualquer pequeno desvio da normalidade pode afetar muito os resultados do teste F. Para obter mais informações, vá para Devo usar o método de Bonett ou o método de Levene para Teste para 2 variâncias ?.

Boxplot

Um boxplot fornece um resumo gráfico da distribuição de cada amostra. O boxplot facilita a comparação da forma, da tendência central e da variabilidade das amostras.

Interpretação

Utilize um boxplot para examinar a dispersão dos dados e identificar todos os outliers potenciais. Os boxplots são melhores quando o tamanho amostral for superior a 20.

Dados Assimétricos

Examine a dispersão de seus dados para determinar se eles parecem ser assimétricos. Quando os dados são assimétricos, a maioria dos dados está localizada no lado alto ou baixo do gráfico. Muitas vezes, é mais fácil detectar a assimetria com um histograma ou boxplot.

Assimétrico à direita
Assimétrico à esquerda

O boxplot com dados assimétricos à direita mostra os tempos de espera. A maioria dos tempos de espera são relativamente curtos e apenas alguns tempos de espera são longos. O boxplot com dados assimétricos à esquerda mostram dados de tempo de falha. Alguns itens falham imediatamente e muitos outros itens falham posteriormente.

Os dados que são extremamente assimétricos podem afetar a validade do valor de p se a sua amostra for pequena (ou se a amostra for inferior a 20 valores). Se seus dados forem extremamente assimétricos e você tiver uma amostra pequena, considere aumentar o tamanho amostral.

Outliers

Outliers, que são valores de dados que estão distantes de outros valores de dados, podem afetar fortemente os resultados de sua análise. Muitas vezes, os outliers são mais fáceis de serem identificados em um boxplot.

Em um boxplot, asteriscos (*) denotam outliers.

Tente identificar a causa de todos os outliers. Corrija todos os erros de entrada de dados ou de medição. Considere a remoção de valores de dados para eventos anormais de ocorrência única (também chamados de causas especiais). Depois, repita a análise. Para obter mais informações, acesse Identificação de outliers.

Gráfico de valores individuais

Um gráfico de valores individuais exibe os valores individuais em cada amostra. Um gráfico de valores individuais facilita a comparação das amostras. Cada círculo representa uma observação. Um gráfico de valores individuais é especialmente útil quando você tem relativamente poucas observações e também precisa avaliar o efeito de cada observação.

Interpretação

Utilize um gráfico de valores individuais para examinar a dispersão dos dados e identificar os outliers potenciais. Os gráficos de valores individuais são melhores quando o tamanho amostral for inferior a 50.

Dados Assimétricos

Examine a dispersão de seus dados para determinar se eles parecem ser assimétricos. Quando os dados são assimétricos, a maioria dos dados está localizada no lado alto ou baixo do gráfico. Muitas vezes, é mais fácil detectar a assimetria com um histograma ou boxplot.

Assimétrico à direita
Assimétrico à esquerda

O gráfico de valores individuais com dados assimétricos à direita mostra os tempos de espera. A maioria dos tempos de espera são relativamente curtos e apenas alguns tempos de espera são longos. O gráfico de valores individuais com dados assimétricos à esquerda mostram dados de tempo de falha. Alguns itens falham imediatamente e muitos outros itens falham posteriormente.

Os dados que são extremamente assimétricos podem afetar a validade do valor de p se a sua amostra for pequena (ou se a amostra for inferior a 20 valores). Se seus dados forem extremamente assimétricos e você tiver uma amostra pequena, considere aumentar o tamanho amostral.

Outliers

Outliers, que são valores de dados que estão distantes de outros valores de dados, podem afetar fortemente os resultados de sua análise. Muitas vezes, os outliers são mais fáceis de serem identificados em um boxplot.

Em um gráfico de valores individuais, os valores de dados anormalmente baixos ou altos indicam possíveis outliers.

Tente identificar a causa de todos os outliers. Corrija todos os erros de entrada de dados ou de medição. Considere a remoção de valores de dados para eventos anormais de ocorrência única (também chamados de causas especiais). Depois, repita a análise. Para obter mais informações, acesse Identificação de outliers.

Histograma

Um histograma divide valores de amostra para muitos intervalos e representa a frequência de valores de dados em cada intervalo com uma barra.

Interpretação

Utilize um histograma para avaliar a forma e a dispersão dos dados. Os histogramas são melhores quando o tamanho amostral for superior a 20.

Dados Assimétricos

Examine a dispersão de seus dados para determinar se eles parecem ser assimétricos. Quando os dados são assimétricos, a maioria dos dados está localizada no lado alto ou baixo do gráfico. Muitas vezes, é mais fácil detectar a assimetria com um histograma ou boxplot.

Assimétrico à direita
Assimétrico à esquerda

O histograma com dados assimétricos à direita mostra os tempos de espera. A maioria dos tempos de espera são relativamente curtos e apenas alguns tempos de espera são longos. O histograma com dados assimétricos à esquerda mostram dados de tempo de falha. Alguns itens falham imediatamente e muitos outros itens falham posteriormente.

Os dados que são extremamente assimétricos podem afetar a validade do valor de p se a sua amostra for pequena (ou se a amostra for inferior a 20 valores). Se seus dados forem extremamente assimétricos e você tiver uma amostra pequena, considere aumentar o tamanho amostral.

Outliers

Outliers, que são valores de dados que estão distantes de outros valores de dados, podem afetar fortemente os resultados de sua análise. Muitas vezes, os outliers são mais fáceis de serem identificados em um boxplot.

Em um histograma, barras isoladas em ambas as extremidades do gráfico identificam possíveis outliers.

Tente identificar a causa de todos os outliers. Corrija todos os erros de entrada de dados ou de medição. Considere a remoção de valores de dados para eventos anormais de ocorrência única (também chamados de causas especiais). Depois, repita a análise. Para obter mais informações, acesse Identificação de outliers.