일원 분산 분석에 대한 주요 결과 해석

일원 분산 분석을 해석하려면 다음 단계를 수행하십시오. 주요 결과에는 p-값, 그룹 그래프, 그룹 비교, R2 및 잔차 그림이 포함됩니다.

1단계: 그룹 평균 간의 차이가 통계적으로 유의한지 여부 확인

평균 간의 차이가 통계적으로 유의한지 여부를 확인하려면 p-값을 유의 수준과 비교하여 귀무 가설을 평가합니다. 귀무 가설은 모집단 평균이 모두 같다는 것입니다. 일반적으로 0.05의 유의 수준(α 또는 알파로 표시됨)이 적절합니다. 0.05의 유의 수준은 실제로 차이가 없는데 차이가 존재한다는 결론을 내릴 위험이 5%라는 것을 나타냅니다.
p-값 ≤ α: 일부 평균 간의 차이가 통계적으로 유의합니다.
p-값이 유의 수준보다 작거나 같으면 귀무 가설을 기각하고 일부 모평균이 같지 않다는 결론을 내립니다. 차이가 실제로 유의한지 여부를 확인하려면 전문 지식을 활용합니다. 자세한 내용을 확인하려면 통계적 유의성 및 실제적 유의성으로 이동하십시오.
p-값 > α: 평균 간의 차이가 통계적으로 유의하지 않습니다.
p-값이 유의 수준보다 크면 모평균이 모두 같다는 귀무 가설을 기각할 수 있는 충분한 증거가 없습니다. 검정에 실제로 유의한 차이를 탐지할 만한 충분한 검정력이 있는지 확인합니다. 자세한 내용은 가설 검정의 검정력 증가에서 확인하십시오.

분산 분석

출처DFAdj SSAdj MSF-값P-값
페인트3281.793.906.020.004
오차20312.115.60   
총계23593.8     
주요 결과: p-값

이 결과에서 귀무 가설은 서로 다른 4가지 페인트의 평균 경도 값이 같다는 것입니다. p-값이 유의 수준 0.05보다 작기 때문에 귀무 가설을 기각하고 일부 페인트의 평균이 다르다고 결론을 내릴 수 있습니다.

2단계: 그룹 평균 조사

각 그룹의 평균과 신뢰 구간을 표시하려면 구간 그림을 사용합니다.

구간 그림은 다음 사항을 보여줍니다.
  • 각 점은 표본 평균을 나타냅니다.
  • 각 구간은 그룹 평균에 대한 95% 신뢰 구간입니다. 그룹 평균이 그룹의 신뢰 구간 내에 있다고 95% 신뢰할 수 있습니다.
중요

다중 비교 시 제1종 오류율이 증가하므로 이러한 구간을 신중하게 해석해야 합니다. 즉, 비교 수를 늘리면 하나 이상의 비교에서 관측된 차이 중 하나가 유의하게 다르다는 잘못된 결론을 내릴 확률도 증가합니다.

이 그림에 표시되는 차이를 평가하려면 그룹화 정보 표 및 (3단계에 표시된) 기타 비교 출력을 사용하십시오.

구간 그림에서 혼합 2의 평균이 가장 작고 혼합 4의 평균이 가장 큽니다. 이 그래프에서는 차이가 통계적으로 유의한지 여부를 확인할 수 없습니다. 통계적 유의성을 평가하려면 차이 평균에 대한 신뢰 구간을 사용하십시오.

3단계: 그룹 평균 비교

일원 분산 분석 p-값이 유의 수준보다 작으면 일부 그룹 평균이 서로 다르다는 것을 알 수 있지만 어떤 그룹 쌍이 다른 지는 알 수 없습니다. 특정 그룹 쌍 간의 평균 차이가 통계적으로 유의한지 여부를 확인하고 서로 얼마나 다른지 추정하려면 평균 차이에 대한 그룹화 정보 표와 검정을 사용하십시오.

비교 방법에 대한 자세한 내용은 다중 비교를 사용하여 실제 및 통계적 유의성 평가에서 확인하십시오.

그룹화 정보 표

그룹 쌍 간의 평균 차이가 통계적으로 유의한지 여부를 신속하게 확인하려면 그룹화 정보 표를 사용합니다.

문자를 공유하지 않는 그룹은 유의하게 서로 다릅니다.

평균 차이에 대한 검정

차이가 포함될 가능성이 있는 범위를 파악하고 차이가 실제로 유의한지 여부를 확인하려면 신뢰 구간을 사용합니다. 표에는 평균 쌍 간의 차이에 대한 신뢰 구간의 집합이 표시됩니다. 평균 차이에 대한 구간 그림에는 동일한 정보가 표시됩니다.

신뢰 구간에 0이 포함되지 않으면 평균 차이가 통계적으로 유의하다는 것을 나타냅니다.

표에서는 선택한 비교 방법에 따라 여러 그룹 쌍을 비교하고 다음과 같은 유형의 신뢰 구간 중 하나를 표시합니다.
  • 개별 신뢰 수준

    연구를 여러 번 반복하는 경우 단일 신뢰 구간이 한 그룹 평균 쌍 간의 실제 차이를 포함할 횟수의 백분율입니다.

  • 동시 신뢰 수준

    연구를 여러 번 반복하는 경우 신뢰 구간 집합에 모든 그룹 비교에 대한 실제 차이가 포함될 시간의 백분율입니다.

    여러 비교를 수행하는 경우 동시 신뢰 수준을 제어하는 것이 특히 중요합니다. 동시 신뢰 수준을 제어하지 않을 경우, 비교 수가 증가하면 하나 이상의 신뢰 구간에 실제 차이가 포함되지 않을 확률이 증가합니다.

자세한 내용은 다중 비교의 개별 및 동시 신뢰 구간 이해에서 확인하십시오.

Hsu의 MCB의 결과를 해석하는 방법에 대한 자세한 내용은 Hsu의 MCB(최량과의 다중 비교) 정의에서 확인하십시오.

Tukey의 방법 및 95% 신뢰 구간을 사용한 그룹화 정보

페인트N평균그룹화
혼합 4618.07A 
혼합 1614.73AB
혼합 3612.98AB
혼합 268.57  B
문자를 공유하지 않는 평균들은 유의하게 서로 다릅니다.
주요 결과: 평균, 그룹화

이 결과에서 표는 그룹 A에 혼합 1, 3, 4가 포함되어 있고 그룹 B에 혼합 1, 2, 3이 포함되어 있다는 것을 보여주는데, 혼합 1과 3은 두 그룹에 모두 포함되어 있습니다. 문자를 공유하는 평균 간의 차이는 통계적으로 유의하지 않습니다. 혼합 2와 4는 문자를 공유하지 않으므로, 혼합 4의 평균이 혼합 2보다 유의하게 높다는 것을 나타냅니다.

평균의 차이에 대한 Tukey 동시 검정

수준의 차이평균의 차이차이의 표준 오차95% CIT-값수정된 P-값
혼합 2 - 혼합 1-6.172.28(-12.55, 0.22)-2.700.061
혼합 3 - 혼합 1-1.752.28(-8.14, 4.64)-0.770.868
혼합 4 - 혼합 13.332.28(-3.05, 9.72)1.460.478
혼합 3 - 혼합 24.422.28(-1.97, 10.80)1.940.245
혼합 4 - 혼합 29.502.28(3.11, 15.89)4.170.002
혼합 4 - 혼합 35.082.28(-1.30, 11.47)2.230.150
개별 신뢰 수준 = 98.89%
주요 결과: 동시 95% CI, 개별 신뢰 수준

Tukey 결과에서 신뢰 구간은 다음 사항을 나타냅니다.
  • 혼합 2와 4의 평균 간의 차이에 대한 신뢰 구간은 3.11에서 15.89까지입니다. 이 범위에는 0이 포함되지 않으므로 차이가 통계적으로 유의합니다.
  • 나머지 평균 쌍에 대한 신뢰 구간에는 모두 0이 포함되므로, 차이가 통계적으로 유의하지 않습니다.
  • 95% 동시 신뢰 수준은 모든 신뢰 구간에 실제 차이가 포함된다고 95% 신뢰할 수 있다는 것을 나타냅니다.
  • 표에서는 개별 신뢰 수준이 98.89%라는 것을 나타냅니다. 이 결과는 각 개별 구간에 특정 그룹 평균 쌍 간의 실제 차이가 포함된다고 98.89% 신뢰할 수 있다는 것을 나타냅니다. 각 비교에 대한 개별 신뢰 수준이 모든 6개 비교에 대한 95% 동시 신뢰 수준을 생성합니다.

4단계: 모형이 데이터를 얼마나 잘 적합시키는지 확인

모형이 데이터를 얼마나 잘 적합시키는지 확인하려면 모형 요약 표의 적합도 통계량을 조사합니다.

S
S는 모형이 반응을 얼마나 잘 설명하는지 평가하기 위해 사용합니다.

S는 반응 변수 단위로 측정되며, 데이터 값이 적합치로부터 얼마나 떨어져 있는지 나타냅니다. S의 값이 낮을수록 모형이 반응을 더 잘 설명합니다. 그러나 낮은 S 값 자체는 모형이 모형 가정을 충족한다는 것을 나타내지 않습니다. 가정을 확인하려면 잔차 그림을 확인해야 합니다.

R-제곱

R2은 모형에 의해 설명되는 반응 내 변동의 백분율입니다. R2 값이 클수록 모형이 데이터를 더 잘 적합시킵니다. R2은 항상 0%에서 100% 사이입니다.

높은 R2 값은 모형이 모형의 가정을 충족한다는 것을 나타내지 않습니다. 가정을 확인하려면 잔차 그림을 확인해야 합니다.

R-제곱(예측)

모형의 새 관측치에 대한 반응을 얼마나 잘 예측하는지 확인하려면 예측 R2을 사용합니다.모형의 예측 R2 값이 클수록 예측 능력이 더 좋습니다.

예측 R2이 R2보다 상당히 작으면 모형이 과다 적합하다는 것을 나타낼 수도 있습니다. 모집단에서 중요하지 않은 효과에 대한 항을 추가할 경우 과다 적합 모형이 발생할 수 있습니다. 모형이 표본 데이터에 따라 조정되므로, 모집단에 대해 예측 시 유용하지 않을 수도 있습니다.

예측 R2은 또한 모형 계산에 포함되지 않은 관측치를 사용하여 계산되므로, 모형을 비교할 때 수정 R2보다 유용할 수 있습니다.

모형 요약

SR-제곱R-제곱(수정)R-제곱(예측)
3.9501247.44%39.56%24.32%
주요 결과: S, R-제곱, R-제곱(예측)

이 결과에서는 요인이 반응에 있는 변동의 47.44%를 설명합니다. S는 데이터 점과 적합치 간의 표준 편차가 약 3.95단위라는 것을 나타냅니다.

5단계: 모형이 분석의 가정을 충족하는지 여부 확인

모형이 적절하고 분석의 가정을 충족하는지 여부를 확인하려면 잔차 그림을 사용합니다. 가정이 충족되지 않으면 모형이 데이터에 적합하지 않은 것이므로 결과를 해석할 때 주의해야 합니다.

잔차 대 적합치 그림

잔차가 랜덤하게 분포되어 있고 잔차의 분산이 일정하다는 가정을 확인하려면 잔차 대 적합치 그림을 사용하십시오. 이상적으로는 점들이 식별 가능한 패턴 없이 0의 양쪽에 랜덤하게 분포해야 합니다.

다음 표의 패턴들은 모형이 모형 가설을 충족하지 않음을 나타낼 수 있습니다.
패턴 패턴이 나타내는 내용
적합치에 대해 잔차가 부채꼴 모양으로 흩어져 있거나 고르지 않게 퍼져 있음 일정하지 않은 분산
한 점이 0에서 멀리 떨어져 있음 특이치
이 잔차 대 적합치 그림에서는 점들이 랜덤하게 흩어져 있는 것으로 보입니다. 어느 그룹의 변동성도 크게 다르지 않으며 눈에 띄는 특이치가 없는 것으로 보입니다.

잔차 대 순서 그림

잔차가 서로 독립적이라는 가정을 확인하려면 잔차 대 순서 그림을 사용하십시오. 독립 잔차는 시간순으로 표시될 때 아무런 추세나 패턴을 보이지 않습니다. 점들의 패턴은 서로 가까이 있는 잔차가 상관되어 있으며, 따라서 독립적이 아닐 수도 있음을 나타냅니다. 이상적으로는 그림의 잔차들이 중심선 주위에 랜덤하게 분포해야 합니다.
패턴이 있으면 원인을 조사하십시오. 다음 유형의 패턴은 잔차가 종속적이라는 것을 나타낼 수도 있습니다.
추세
이동
주기
이 잔차 대 순서 그림에서는 잔차가 중심선 주위에 랜덤하게 위치합니다.

잔차 정규 확률도

잔차가 정규 분포를 따른다는 가정을 확인하려면 잔차의 정규 확률도를 사용하십시오. 잔차의 정규 확률도는 대략 직선을 따라야 합니다.

다음 표의 패턴들은 모형이 모형 가설을 충족하지 않음을 나타낼 수 있습니다.
패턴 패턴이 나타내는 내용
직선이 아님 비정규성
선에서 멀리 떨어져 있는 점 특이치
기울기 변화 식별되지 않은 변수
참고

일원 분산 분석 설계가 표본 크기에 대한 지침을 충족하면 정규성에서 벗어나도 결과가 크게 영향을 받지 않습니다.

이 정규 확률도에서는 잔차가 대략 직선을 이루는 것으로 보입니다. 잔차 대 적합치 그림에서 네 그룹 각각에 여섯 개의 관측치가 있다는 것을 알 수 있습니다. 이 설계는 표본 크기 지침을 충족하지 않기 때문에 검정 결과를 신뢰할 수 있도록 정규성 가정을 충족하는 것이 중요합니다.