일원 분산 분석에 대한 데이터 그림

모든 데이터 그림에 대한 정의 및 해석 방법을 확인해 보십시오.

상자 그림

상자 그림은 각 표본 분포의 그래픽 요약을 제공합니다. 상자 그림을 사용하면 표본의 모양, 중심 위치 및 변동성을 쉽게 비교할 수 있습니다.

해석

데이터의 산포를 평가하고 잠재적 특이치를 식별하려면 상자 그림을 사용합니다. 상자 그림은 표본 크기가 20보다 클 때 가장 적합합니다.

치우친 데이터

데이터가 치우쳐 있는 것으로 보이는지 여부를 확인하려면 데이터의 산포를 조사합니다. 데이터가 치우쳐 있으면 대부분의 데이터가 그래프의 높은 쪽이나 낮은 쪽에 위치합니다. 치우친 데이터는 데이터가 정규 분포를 따르지 않을 수도 있음을 나타냅니다. 일반적으로 개별 값 그림, 히스토그램 또는 상자 그림에서 왜도를 탐지하기가 가장 쉽습니다.

오른쪽으로 치우침
왼쪽으로 치우침

오른쪽으로 치우친 데이터의 상자 그림은 평균 대기 시간을 보여줍니다. 대부분의 대기 시간이 비교적 짧고 몇 개의 대기 시간만 더 깁니다. 왼쪽으로 치우친 데이터의 상자 그림은 고장률 데이터를 보여줍니다. 몇 개의 품목이 즉시 고장나고 더 많은 품목이 나중에 고장납니다.

심하게 치우친 데이터는 표본이 작은 경우(20보다 작은 값) p-값의 유효성에 영향을 미칠 수 있습니다. 데이터가 심하게 치우쳐 있고 표본이 작은 경우 표본 크기를 늘리는 것을 고려해 보십시오.

특이치

다른 데이터 값에서 멀리 떨어져 있는 데이터 값인 특이치는 결과에 크게 영향을 미칠 수 있습니다. 일반적으로 상자 그림에서 특이치를 식별하기가 가장 쉽습니다.

상자 그림에서는 별표(*)가 특이치를 나타냅니다.

특이치의 원인을 식별해 보십시오. 모든 데이터 입력 또는 측정 오류를 수정하십시오. 비정상적인 일회성 사건에 대한 데이터 값을 삭제하십시오(특수 원인). 그런 다음 분석을 반복하십시오.

개별 값 그림

개별 값 그림은 각 표본 내 개별 값을 표시합니다. 개별 값 그림을 사용하면 표본을 쉽게 비교할 수 있습니다. 각 원은 하나의 관측치를 나타냅니다. 개별 값 그림은 표본 크기가 작을 때 특히 유용합니다.

해석

데이터의 산포를 평가하고 잠재적 특이치를 식별하려면 개별 값 그림을 사용합니다. 개별 값 그림은 표본 크기가 50보다 작을 때 가장 적합합니다.

치우친 데이터

데이터가 치우쳐 있는 것으로 보이는지 여부를 확인하려면 데이터의 산포를 조사합니다. 데이터가 치우쳐 있으면 대부분의 데이터가 그래프의 높은 쪽이나 낮은 쪽에 위치합니다. 치우친 데이터는 데이터가 정규 분포를 따르지 않을 수도 있음을 나타냅니다. 일반적으로 개별 값 그림, 히스토그램 또는 상자 그림에서 왜도를 탐지하기가 가장 쉽습니다.

오른쪽으로 치우침
왼쪽으로 치우침

오른쪽으로 치우친 데이터의 개별 값 그림은 대기 시간을 보여줍니다. 대부분의 대기 시간이 비교적 짧고 몇 개의 대기 시간만 더 깁니다. 왼쪽으로 치우친 데이터의 개별 값 그림은 수명 데이터를 보여줍니다. 몇 개의 품목이 즉시 고장나고 더 많은 품목이 나중에 고장납니다.

특이치

다른 데이터 값에서 멀리 떨어져 있는 데이터 값인 특이치는 결과에 크게 영향을 미칠 수 있습니다. 일반적으로 개별 값 그림에서 특이치를 식별하기가 쉽습니다.

개별 값 그림에서는 비정상적으로 낮거나 높은 데이터 값이 가능한 특이치를 나타냅니다.

특이치의 원인을 식별해 보십시오. 모든 데이터 입력 또는 측정 오류를 수정하십시오. 비정상적인 일회성 사건에 대한 데이터 값을 삭제하십시오(특수 원인). 그런 다음 분석을 반복하십시오.

구간 그림

각 그룹의 평균과 신뢰 구간을 표시하려면 구간 그림을 사용합니다.

구간 그림은 다음 사항을 보여줍니다.
  • 각 점은 표본 평균을 나타냅니다.
  • 각 구간은 그룹의 평균에 대한 95% 개별 신뢰 구간입니다. 그룹 평균이 그룹의 신뢰 구간 내에 있다고 95% 신뢰할 수 있습니다.
중요

다중 비교 시 제1종 오류율이 증가하므로 이러한 구간은 신중하게 해석해야 합니다. 즉, 더 많이 비교할수록 하나 이상의 비교에서 관측된 차이 중 하나가 유의하게 다르다는 잘못된 결론을 내릴 확률이 높습니다.

해석

이 결과에서 혼합 2의 평균이 가장 작고 혼합 4의 평균이 가장 큽니다. 이 그래프에서는 차이가 통계적으로 유의한지 여부를 확인할 수 없습니다. 통계적 유의성을 평가하려면 차이의 평균에 대한 신뢰 구간을 사용하십시오.