상자 그림에 대한 주요 결과 해석

상자 그림을 해석하려면 다음 단계를 수행하십시오.

1단계: 주요 특성 평가

분포의 중심과 산포를 조사합니다. 표본 크기가 상자 그림의 모양에 어떻게 영향을 미칠 수 있는지 평가합니다.

중심 및 산포

표본 데이터의 중심과 산포에 대해 자세히 알아보려면 다음과 같은 요소를 조사합니다.
중위수
중위수는 상자의 선으로 표시됩니다. 중위수는 데이터 중심의 일반적인 측도입니다. 관측치의 절반은 이 값보다 작거나 같고 절반은 이 값보다 크거나 같습니다.
사분위간 범위 상자
사분위간 범위 상자는 데이터의 중간 50%를 나타내며, 제1 사분위수와 제3 사분위수 간 거리(Q3-Q1)를 표시합니다.
수염
수염은 상자의 양쪽에서 연결됩니다. 수염은 특이치를 제외하고, 데이터 값의 하위 25%와 상위 25%의 범위를 나타냅니다.

이 통계량을 보여주는 도구 팁을 표시하려면 상자 그림 위에 포인터를 놓습니다. 예를 들어, 이 휴식기 심박수 상자 그림은 심박수의 중위수가 71이라는 것을 보여줍니다. 대부분의 피실험자의 휴식기 심박수는 64와 80 사이이지만, 일부 피실험자의 심박수는 최저 48, 최대 100입니다.

상자 그림의 갑작스럽거나 바람직하지 않은 특성을 조사합니다. 예를 들어, 상자 그림이 나무 판자 길이의 중위수가 목표 길이 8피트보다 훨씬 더 작다는 것을 보여줄 수 있습니다.

참고

상자 그림의 사분위수는 계산된 값이기 때문에 데이터 집합의 실제 관측치가 아닐 수도 있습니다. 사분위수를 해석하는 방법에 대한 자세한 내용은 사분위수의 정의에서 확인하십시오. 사분위수 계산 방법에 대한 자세한 내용을 확인하려면 그래픽 요약 방법 및 공식으로 이동하십시오.

표본 크기(n)

표본 크기가 그래프 모양에 영향을 미칠 수 있습니다.

예를 들어, 이러한 상자 그림은 서로 아주 다르게 보이지만, 둘 다 동일한 모집단에서 랜덤하게 선택된 데이터 표본을 사용하여 생성되었습니다.
n = 15
n = 500

상자 그림은 표본 크기가 20 이상일 때 가장 잘 작동합니다. 표본 크기가 너무 작으면 상자 그림에 의해 표시되는 사분위수 및 특이치가 유의하지 않을 수도 있습니다. 표본 크기가 20보다 작으면 개별 값 그림을 대신 사용해 보십시오.

2단계: 비정규 또는 비정상 데이터의 지시자 확인

치우친 데이터는 데이터가 비정규 데이터일 수도 있다는 것을 나타냅니다. 특이치는 데이터의 다른 조건을 나타낼 수도 있습니다.

치우친 데이터

데이터가 치우쳐 있으면 대부분의 데이터가 그래프의 높은 쪽이나 낮은 쪽에 위치합니다. 왜도는 데이터가 정규 분포를 따르지 않을 수도 있음을 나타냅니다.

이 상자 그림은 치우친 데이터를 보여줍니다. 오른쪽으로 치우친 데이터의 상자 그림은 대기 시간을 보여줍니다. 대부분의 대기 시간이 비교적 짧고 몇 개의 대기 시간만 깁니다. 왼쪽으로 치우친 데이터의 상자 그림은 수명 데이터를 보여줍니다. 몇 개의 품목이 즉시 고장나고 더 많은 품목이 나중에 고장납니다.

오른쪽으로 치우침
왼쪽으로 치우침

데이터가 자연스럽게 치우쳐 있지 않다는 것을 알고 있으면 가능한 원인을 조사하십시오. 심하게 치우친 데이터를 분석하려면 분석에 대한 데이터 고려 사항을 읽어보고 정규 분포를 따르지 않는 데이터를 사용할 수 있는지 확인하십시오.

특이치

다른 데이터 값에서 멀리 떨어져 있는 데이터 값인 특이치는 결과에 크게 영향을 미칠 수 있습니다. 일반적으로 상자 그림에서 특이치를 식별하기가 가장 쉽습니다.

상자 그림에서 특이치는 별표(*)로 표시됩니다.

데이터 점을 식별하려면 특이치 위에 포인터를 놓으십시오.

특이치의 원인을 식별해 보십시오. 모든 데이터 입력 또는 측정 오류를 수정하십시오. 비정상적인 일회성 사건과 연관된 데이터 값을 삭제해 보십시오(특수 원인). 그런 다음 분석을 반복하십시오.

3단계: 그룹 평가 및 비교

상자 그림에 그룹이 있으면 그룹의 중심과 산포를 평가하고 비교합니다.

중심

그룹의 중심 간 차이를 확인합니다.

예를 들어, 이 상자 그림은 네 군데의 공급업체에서 생산된 전선의 두께를 보여줍니다. 일부 그룹에 대한 두께의 중위수가 서로 다른 것으로 보입니다.

산포

그룹의 산포 간 차이를 확인합니다.

예를 들어, 이 상자 그림은 네 개의 생산 라인에서 생산된 시리얼 상자의 충전 무게를 보여줍니다. 시리얼 상자 그룹의 무게 중위수는 비슷하지만 일부 그룹의 무게가 다른 그룹보다 변동성이 더 큽니다.
산포(분산)의 차이가 통계적으로 유의한지 여부를 확인하려면 다음 작업 중 하나를 수행하십시오.