그래픽 요약에 대한 주요 결과 해석

그래픽 요약을 해석하려면 다음 단계를 수행하십시오. 주요 결과에는 p-값, 평균, 중위수, 신뢰 구간 및 여러 그래프가 포함됩니다.

1단계: 데이터의 중심 설명

데이터 중심을 나타내는 하나의 값으로 표본을 설명하려면 평균을 사용하십시오. 많은 통계 분석에서 평균을 데이터의 분포 중심에 대한 표준 측도로 사용합니다.

중위수는 데이터의 분포 중심에 대한 또 하나의 측도입니다. 중위수는 일반적으로 평균보다 특이치의 영향을 덜 받습니다. 데이터 값의 반은 중위수 값보다 크고, 데이터 값의 반은 중위수 값보다 작습니다.

중위수와 평균 모두 중심 위치를 측정합니다. 그러나 특이치라고 하는 비정상적인 값은 평균보다 중위수에 덜 영향을 미칠 수 있습니다. 데이터가 대칭인 경우 평균과 중위수가 유사합니다.

신뢰 구간은 모집단 모수가 될 수 있는 값의 범위를 제공합니다. 예를 들어, 95% 신뢰 수준은 모집단에서 100개의 랜덤 표본을 추출할 경우 약 95개의 표본이 모집단 모수가 포함된 구간을 생성할 것으로 예상된다는 것을 나타냅니다.

데이터의 모양과 산포를 평가하고 잠재적 특이치를 식별하려면 히스토그램과 상자 그림을 사용합니다.

데이터가 치우쳐 있으면 대부분의 데이터가 그래프의 높은 쪽이나 낮은 쪽에 위치합니다. 일반적으로 히스토그램이나 상자 그림에서 왜도를 탐지하기가 가장 쉽습니다.

다른 데이터 값에서 멀리 떨어져 있는 데이터 값인 특이치는 분석 결과에 크게 영향을 미칠 수 있습니다. 일반적으로 상자 그림에서 특이치를 식별하기가 가장 쉽습니다.

특이치의 원인을 식별합니다. 모든 데이터 입력 오류 또는 측정 오류를 수정합니다. 비정상적인 일회성 사건에 대한 데이터 값을 삭제합니다(특수 원인이라고도 함). 그런 다음 분석을 반복합니다. 자세한 내용은 특이치 식별에서 확인하십시오.