특이치 검정에 대한 모든 통계량 및 그래프 해석

특이치 검정과 함께 제공되는 모든 통계 및 그래프에 대한 정의 및 해석 방법을 확인해 보십시오.

귀무 가설과 대립 가설

귀무 가설과 대립 가설은 모집단에 대한 서로 배타적인 두 서술문입니다. 가설 검정은 표본 데이터를 사용하여 귀무 가설의 기각 여부를 확인합니다.
귀무 가설
귀무 가설은 모든 데이터 값이 동일한 정규 분포를 따른다는 것입니다.
대립 가설
대립 가설은 가장 작은 데이터 값 또는 가장 큰 데이터 값이 특이치라는 것입니다.

유의 수준

유의 수준(α 또는 알파로 표시됨)은 귀무 가설이 참일 때 귀무 가설을 기각할 위험(제1종 오류)의 최대 허용 수준입니다. 기본값은 0.05입니다.

해석

귀무 가설(H0)을 기각할지 여부를 결정하려면 유의 수준을 사용합니다. 사건이 발생하는 확률이 유의 수준보다 작은 경우 일반적으로 결과가 통계적으로 유의하다고 해석하고 H0을 기각합니다.

일반적으로 0.05의 유의 수준(α 또는 알파로 표시함)이 적절합니다. 0.05의 유의 수준은 실제로 차이가 없는데 차이가 존재한다는 결론을 내릴 위험이 5%라는 것을 나타냅니다.
  • 존재할 가능성이 있는 차이를 더 확실히 탐지하려면 더 높은 유의 수준(예: 0.10)을 선택하십시오. 예를 들어, 한 품질 엔지니어가 새 볼 베어링의 안정성을 현재 베어링의 안정성과 비교합니다. 불안정한 볼 베어링이 심각한 문제를 일으킬 수 있기 때문에 엔지니어는 새 볼 베어링이 안정적이라는 것을 확인해야 합니다. 엔지니어는 볼 베어링 안정성의 가능한 차이를 더 확실히 탐지하기 위해 0.10의 유의 수준을 선택합니다.
  • 실제로 존재하는 차이만 더 확실히 탐지하려면 더 낮은 유의 수준(예: 0.01)을 선택하십시오. 예를 들어, 한 제약 회사의 과학자는 회사의 새 약품이 증상을 유의하게 완화시킨다는 주장이 참이라는 것을 확인해야 합니다. 과학자는 증상에 유의한 차이가 존재하지 않는다는 것을 더 확실히 확인하기 위해 0.001의 유의 수준을 선택합니다.

N

표본 크기(N)는 표본의 총 관측치 수입니다.

해석

표본 크기는 검정의 검정력에 영향을 미칩니다.

일반적으로 표본 크기가 클수록 특이치를 탐지하기 위한 검정력이 더 높습니다. 자세한 내용은 검정력의 정의에서 확인하십시오.

평균

평균은 모든 관측치의 합을 관측치 수로 나눈 데이터의 평균입니다.

예를 들어, 한 은행에서 고객 다섯 명의 대기 시간이 3, 2, 4, 1, 2분입니다. 평균 대기 시간은 다음과 같이 계산됩니다.
고객은 이 은행에서 업무를 보기 위해 평균 2.4분을 기다립니다.

해석

데이터 중심을 나타내는 하나의 값으로 표본을 설명하려면 평균을 사용하십시오. 많은 통계 분석에서 평균을 데이터의 분포 중심에 대한 표준 측도로 사용합니다.

중위수와 평균 모두 중심 위치를 측정합니다. 그러나 특이치라고 하는 비정상적인 값은 평균보다 중위수에 덜 영향을 미칠 수 있습니다. 데이터가 대칭인 경우 평균과 중위수가 유사합니다.
대칭
비대칭

대칭 분포의 경우 평균(파란색 선)과 중위수(주황색 선)가 너무 비슷하여 두 선을 모두 쉽게 볼 수 없습니다. 그러나 비대칭 분포는 오른쪽으로 치우칩니다.

표준 편차

표준 편차는 산포, 즉 데이터가 평균을 중심으로 퍼져 있는 정도를 나타내는 가장 일반적인 측도입니다. 모집단의 표준 편차를 나타내는 데는 σ(시그마) 기호를 자주 사용하는 반면, 표본의 표준 편차를 사용하는 데는 s를 사용합니다. 랜덤이 아니거나 공정에 자연스럽지 못한 변동은 종종 잡음이라고 합니다.

표준 편차는 데이터와 단위가 같기 때문에 일반적으로 분산보다 더 쉽게 해석할 수 있습니다.

해석

데이터가 평균을 중심으로 퍼져 있는 정도를 확인하려면 표준 편차를 사용합니다. 표준 편차 값이 클수록 데이터가 더 퍼져 있다는 것을 나타냅니다. 정규 분포에 대한 일반 규칙은 대략 68%의 값이 평균으로부터 1 표준 편차 거리 내에 있고, 95%의 값이 2 표준 편차 거리 내에 있고, 99.7%의 값이 3 표준 편차 거리 내에 있다는 것입니다.

또한 공정의 전체 변동을 추정하기 위한 벤치마크를 설정하기 위해 표준 편차를 사용할 수 있습니다.
병원 1
병원 2
병원 퇴원 시간

관리자들이 두 개 병원의 응급실 부서에서 치료한 환자의 퇴원 시간을 추적하고자 합니다. 평균 퇴원 시간은 동일하지만(35분) 표준 편차는 유의하게 다릅니다. 병원 1의 표준 편차가 약 6이며, 평균적으로 환자의 퇴원 시간은 평균(대시선)에서 약 6분 정도 멀어집니다. 병원 2의 표준 편차는 약 20입니다. 평균적으로 환자의 퇴원 시간은 평균(대시선)에서 약 20분 정도 멀어집니다.

최대값

최대값은 가장 큰 데이터 값입니다.

이 데이터에서 최대값은 19입니다.

13 17 18 19 12 10 7 9 14

해석

가능한 특이치 또는 데이터 입력 오류를 식별하려면 최대값을 사용합니다. 데이터의 산포를 평가하는 가장 간단한 방법은 최소값과 최대값을 비교하는 것입니다. 최대값이 아주 큰 경우에는 데이터의 중심, 산포, 모양 외에 극단값의 원인도 조사하십시오.

최소값

최소값은 가장 작은 데이터 값입니다.

이 데이터에서 최소값은 7입니다.

13 17 18 19 12 10 7 9 14

해석

가능한 특이치 또는 데이터 입력 오류를 식별하려면 최소값을 사용합니다. 데이터의 산포를 평가하는 가장 간단한 방법은 최소값과 최대값을 비교하는 것입니다. 최소값이 아주 작은 경우에는 데이터의 중심, 산포, 모양 외에 극단값의 원인도 조사하십시오.

특이치

특이치는 비정상적으로 크거나 작은 관측치입니다. 특이치의 원인을 식별합니다. 모든 데이터 입력 오류 또는 측정 오류를 수정합니다. 비정상적인 일회성 사건에 대한 데이터 값을 삭제합니다(특수 원인이라고도 함).

워크시트에서 특이치가 포함된 행. Minitab에서는 특이치가 존재하는 경우에만 이 값을 표시합니다.

x[i] 및 x[N-i]

Dixon의 비율 검정 중 하나를 사용하는 경우 Minitab에서는 검정 표에 최소값과 최대값 외에 추가 관측치를 표시합니다. 대괄호 안의 값은 다른 값에 상대적인 관측치의 크기를 나타냅니다. 예를 들어, x[2]는 두번째로 작은 관측치를 나타내고 x[N-1]은 두번째로 큰 관측치를 나타냅니다.

G

Grubbs의 검정 통계량(G)은 표본 평균과 가장 작은 데이터 값 또는 가장 큰 데이터 값의 차이를 표준 편차로 나눈 값입니다. Minitab에서는 Grubbs의 검정 통계량을 사용하여 귀무 가설이 참일 때 귀무 가설을 기각할 확률 p-값을 계산합니다.

P

p-값은 귀무 가설에 반하는 증거를 측정하는 확률입니다. p-값이 작을수록 귀무 가설에 반하는 더 강력한 증거가 됩니다.

해석

특이치의 존재 여부를 확인하려면 p-값을 사용하십시오.

특이치가 존재하는지 여부를 확인하려면 p-값을 유의 수준과 비교하십시오. 일반적으로 0.05의 유의 수준(α 또는 알파로 표시함)이 적절합니다. 0.05의 유의 수준은 실제로 특이치가 존재하지 않는데 특이치가 존재한다는 결론을 내릴 위험이 5%라는 것을 나타냅니다.
p-값 ≤ α: 특이치가 존재함(H0 기각)
p-값이 유의 수준보다 작거나 같으면 귀무 가설을 기각하고 특이치가 존재한다는 결론을 내립니다. 특이치의 원인을 식별해 보십시오. 모든 데이터 입력 오류 또는 측정 오류를 수정하십시오. 비정상적인 일회성 사건과 연관된 데이터 값을 삭제해 보십시오(특수 원인).
p-값 > α: 특이치가 존재한다는 결론을 내릴 수 없음(H0 기각 실패)
p-값이 유의 수준보다 크면 특이치가 존재한다는 결론을 내릴 충분한 증거가 없기 때문에 귀무 가설을 기각할 수 없습니다. 검정에 특이치를 탐지하기에 충분한 검정력이 있는지 확인해야 합니다. 자세한 내용은 검정력 증대에서 확인하십시오.

특이치 그림

특이치 그림은 개별 그림입니다. 데이터의 특이치를 식별하려면 특이치 그림을 사용합니다. 특이치가 존재하면 Minitab에서는 그림에서 빨간색 정사각형으로 표시합니다. 특이치의 원인을 식별합니다. 모든 데이터 입력 오류 또는 측정 오류를 수정합니다. 비정상적인 일회성 사건에 대한 데이터 값을 삭제합니다(특수 원인이라고도 함).

이 결과에서 가장 작은 값인 12.38은 특이치입니다.