특이치 검정에 대한 방법 및 공식

원하는 방법 또는 공식을 선택하십시오.

Dixon의 검정 통계량

Dixon의 검정 통계량은 표본의 최극단값이 특이치인지 여부를 결정합니다. Dixon의 검정에는 표본 내 다른 극단값의 잠재적인 마스크 효과를 해결하기 위한 검정 통계량이 포함됩니다. Dixon의 검정 통계량은 rij로 표시되며, 여기서 첨자 ij는 다음을 나타냅니다.
  • i는 의심스러운 특이치 데이터 쪽(위쪽 또는 아래쪽)에 있는 극단값의 수를 나타냅니다. i = 1 또는 2입니다.
  • j는 데이터의 반대쪽에 있는 극단값의 수를 나타냅니다. j = 0, 1, 2입니다.

예를 들어, 의심스러운 특이치가 표본의 가장 작은 값이지만 비상정적으로 큰 값 두 개도 표본에 포함되어 있는 경우 r12가 적절한 검정 통계량입니다. r10(Dixon의 Q라고도 함)은 표본에 하나의 극단값만 포함되어 있는 경우 적절한 검정 통계량입니다.

Dixon의 검정 통계량에 대한 임계값은 Rorabacher(1991)에 표로 정리되어 있습니다.

단측 검정 통계량

단측 검정을 위한 공식은 가장 작은 값 yi를 검정하는지 또는 가장 큰 값 yn을 검정하는 지에 따라 다릅니다. yi가 특이치인지 여부를 검정하려면 다음 공식을 사용하십시오.
yn이 특이치인지 여부를 검정하려면 다음 공식을 사용하십시오.

양측 검정 통계량

Minitab에서는 King(1953)이 r10과 관련된 양측 검정 통계량을 정의한 것처럼 양측 검정 통계량을 정의합니다. 양측 검정 통계량은 다음과 같이 계산됩니다.

표기법

용어설명
rijDixon의 검정 통계량(i = 1, 2; j = 0, 1, 2)
yi표본에서 i번째로 작은 값
n표본의 관측치 수

참고 문헌

  • D.B. Rorabacher (1991). "Statistical Treatment for Rejection of Deviant Values: Critical Values of Dixon Q Parameter and Related Subrange Ratios at the 95 percent Confidence Level," Analytic Chemistry, 83, 2, 139-146.
  • E.P. King (1953). "On Some Procedures for the Rejection of Suspected Data," Journal of the American Statistical Association, Vol. 48, No. 263, 531-533.

Grubbs의 검정 통계량

단측 통계량을 위한 공식

가장 작은 데이터 값이 특이치인지 여부를 검정하는 경우 검정 통계량 G는 다음과 같이 계산됩니다.
가장 큰 데이터 값이 특이치인지 여부를 검정하는 경우 검정 통계량 G는 다음과 같이 계산됩니다.

양측 통계량을 위한 공식

양측 가설의 경우 G는 다음과 같이 계산됩니다.

표기법

용어설명
표본 평균
yi표본에서 i번째로 작은 값
s표본의 표준 편차
n표본의 관측치 수

Dixon 검정 통계량의 p-값

데이터가 정규 분포를 따른다는 가정 하에 Dixon 통계량은 가장 작은 값을 검정하든지 가장 큰 값을 검정하든지 관계없이 동일한 분포를 따릅니다. 따라서 일반성을 잃지 않고 상위 데이터의 특이치를 탐지하기 위한 통계량에 초점을 맞출 수 있습니다. 즉, 다음과 같습니다.

검정 통계량에 대한 누적분포함수

Dixon(1951) 및 McBane(2006)에 따르면 검정 통계량 rij의 분포에 대한 확률밀도함수는 다음과 같습니다.
여기서 C는 다음과 같이 지정되는 정규화 요인입니다.
또한 Jacobian J(x,v,r)는 다음과 같이 지정됩니다.
t = (1 + r2 ) v2 / 2 및 u2 = 3x2 / 2인 변환을 사용하는 경우 밀도함수는 다음과 같습니다.

Minitab에서는 30-점 Gauss-Laguerre 구적법을 사용하여 내부 적분을 평가합니다. Minitab에서는 30점 Gauss-Hermite 구적법을 사용하여 외부 적분을 평가합니다.

검정 통계량의 모임에 대한 누적분포함수는 다음과 같이 지정됩니다.

McBane(2006)과 유사하게 Minitab에서는 16-점 Gauss-Legendre 구적법을 사용하여 Fij(r)를 계산합니다.

단측 검정의 p-값

모든 (i, j) 첨자 쌍에 대해 관측된 단측 통계량 r에 대한 p-값은 다음과 같이 지정됩니다.

단측 검정의 p-값

King(1953)의 결과를 사용하는 경우, 모든 (i, j) 첨자 쌍에 대해 관측된 양측 통계량 r에 대한 p-값은 다음과 같이 지정됩니다.

또한 King의 관측 결과 위의 근사는 에 대해 동일하게 됩니다.

표기법

용어설명
rijDixon 검정 통계량(i = 1, 2; j = 0, 1, 2)
yi표본에서 i번째로 작은 값
n표본의 관측치 수

참고 문헌

W.J. Dixon (1951). "Ratios Involving Extreme Values," Annals of Mathematical Statistics, 22(1), 68-78.

E.P. King (1953). "On Some Procedures for the Rejection of Suspected Data," Journal of the American Statistical Association, Vol. 48, No. 263, pages 531-533.

G.C. McBane (2006). "Programs to Compute Distribution Functions and Critical Values for Extreme Value Ratios for Outlier Detection," Journal of Statistical Software, Vol. 16, No. 3, pages 1-9.

Grubbs 검정 통계량의 p-값

단측 검정을 위한 공식

단측 검정의 p-값:

양측 검정을 위한 공식

양측 검정의 p-값:

정확한 p-값 대 근사 p-값

다음 조건이 참이면 p-값이 정확합니다.

그렇지 않은 경우에는 계산된 p-값이 정확한 p-값에 대한 상한을 나타냅니다. 그러나 상한은 정확한 p-값의 매우 좋은 근사값입니다.

표기법

용어설명
GGrubbs의 검정 통계량
n표본의 관측치 수
T자유도가 n – 2인 t-분포를 따르는 랜덤 변수