원래 데이터와 변환된 데이터가 얼마나 가깝게 정규 분포를 따르는지 평가하려면 정규 확률도를 사용합니다.
원래 데이터가 정규 분포를 따르는 경우 Minitab에서는 단일 확률도만 표시하며 Johnson 변환을 수행하지 않습니다.
표본에 있는 비결측값의 개수입니다. N은 모든 관측치의 수입니다.
합계 | N | N* |
---|---|---|
149 | 141 | 8 |
표본 크기를 평가하려면 N을 사용합니다.
매우 작거나 매우 큰 표본으로부터의 결과를 해석하는 경우 주의하십시오. 표본이 너무 작으면 적합도 검정이 분포에서 유의한 편차를 탐지하기 위한 검정력이 충분하지 않을 수도 있습니다. 표본이 너무 크면 검정의 검정력이 매우 커서 분포에서 실제적으로 유의하지 않은 작은 편차도 탐지할 수도 있습니다. 분포 적합도를 평가하려면 p-값 외에 확률도를 사용하십시오.
Anderson-Darling 적합도 통계량(AD)은 (선택한 분포를 기반으로 한) 적합선과 (데이터 점을 기반으로 한) 비모수 단계 함수 간 편차의 측도입니다. Anderson-Darling 통계량은 분포의 끝 부분에 더 많은 가중치를 부여한 거리 제곱입니다.
Minitab에서는 Anderson-Darling 통계량을 사용하여 p-값을 계산합니다. p-값은 데이터가 분포를 따른다는 귀무 가설에 반하는 증거를 측정하는 확률입니다.
일반적으로 상당히 작은 Anderson-Darling 통계량 값은 데이터가 분포를 더 가깝게 따른다는 것을 나타냅니다. 그러나 AD 통계량은 분포에 따라 다르게 분포되므로 AD 값이 가까운 경우 여러 분포의 AD 값을 직접 비교하지 마십시오. 여러 분포의 적합치를 더 효과적으로 비교하려면 확률도, p-값, 공정 지식 등 추가 기준을 사용하십시오.
원래 데이터와 변환된 데이터 값에 대해 Minitab에서는 Anderson-Darling(AD) 정규성 검정에 대한 p-값을 보고합니다. p-값은 귀무 가설에 반하는 증거를 측정하는 확률입니다. AD 정규성 검정의 귀무 가설은 데이터가 정규 분포를 따른다는 것입니다. 따라서 p-값이 작을수록 데이터가 정규 분포를 따르지 않는다는 더 강력한 증거를 제공합니다.
원래 데이터와 변환된 데이터가 정규 분포를 따르는지 여부를 평가하려면 p-값을 사용합니다. 일반적으로 p-값이 작을수록 데이터에 더 적합합니다.
Johnson 변환이 효과적인 경우 변환된 데이터에 대한 p-값이 알파보다 큽니다.
매우 작거나 매우 큰 표본으로부터의 결과를 해석하는 경우 주의하십시오. 표본이 너무 작으면 적합도 검정이 분포에서 유의한 편차를 탐지하기 위한 검정력이 충분하지 않을 수도 있습니다. 표본이 너무 크면 검정의 검정력이 매우 커서 분포에서 실제적으로 유의하지 않은 작은 편차도 탐지할 수도 있습니다. 분포 적합도를 평가하려면 p-값 외에 확률도를 사용하십시오.
변환 선택 그래프는 여러 Johnson 변환 함수의 각 Z-값에 대한 AD 정규성 검정의 계산된 p-값을 표시합니다. Johnson 변환에서는 최적의 Z를 찾기 위해 광범위한 분포에 대해 Z의 격자를 0.25부터 1.25까지 0.01 간격으로 사용합니다. Minitab은 각 Z에 대한 변환 데이터의 p-값을 계산하고 분석을 위해 지정된 p-값 기준을 초과하는 가장 큰 p-값을 갖는 변환 함수를 선택합니다.
데이터에 대한 최량 적합을 제공하는 Johnson 변환 함수가 어떻게 선택되는지 확인하려면 변환 선택 그래프를 사용하십시오. 수평 기준선은 분석을 위해 지정된 p-값 기준을 보여줍니다. 수직 기준선은 최량 적합을 제공하는 변환에 대한 Z-값을 보여줍니다. 이 최대 Z-값은 AD 정규성 검정에 대한 최소 p-값에 해당합니다.
그래프 아래의 (여기에 표시되지 않은) 표에는 최적 변환 함수에 대한 추정치가 표시됩니다. Minitab에서 Johnson 변환 함수에 사용하는 알고리즘에 대한 자세한 내용을 보려면 개별 분포 식별의 변환에 대한 방법 및 공식에서 "Johnson 변환에 대한 방법 및 공식"을 참조하십시오.
최량 적합에 대한 p-값은 정규 분포로 전환된 데이터의 최량 적합을 산출하는 Johnson 변환에 대한 p-값을 나타냅니다. 이 p-값은 가장 가까운 1,000분의 1로 반올림되어 변환된 데이터에 대한 확률도에도 표시됩니다.
p-값을 해석하는 방법에 대한 내용은 p-값 관련 절을 참조하십시오.
Minitab에서 최량 적합을 제공하는 Johnson 변환 함수를 선택하는 방법에 대한 내용은 변환 선택 그래프 관련 절을 참조하십시오.
최량 적합에 대한 Z-값은 정규 분포로 변환된 데이터의 최량 적합을 산출하는 Johnson 변환 함수에 대한 Z-값을 나타냅니다. 최적의 Z-값은 최적 변환 그래프에 표시된 최량 적합에 대한 p-값에 해당합니다.
Minitab에서 최량 적합을 제공하는 Johnson 변환 함수를 선택하기 위해 Z-값을 사용하는 방법에 대한 내용은 변환 선택 그래프 관련 절을 참조하십시오.
Johnson 변환은 SB, SL 및 SU 등 세 가지 종류의 분포 중에서 최적인 분포를 선택합니다. 여기서 B, L 및 U는 각각 경계 있는 분포, 대수 정규 분포 및 경계 없는 분포의 변수를 나타냅니다. Minitab에서는 선택한 분포 함수를 사용하여 데이터가 정규 분포를 따르도록 변환합니다.
Minitab에서 Johnson 변환 기능을 정의하기 위해 사용하는 알고리즘에 대한 자세한 내용을 보려면 개별 분포 식별의 변환에 대한 방법 및 공식에서 "Johnson 변환에 대한 방법 및 공식"을 참조하십시오.
Minitab에서는 최량 적합치를 생성하는 Johnson 변환 함수의 모수를 표시합니다. Minitab에서는 이 함수를 사용하여 원래 데이터를 변환합니다.
예를 들어, Johnson 변환 함수가 0.762475 + 0.870902 × Ln((X – 46.3174) / (59.6770 – X))라고 가정합니다. X에 대한 원래 데이터 값이 50인 경우 변환된 데이터 값 50은 0.762475 + 0.870902 × Ln((50 – 46.3174) / (59.6770 – 50))으로 계산되며, 계산 결과는 –0.07893입니다.
변환된 모든 값을 워크시트에 저장하려면 분석을 수행할 때 저장 열을 입력하십시오.
Minitab에서 Johnson 변환 함수를 정의하기 위해 사용하는 알고리즘에 대한 자세한 내용을 보려면 개별 분포 식별의 변환에 대한 방법 및 공식에서 "Johnson 변환에 대한 방법 및 공식"을 참조하십시오.