Johnson 변환에 대한 모든 통계량 및 그래프 해석

Johnson 변환와 함께 제공되는 모든 통계량 및 그래프에 대한 정의 및 해석 방법을 확인해 보십시오.

원래 데이터와 변환된 데이터에 대한 확률도

확률도에는 표본의 각 데이터 점 및 해당 데이터 점보다 작거나 같은 값의 백분율이 표시됩니다.
이 그림은 다음과 같은 성분으로 구성됩니다.
중간 선
모수 추정치의 최대우도에 바탕을 둔 분포에서 예상되는 백분위수입니다.
신뢰 한계 선
왼쪽 곡선은 백분위수에 대한 신뢰 구간의 하한을 연결한 것입니다. 오른쪽 곡선은 백분위수에 대한 신뢰 구간의 상한을 연결한 것입니다.

해석

원래 데이터와 변환된 데이터가 얼마나 가깝게 정규 분포를 따르는지 평가하려면 정규 확률도를 사용합니다.

Johnson 변환이 효과적이고 정규 분포가 변환된 데이터에 적합한 경우 변환된 데이터에 대한 그림의 점들이 적합된 정규 분포 선을 가깝게 따라야 합니다. 직선에서 벗어나 있으면 적합치가 허용되지 않으며 Johnson 변환이 효과적이지 않다는 것을 나타냅니다.
좋은 적합치
좋지 않은 적합치
확률도 외에 AD p-값을 사용하여 분포 적합치를 평가할 수 있습니다. 자세한 내용은 P에서 확인하십시오.
참고

원래 데이터가 정규 분포를 따르는 경우 Minitab에서는 단일 확률도만 표시하며 Johnson 변환을 수행하지 않습니다.

N

표본에 있는 비결측값의 개수입니다. N은 모든 관측치의 수입니다.

이 예에서는 141개의 관측치가 기록되었습니다.
합계 N N*
149 141 8

해석

표본 크기를 평가하려면 N을 사용합니다.

일반적으로 표본이 클수록 분포 적합치를 평가하기에 더 신뢰할 수 있는 결과를 얻을 수 있습니다.
중요

매우 작거나 매우 큰 표본으로부터의 결과를 해석하는 경우 주의하십시오. 표본이 너무 작으면 적합도 검정이 분포에서 유의한 편차를 탐지하기 위한 검정력이 충분하지 않을 수도 있습니다. 표본이 너무 크면 검정의 검정력이 매우 커서 분포에서 실제적으로 유의하지 않은 작은 편차도 탐지할 수도 있습니다. 분포 적합도를 평가하려면 p-값 외에 확률도를 사용하십시오.

p-값

원래 데이터와 변환된 데이터 값에 대해 Minitab에서는 Anderson-Darling(AD) 정규성 검정에 대한 p-값을 보고합니다. p-값은 귀무 가설에 반하는 증거를 측정하는 확률입니다. AD 정규성 검정의 귀무 가설은 데이터가 정규 분포를 따른다는 것입니다. 따라서 p-값이 작을수록 데이터가 정규 분포를 따르지 않는다는 더 강력한 증거를 제공합니다.

해석

원래 데이터와 변환된 데이터가 정규 분포를 따르는지 여부를 평가하려면 p-값을 사용합니다. 일반적으로 p-값이 작을수록 데이터에 더 적합합니다.

p-값을 알파 수준과 비교합니다. 분포 적합성을 확인하기 위해 보통 0.05 또는 0.10의 알파가 사용됩니다.
  • 알파보다 작은 p-값은 정규 분포가 적합하지 않다는 것을 나타냅니다.
  • 알파보다 크거나 같은 p-값은 분포가 적합하지 않다는 충분한 증거가 없음을 나타냅니다. 데이터가 정규 분포를 따른다고 가정할 수 있습니다.

Johnson 변환이 효과적인 경우 변환된 데이터에 대한 p-값이 알파보다 큽니다.

중요

매우 작거나 매우 큰 표본으로부터의 결과를 해석하는 경우 주의하십시오. 표본이 너무 작으면 적합도 검정이 분포에서 유의한 편차를 탐지하기 위한 검정력이 충분하지 않을 수도 있습니다. 표본이 너무 크면 검정의 검정력이 매우 커서 분포에서 실제적으로 유의하지 않은 작은 편차도 탐지할 수도 있습니다. 분포 적합도를 평가하려면 p-값 외에 확률도를 사용하십시오.

변환 선택 그래프

변환 선택 그래프는 여러 Johnson 변환 함수의 각 Z-값에 대한 AD 정규성 검정의 계산된 p-값을 표시합니다. Johnson 변환에서는 최적의 Z를 찾기 위해 광범위한 분포에 대해 Z의 격자를 0.25부터 1.25까지 0.01 간격으로 사용합니다. Minitab은 각 Z에 대한 변환 데이터의 p-값을 계산하고 분석을 위해 지정된 p-값 기준을 초과하는 가장 큰 p-값을 갖는 변환 함수를 선택합니다.

해석

데이터에 대한 최량 적합을 제공하는 Johnson 변환 함수가 어떻게 선택되는지 확인하려면 변환 선택 그래프를 사용하십시오. 수평 기준선은 분석을 위해 지정된 p-값 기준을 보여줍니다. 수직 기준선은 최량 적합을 제공하는 변환에 대한 Z-값을 보여줍니다. 이 최대 Z-값은 AD 정규성 검정에 대한 최소 p-값에 해당합니다.

예를 들어, 다음 그래프는 Z = 0.61일 때 데이터에 대한 최적의 변환 함수를 찾을 수 있다는 것을 보여줍니다. 이 Z-값은 사용된 여러 변환 함수 중에서 Anderson-Darling 정규성 검정(0.985835)에 대한 가장 높은 p-값과 연관됩니다. p-값 기준(기준 P)은 기본값인 0.10입니다.
참고

그래프 아래의 (여기에 표시되지 않은) 표에는 최적 변환 함수에 대한 추정치가 표시됩니다. Minitab에서 Johnson 변환 함수에 사용하는 알고리즘에 대한 자세한 내용을 보려면 개별 분포 식별의 변환에 대한 방법 및 공식에서 "Johnson 변환에 대한 방법 및 공식"을 참조하십시오.

최량 적합에 대한 P-값

최량 적합에 대한 p-값은 정규 분포로 전환된 데이터의 최량 적합을 산출하는 Johnson 변환에 대한 p-값을 나타냅니다. 이 p-값은 가장 가까운 1,000분의 1로 반올림되어 변환된 데이터에 대한 확률도에도 표시됩니다.

p-값을 해석하는 방법에 대한 내용은 p-값 관련 절을 참조하십시오.

Minitab에서 최량 적합을 제공하는 Johnson 변환 함수를 선택하는 방법에 대한 내용은 변환 선택 그래프 관련 절을 참조하십시오.

최량 적합에 대한 Z

최량 적합에 대한 Z-값은 정규 분포로 변환된 데이터의 최량 적합을 산출하는 Johnson 변환 함수에 대한 Z-값을 나타냅니다. 최적의 Z-값은 최적 변환 그래프에 표시된 최량 적합에 대한 p-값에 해당합니다.

Minitab에서 최량 적합을 제공하는 Johnson 변환 함수를 선택하기 위해 Z-값을 사용하는 방법에 대한 내용은 변환 선택 그래프 관련 절을 참조하십시오.

최량 변환 유형

Johnson 변환은 SB, SL 및 SU 등 세 가지 종류의 분포 중에서 최적인 분포를 선택합니다. 여기서 B, L 및 U는 각각 경계 있는 분포, 대수 정규 분포 및 경계 없는 분포의 변수를 나타냅니다. Minitab에서는 선택한 분포 함수를 사용하여 데이터가 정규 분포를 따르도록 변환합니다.

Minitab에서 Johnson 변환 기능을 정의하기 위해 사용하는 알고리즘에 대한 자세한 내용을 보려면 개별 분포 식별의 변환에 대한 방법 및 공식에서 "Johnson 변환에 대한 방법 및 공식"을 참조하십시오.

Johnson 변환 함수

Minitab에서는 최량 적합치를 생성하는 Johnson 변환 함수의 모수를 표시합니다. Minitab에서는 이 함수를 사용하여 원래 데이터를 변환합니다.

예를 들어, Johnson 변환 함수가 0.762475 + 0.870902 × Ln((X – 46.3174) / (59.6770 – X))라고 가정합니다. X에 대한 원래 데이터 값이 50인 경우 변환된 데이터 값 50은 0.762475 + 0.870902 × Ln((50 – 46.3174) / (59.6770 – 50))으로 계산되며, 계산 결과는 –0.07893입니다.

참고

변환된 모든 값을 워크시트에 저장하려면 분석을 수행할 때 저장 열을 입력하십시오.

Minitab에서 Johnson 변환 함수를 정의하기 위해 사용하는 알고리즘에 대한 자세한 내용을 보려면 개별 분포 식별의 변환에 대한 방법 및 공식에서 "Johnson 변환에 대한 방법 및 공식"을 참조하십시오.