데이터의 선택된 백분율에 대한 백분위수를 추정하는 경우 Minitab에서 백분위수의 표를 표시합니다. P 백분율에 대한 백분위수는 모집단 값의 P 백분율보다 클 것으로 기대되는 값입니다. 기본적으로 Minitab에서는 0.135%, 0.5%, 2% 및 5%에 대한 백분위수를 표시합니다.
예를 들어, 공정의 규격 하한이 46.2라고 가정합니다. 이 경우 분포의 아래쪽 꼬리에서 공정의 공정 능력을 평가할 때 최대 극단값 분포가 약간 더 보수적인 결과를 제공합니다. 차이가 현재 연구에 중요한 경우에는 공정의 공정 능력이 과대 추정되지 않도록 최대 극단값 분포를 사용할 수도 있습니다.
분포 | 백분율 | 백분위수 | 표준 오차 | 95.0% CI | |
---|---|---|---|---|---|
정규 분포 | 1 | 44.3502 | 0.75685 | 42.9 | 45.8 |
Box-Cox 변환 | 1 | 0.0000 | 0.00000 | 0.0 | 0.0 |
로그 정규 분포 | 1 | 44.7566 | 0.65769 | 43.5 | 46.1 |
3-모수 로그 정규 분포 | 1 | 46.5678 | 0.44498 | 45.7 | 47.4 |
지수 | 1 | 0.5104 | 0.07218 | 0.4 | 0.7 |
2-모수 지수 분포 | 1 | 46.7596 | 0.00578 | 46.7 | 46.8 |
Weibull 분포 | 1 | 40.2775 | 1.20894 | 38.0 | 42.7 |
3-모수 Weibull 분포 | 1 | 46.8668 | 0.15945 | 46.7 | 47.2 |
최소극단값 분포 | 1 | 38.6110 | 1.56852 | 35.5 | 41.7 |
최대 극단값 분포 | 1 | 46.1898 | 0.41255 | 45.4 | 47.0 |
감마 분포 | 1 | 44.6902 | 0.67740 | 43.4 | 46.0 |
3-모수 감마 분포 | 1 | 46.5932 | 0.19346 | 46.2 | 47.0 |
로지스틱 분포 | 1 | 43.2434 | 0.91502 | 41.4 | 45.0 |
로그 로지스틱 분포 | 1 | 43.7806 | 0.78496 | 42.3 | 45.3 |
3-모수 로지스틱 분포 | 1 | 46.5059 | 0.59309 | 45.5 | 47.7 |
Johnson 변환 | 1 | -2.2344 | 0.26634 | -2.8 | -1.7 |
이 결과에서는 3-모수 Weibull 분포와 최대 극단값 분포 모두 확률도와 p-값(표시되지 않음)을 기반으로 데이터에 대해 합리적인 적합치를 제공합니다. 3-모수 Weibull 분포의 경우 데이터의 1%가 46.8668보다 작을 것이라고 기대할 수 있습니다. 최대 극단값 분포의 경우 데이터의 1%가 46.1898 이하일 것이라고 기대할 수 있습니다. 상황에 따라 이러한 추가 정보가 더 나은 분포를 선택하는 데 도움이 될 수 있습니다. 하나의 값이 더 보수적인 추정치를 제공할 경우 해당 분포를 선택할 수도 있습니다.
Box-Cox와 Johnson 변환에 대한 값은 백분위수를 해석하기 어렵게 만드는 원시 데이터가 아니라 변환된 값을 바탕으로 합니다.
백분위수의 표준 오차는 같은 모집단에서 반복 표본을 추출하는 경우 얻게 될 표본 백분위수 간의 변동성을 추정합니다. 평균의 표준 오차는 표본 간의 변동성을 추정하는 반면, 표준 편차는 단일 표본 내의 변동성을 측정합니다.
표본 백분위수가 각 분포에 대한 모집단 백분위수를 얼마나 정확하게 추정하는지 확인하려면 백분위수의 표준 오차를 사용합니다.
표준 오차 값이 작을수록 모집단 백분위수의 더 정확한 추정치를 나타냅니다. 일반적으로 표준 편차가 클수록 표준 오차가 더 크고 모집단 백분위수의 추정치가 덜 정확합니다. 표본 크기가 클수록 표준 오차가 더 작고 모집단 백분위수의 추정치가 더 정확하게 됩니다.
Minitab에서는 백분위수의 표준 오차를 사용하여 모집단 백분위수 값의 범위인 신뢰 구간을 계산합니다.
신뢰 구간은 모집단 백분위수가 될 수 있는 값의 범위를 제공합니다. 신뢰 구간은 하한과 상한으로 정의됩니다. 한계는 백분위수의 표본 추정치에 대한 오차 한계를 결정함으로써 계산됩니다. 신뢰 하한은 백분위수가 더 클 가능성이 높은 값을 정의합니다. 신뢰 상한은 백분위수가 더 작을 가능성이 높은 값을 정의합니다.
데이터 표본이 랜덤이기 때문에 공정에서 수집된 두 표본이 동일한 백분위수 추정치를 생성할 가능성이 거의 없습니다. 공정에 대한 실제 백분위수 값을 계산하려면 공정에서 생산하는 모든 품목에 대한 데이터를 분석해야 하지만 이는 불가능합니다. 대신, 신뢰 구간을 사용하여 백분위수가 될 수 있는 값의 범위를 결정할 수 있습니다.
95% 신뢰 수준에서 실제 백분위수 값이 신뢰 구간 내에 포함된다고 95% 신뢰할 수 있습니다. 즉, 공정에서 100개의 랜덤 표본을 수집하는 경우 약 95개의 표본이 실제 백분위수 값이 포함되는 구간을 생성할 것이라고 기대할 수 있습니다.
신뢰 구간의 너비는 표본 크기가 크거나 데이터의 변동성이 작을 때 감소하는 경향이 있습니다. 좁은 신뢰 구간은 표본 추정치가 신뢰할 수 있으며 랜덤 표본 추출로 인한 변동성의 영향을 크게 받을 가능성이 없다는 것을 나타냅니다. 백분위수에 대한 신뢰 구간이 넓은 경우에는 공정에 대한 결론을 내리기 위해 백분위수 점 추정치를 사용할 때 주의하십시오. 신뢰 구간이 넓으면 현재 연구에 더 보수적인 결과를 제공하는 신뢰 구간의 하한 또는 상한을 기반으로 백분위수 값을 추정할 수 있습니다.
분포 | 백분율 | 백분위수 | 표준 오차 | 95.0% CI | |
---|---|---|---|---|---|
정규 분포 | 1 | 44.3502 | 0.75685 | 42.9 | 45.8 |
Box-Cox 변환 | 1 | 0.0000 | 0.00000 | 0.0 | 0.0 |
로그 정규 분포 | 1 | 44.7566 | 0.65769 | 43.5 | 46.1 |
3-모수 로그 정규 분포 | 1 | 46.5678 | 0.44498 | 45.7 | 47.4 |
지수 | 1 | 0.5104 | 0.07218 | 0.4 | 0.7 |
2-모수 지수 분포 | 1 | 46.7596 | 0.00578 | 46.7 | 46.8 |
Weibull 분포 | 1 | 40.2775 | 1.20894 | 38.0 | 42.7 |
3-모수 Weibull 분포 | 1 | 46.8668 | 0.15945 | 46.7 | 47.2 |
최소극단값 분포 | 1 | 38.6110 | 1.56852 | 35.5 | 41.7 |
최대 극단값 분포 | 1 | 46.1898 | 0.41255 | 45.4 | 47.0 |
감마 분포 | 1 | 44.6902 | 0.67740 | 43.4 | 46.0 |
3-모수 감마 분포 | 1 | 46.5932 | 0.19346 | 46.2 | 47.0 |
로지스틱 분포 | 1 | 43.2434 | 0.91502 | 41.4 | 45.0 |
로그 로지스틱 분포 | 1 | 43.7806 | 0.78496 | 42.3 | 45.3 |
3-모수 로지스틱 분포 | 1 | 46.5059 | 0.59309 | 45.5 | 47.7 |
Johnson 변환 | 1 | -2.2344 | 0.26634 | -2.8 | -1.7 |
이 결과에서 최대 극단값 분포를 사용할 경우 표본 추정치를 기반으로 데이터의 1%가 46.1898보다 작을 것이라고 기대할 수 있습니다. 95% 신뢰 구간은 (45.4, 47)입니다. 공정의 규격 하한이 47이라고 가정합니다. 백분위수 추정치에 대한 신뢰 구간의 하한(45.4)을 사용할 수도 있습니다. 하한을 사용할 경우, 데이터의 1%가 이 상황에서 더 보수적인 추정치를 제공하는 45.4보다 작을 것이라고 기대할 수 있습니다.
Box-Cox와 Johnson 변환에 대한 값은 백분위수를 해석하기 어렵게 만드는 원시 데이터가 아니라 변환된 값을 바탕으로 합니다.