개별 분포 식별에 대한 분포 백분위수

개별 분포 식별와 함께 제공되는 모든 분포 백분위수 통계량에 대한 정의 및 해석 방법을 확인해 보십시오.

백분율 및 백분위수

데이터의 선택된 백분율에 대한 백분위수를 추정하는 경우 Minitab에서 백분위수의 표를 표시합니다. P 백분율에 대한 백분위수는 모집단 값의 P 백분율보다 클 것으로 기대되는 값입니다. 기본적으로 Minitab에서는 0.135%, 0.5%, 2% 및 5%에 대한 백분위수를 표시합니다.

해석

확률도와 적합도 측도만 기반으로 가장 적합한 분포를 결정하기 어려운 경우도 있습니다. 이 경우, 각 분포의 선택된 백분율 값에 대한 백분위수를 비교하여 각 분포를 사용할 경우 결론에 미치는 영향을 평가할 수 있습니다.
  • 여러 분포가 데이터에 합리적인 적합치를 제공하고 백분위수 값이 거의 같아 어떤 분포를 선택하더라도 비슷한 결론을 내릴 가능성이 높으면, 어떤 분포를 선택하든지 중요하지 않을 수도 있습니다.
  • 합리적인 적합치를 제공하는 분포에 대한 백분위수가 분석 결과에 영향을 미칠 수 있을 만큼 다른 경우에는 현재 연구에 가장 보수적인 결과를 제공하는 분포를 선택해야 할 수도 있습니다.

예를 들어, 공정의 규격 하한이 46.2라고 가정합니다. 이 경우 분포의 아래쪽 꼬리에서 공정의 공정 능력을 평가할 때 최대 극단값 분포가 약간 더 보수적인 결과를 제공합니다. 차이가 현재 연구에 중요한 경우에는 공정의 공정 능력이 과대 추정되지 않도록 최대 극단값 분포를 사용할 수도 있습니다.

백분위수 표

분포백분율백분위수표준 오차95.0% CI
정규 분포144.35020.7568542.945.8
Box-Cox 변환10.00000.000000.00.0
로그 정규 분포144.75660.6576943.546.1
3-모수 로그 정규 분포146.56780.4449845.747.4
지수10.51040.072180.40.7
2-모수 지수 분포146.75960.0057846.746.8
Weibull 분포140.27751.2089438.042.7
3-모수 Weibull 분포146.86680.1594546.747.2
최소극단값 분포138.61101.5685235.541.7
최대 극단값 분포146.18980.4125545.447.0
감마 분포144.69020.6774043.446.0
3-모수 감마 분포146.59320.1934646.247.0
로지스틱 분포143.24340.9150241.445.0
로그 로지스틱 분포143.78060.7849642.345.3
3-모수 로지스틱 분포146.50590.5930945.547.7
Johnson 변환1-2.23440.26634-2.8-1.7

이 결과에서는 3-모수 Weibull 분포와 최대 극단값 분포 모두 확률도와 p-값(표시되지 않음)을 기반으로 데이터에 대해 합리적인 적합치를 제공합니다. 3-모수 Weibull 분포의 경우 데이터의 1%가 46.8668보다 작을 것이라고 기대할 수 있습니다. 최대 극단값 분포의 경우 데이터의 1%가 46.1898 이하일 것이라고 기대할 수 있습니다. 상황에 따라 이러한 추가 정보가 더 나은 분포를 선택하는 데 도움이 될 수 있습니다. 하나의 값이 더 보수적인 추정치를 제공할 경우 해당 분포를 선택할 수도 있습니다.

참고

Box-Cox와 Johnson 변환에 대한 값은 백분위수를 해석하기 어렵게 만드는 원시 데이터가 아니라 변환된 값을 바탕으로 합니다.

백분위수의 표준 오차

백분위수의 표준 오차는 같은 모집단에서 반복 표본을 추출하는 경우 얻게 될 표본 백분위수 간의 변동성을 추정합니다. 평균의 표준 오차는 표본 간의 변동성을 추정하는 반면, 표준 편차는 단일 표본 내의 변동성을 측정합니다.

해석

표본 백분위수가 각 분포에 대한 모집단 백분위수를 얼마나 정확하게 추정하는지 확인하려면 백분위수의 표준 오차를 사용합니다.

표준 오차 값이 작을수록 모집단 백분위수의 더 정확한 추정치를 나타냅니다. 일반적으로 표준 편차가 클수록 표준 오차가 더 크고 모집단 백분위수의 추정치가 덜 정확합니다. 표본 크기가 클수록 표준 오차가 더 작고 모집단 백분위수의 추정치가 더 정확하게 됩니다.

Minitab에서는 백분위수의 표준 오차를 사용하여 모집단 백분위수 값의 범위인 신뢰 구간을 계산합니다.

백분위수의 CI

신뢰 구간은 모집단 백분위수가 될 수 있는 값의 범위를 제공합니다. 신뢰 구간은 하한과 상한으로 정의됩니다. 한계는 백분위수의 표본 추정치에 대한 오차 한계를 결정함으로써 계산됩니다. 신뢰 하한은 백분위수가 더 클 가능성이 높은 값을 정의합니다. 신뢰 상한은 백분위수가 더 작을 가능성이 높은 값을 정의합니다.

해석

데이터 표본이 랜덤이기 때문에 공정에서 수집된 두 표본이 동일한 백분위수 추정치를 생성할 가능성이 거의 없습니다. 공정에 대한 실제 백분위수 값을 계산하려면 공정에서 생산하는 모든 품목에 대한 데이터를 분석해야 하지만 이는 불가능합니다. 대신, 신뢰 구간을 사용하여 백분위수가 될 수 있는 값의 범위를 결정할 수 있습니다.

95% 신뢰 수준에서 실제 백분위수 값이 신뢰 구간 내에 포함된다고 95% 신뢰할 수 있습니다. 즉, 공정에서 100개의 랜덤 표본을 수집하는 경우 약 95개의 표본이 실제 백분위수 값이 포함되는 구간을 생성할 것이라고 기대할 수 있습니다.

신뢰 구간의 너비는 표본 크기가 크거나 데이터의 변동성이 작을 때 감소하는 경향이 있습니다. 좁은 신뢰 구간은 표본 추정치가 신뢰할 수 있으며 랜덤 표본 추출로 인한 변동성의 영향을 크게 받을 가능성이 없다는 것을 나타냅니다. 백분위수에 대한 신뢰 구간이 넓은 경우에는 공정에 대한 결론을 내리기 위해 백분위수 점 추정치를 사용할 때 주의하십시오. 신뢰 구간이 넓으면 현재 연구에 더 보수적인 결과를 제공하는 신뢰 구간의 하한 또는 상한을 기반으로 백분위수 값을 추정할 수 있습니다.

백분위수 표

분포백분율백분위수표준 오차95.0% CI
정규 분포144.35020.7568542.945.8
Box-Cox 변환10.00000.000000.00.0
로그 정규 분포144.75660.6576943.546.1
3-모수 로그 정규 분포146.56780.4449845.747.4
지수10.51040.072180.40.7
2-모수 지수 분포146.75960.0057846.746.8
Weibull 분포140.27751.2089438.042.7
3-모수 Weibull 분포146.86680.1594546.747.2
최소극단값 분포138.61101.5685235.541.7
최대 극단값 분포146.18980.4125545.447.0
감마 분포144.69020.6774043.446.0
3-모수 감마 분포146.59320.1934646.247.0
로지스틱 분포143.24340.9150241.445.0
로그 로지스틱 분포143.78060.7849642.345.3
3-모수 로지스틱 분포146.50590.5930945.547.7
Johnson 변환1-2.23440.26634-2.8-1.7

이 결과에서 최대 극단값 분포를 사용할 경우 표본 추정치를 기반으로 데이터의 1%가 46.1898보다 작을 것이라고 기대할 수 있습니다. 95% 신뢰 구간은 (45.4, 47)입니다. 공정의 규격 하한이 47이라고 가정합니다. 백분위수 추정치에 대한 신뢰 구간의 하한(45.4)을 사용할 수도 있습니다. 하한을 사용할 경우, 데이터의 1%가 이 상황에서 더 보수적인 추정치를 제공하는 45.4보다 작을 것이라고 기대할 수 있습니다.

참고

Box-Cox와 Johnson 변환에 대한 값은 백분위수를 해석하기 어렵게 만드는 원시 데이터가 아니라 변환된 값을 바탕으로 합니다.