个体分布标识的分布百分位数

请查找定义和解释指导,了解随个体分布标识提供的每个分布百分位数统计量。

百分位数和百分比

如果您选择为选定的数据百分比估计百分位数,则 Minitab 会显示百分位数表。对于每个分布,P 百分比的百分位数是预期总体值的 P 百分比在其之下的值。默认情况下,Minitab 会显示百分位数 ..135%、..5%、2% 和 5%。

解释

有时,仅根据概率图和拟合优度测量可能很难确定最佳分布。在这种情况下,可以比较每个分布的选定百分比值的百分位数,以评估使用不同分布对结论造成的影响。
  • 如果多个分布都提供合理的数据拟合,而且这些分布的百分位值足够接近,以至于可以使用其中任何一个分布得出相似的结论,那么,这可能与您选择的分布无关。
  • 如果具有合理拟合的分布的百分位数按照可能会影响分析结果的量进行变化,您可能希望选择能够为应用提供最保守结果的分布。

例如,假设过程的规格下限为 46.2。在这种情况下,当您在分布的下尾评估过程的能力时,最大极差分布会提供稍多的保守结果。如果差值对于应用至关重要,则可以使用最大极值分布来避免对过程能力的过高估计。

百分位数表 95.0% 置信 分布 百分比 百分位数 标准误 区间 正态 1 44.3502 0.75685 42.9 45.8 Box-Cox 变换 1 0.0000 0.00000 0.0 0.0 对数正态 1 44.7566 0.65769 43.5 46.1 3 参数对数正态 1 46.5678 0.44498 45.7 47.4 指数 1 0.5104 0.07218 0.4 0.7 2 参数指数 1 46.7596 0.00578 46.7 46.8 Weibull 1 40.2775 1.20894 38.0 42.7 3 参数 Weibull 1 46.8668 0.15945 46.7 47.2 最小极值 1 38.6110 1.56852 35.5 41.7 最大极值 1 46.1898 0.41255 45.4 47.0 Gamma 1 44.6902 0.67740 43.4 46.0 3 参数 Gamma 1 46.5932 0.19346 46.2 47.0 Logistic 1 43.2434 0.91502 41.4 45.0 对数 Logistic 1 43.7806 0.78496 42.3 45.3 3 参数对数 Logistic 1 46.5059 0.59309 45.5 47.7 Johnson 变换 1 -2.2344 0.26634 -2.8 -1.7

在这些结果中,3 参数 Weibull 分布和最大极值分布均基于概率图和 p 值(未显示)为数据提供合理拟合。对于 3 参数 Weibull 分布,可以预计 1% 的数据位于 46.8668 下方。对于最大极值分布,可以预计 1% 的数据位于 46.1898 下方。根据上下文,这些附加信息可能有助于您选择更好的分布。如果一个值提供更保守的估计值,您可以选择该分布。

注意

Box-Cox 变换和 Johnson 变换的值是以变换后的值为基础,而不是以使百分位数难以解释的原始数据为基础。

百分位数的标准误

百分位数的标准误估计样本百分位数之间的变异性,样本百分位数是对相同总体进行重复抽样获得的。均值的标准误估计样本之间的变异性,而标准差则度量单个样本内的变异性。

解释

使用百分位数的标准误可以确定样本百分位数对每个分布的总体百分位数的估计精确度。

标准误的值越小,表明总体百分位数的估计值越精确。通常,标准差越大,标准误就越大,总体百分位数的估计值越不精确。样本数量越大,标准误就越小,总体百分位数的估计值越精确。

Minitab 使用百分位数的标准误计算置信区间,置信区间是总体百分位数的值范围。

百分位数的置信区间

置信区间提供总体百分位数的可能值范围。置信区间由置信下限和置信上限定义。下限是通过确定百分位数样本估计值的边际误差来计算的。置信下限定义可能小于百分位数的值。置信上限定义可能大于百分位数的值。

解释

由于数据样本是随机的,因此从过程收集的两个样本不可能生成相同的百分位数估计值。要计算过程百分位数的实际值,您将需要分析由过程生成的所有项数据,而这是不可行的。您可以改为使用置信区间来确定百分位数值的可能范围。

在 95% 置信水平下,您可以 95% 地确信百分位数的实际值包含在置信区间内。也就是说,如果您从过程中收集 100 个随机样本,则可以预计 95 个样本生成的区间中包含百分位数的实际值。

样本数量越大或者数据的变异性越小,置信区间的宽度也往往会降低。如果置信区间较窄,则表示样本估计值可靠且不太可能受到随机抽样引起的变异性的显著影响。如果百分位数的置信区间很宽,则在使用百分位点估计值得出过程结论时一定要格外小心。如果置信区间很宽,您可能希望百分位值的估计值基于置信区间的下限或上限(取二者中为应用生成更保守结果的限值)。

百分位数表 95.0% 置信 分布 百分比 百分位数 标准误 区间 正态 1 44.3502 0.75685 42.9 45.8 Box-Cox 变换 1 0.0000 0.00000 0.0 0.0 对数正态 1 44.7566 0.65769 43.5 46.1 3 参数对数正态 1 46.5678 0.44498 45.7 47.4 指数 1 0.5104 0.07218 0.4 0.7 2 参数指数 1 46.7596 0.00578 46.7 46.8 Weibull 1 40.2775 1.20894 38.0 42.7 3 参数 Weibull 1 46.8668 0.15945 46.7 47.2 最小极值 1 38.6110 1.56852 35.5 41.7 最大极值 1 46.1898 0.41255 45.4 47.0 Gamma 1 44.6902 0.67740 43.4 46.0 3 参数 Gamma 1 46.5932 0.19346 46.2 47.0 Logistic 1 43.2434 0.91502 41.4 45.0 对数 Logistic 1 43.7806 0.78496 42.3 45.3 3 参数对数 Logistic 1 46.5059 0.59309 45.5 47.7 Johnson 变换 1 -2.2344 0.26634 -2.8 -1.7

在这些结果中,使用最大极值分布,可以基于样本估计值预计 1% 的数据位于 46.1898 值下方。95% 置信区间为 (45.4, 47)。假设过程的规格下限为 47。为谨慎起见,您可能希望使用置信区间的下限 (45.4) 作为百分位数的估计值。使用下限,可以预计 1% 的数据位于 45.4 值下方,在这种情况下会提供更保守的估计值。

注意

Box-Cox 变换和 Johnson 变换的值是以变换后的值为基础,而不是以使百分位数难以解释的原始数据为基础。