个体分布标识的拟合优度

请查找定义和解释指导,了解随个体分布标识提供的每个拟合优度统计量。

概率图

概率图显示每个数据点以及样本中小于或等于该数据点的值的百分比。
该图包括:
中线
基于极大似然参数估计的分布的预期百分位数。
置信限线
左侧曲线表示百分位数的置信区间下限。右侧曲线表示百分位数的置信区间上限。

解释

使用概率图评估数据与每个分布的拟合密切程度。

如果分布是数据的良好拟合,这些点将沿着拟合分布线附近分布。离开直线说明拟合是不可接受的。

好拟合
差拟合

除了概率图外,还可以使用拟合优度度量(如 AD p 值和 LRT p 值)评估分布的拟合。

在选择用来对数据进行建模的分布时,还会依靠您的过程知识。如果多个分布能够提供良好的拟合,请使用下列策略来选择分布:
  • 选择行业或应用中最常用的分布。
  • 选择可提供最保守结果的分布。例如,如果您要执行能力分析,则可以使用不同的分布执行分析,然后选择可生成最保守能力指标的分布。有关更多信息,请转到个体分布标识的分布百分位数并单击“百分比和百分位数”。
  • 选择能够很好地拟合数据的最简单分布。例如,如果 2 参数和 3 参数分布都提供良好的拟合,则可以选择较为简单的 2 参数分布。

P

对于每个分布,Minitab 报告 Anderson-Darling (AD) 检验的 p 值 (P)。P 值是一个概率,用来度量否定原假设的证据。对于 AD 检验,原假设是数据服从分布。因此,较低的 p 值会提供更强的证据来说明数据不服从分布。
注意

AD 检验的 p 值用于 Weibull 分布以外的 3 参数分布。

解释

使用 p 值评估分布的拟合。

将每个分布或变换的 p 值与显著性水平进行比较。通常,显著性水平(用 α 或 alpha 表示)为 0.05 即可。显著性水平 0.05 指示当数据实际上服从分布时,判定数据不服从分布的风险为 5%。
P ≤ α:数据不服从分布(否定 H0
如果 p 值小于或等于显著性水平,则决策为否定原假设并得出数据不服从分布的结论。
P > α:无法得出数据不服从分布的结论(无法否定 H0
如果 p 值大于显著性水平 0.05,则决策为无法否定原假设。证据不足,无法得出数据不服从分布的结论。您可以假设数据服从分布。
在选择用来对数据进行建模的分布时,还会依靠您的过程知识。如果多个分布能够提供良好的拟合,请使用下列策略来选择分布:
  • 选择行业或应用中最常用的分布。
  • 选择可提供最保守结果的分布。例如,如果您要执行能力分析,则可以使用不同的分布执行分析,然后选择可生成最保守能力指标的分布。有关更多信息,请转到个体分布标识的分布百分位数并单击“百分比和百分位数”。
  • 选择能够很好地拟合数据的最简单分布。例如,如果 2 参数和 3 参数分布都提供良好的拟合,则可以选择较为简单的 2 参数分布。
重要信息

在解释很小或很大样本的结果时请务必谨慎。如果您的样本很小,则拟合优度检验可能没有足够的功效来检测与分布存在显著偏差的情况。如果您的样本很大,则该检验的功效可能很高,从而可以检测到与分布的微小但不具实际意义的偏差。除 p 值以外,还要使用概率图评估分布拟合。

拟合优度检验

分布ADP极大似然比 P
正态0.7540.046 
Box-Cox 变换0.4140.324 
对数正态0.6500.085 
3 参数对数正态0.341*0.017
指数20.614<0.003 
2 参数指数1.6840.0140.000
Weibull1.442<0.010 
3 参数 Weibull0.230>0.5000.000
最小极值1.656<0.010 
最大极值0.394>0.250 
Gamma0.7020.071 
3 参数 Gamma0.268*0.006
Logistic0.7260.034 
对数 Logistic0.6590.050 
3 参数对数 Logistic0.432*0.027
Johnson 变换0.1240.986 

在这些结果中,多个分布的 p 值大于 0.05。3 参数 Weibull 分布(P > 0.500)和最大极值分布 (P > 0.250) 具有最大的 p 值,而且与其他分布相比,对样本数据的拟合似乎更好。同时,Box-Cox 变换 (P = 0.324) 和 Johnson 变换 (P = 0.986) 在将数据变换为服从正态分布方面有效。

注意

对于多个分布,Minitab 还显示具有一个额外参数的分布的结果。例如,对于对数正态分布,Minitab 既显示 2 参数分布版本的结果,又显示 3 参数分布版本的结果。对于具有额外参数的分布,使用似然比检验 p 值 (LRT P) 可以确定添加另一个参数是否会显著改善对分布的拟合。小于 0.05 的 LRT p 值表示拟合有显著改善。有关更多信息,请参见有关 LRT P 的部分。

极大似然比 P

对于多个分布,Minitab 还显示具有一个额外参数的分布的结果。对于每个包含额外参数的分布版本,Minitab 报告似然比检验的 p 值 (LRT P)。P 值是一个概率,用来度量否定原假设的证据。对于个体分布标识中的似然比检验,原假设是数据服从较小(较低的参数)分布。因此,较低的 LRT p 值会提供更强的证据来证明通过使用额外参数可显著改善对分布的拟合。

解释

在这些情况下,使用 LRT P 值可确定添加额外参数是否比不带额外参数的分布的拟合有显著改进。

对于每个分布或变换,将 LRT p 值与显著性水平进行比较。通常,显著性水平(用 α 或 alpha 表示)为 0.05 即可。显著性水平 0.05 指示当额外参数实际上不会显著改善分布拟合时,判定额外参数会显著改善分布拟合的风险为 5%。
P ≤ α:较大的(较高的参数)分布提供显著更好的拟合。(否定 H0)
如果 p 值小于或等于显著性水平,则否定原假设并得出通过使用额外参数不会显著改善分布拟合的结论。
P > α:无法得出较大的(较高的参数)分布提供显著更好的拟合的结论。(无法否定 H0
由于 p 值大于显著性水平 0.05,因此无法否定原假设。证据不足,无法得出通过使用额外参数可显著改善分布拟合的结论。

对于 3 参数 gamma 分布,LRT P 值也很有用,因为没有计算 p 值的现成方法。在这些情况中,建议首先检查对应的双参数分布的 p 值。然后查看 3 参数分布的 LRT P 值,以确定 3 参数分布是否明显好于双参数分布。

在这些结果中,3 参数对数正态的 LRT P 值 (0.017)、3 参数 Weibull 的 LRT P 值 (0.000)、3 参数 Gamma 的 LRT P 值 (0.004) 和 3 参数对数 Logistic 的 LRT P 值 (0.027) 表示与其双参数的对应方法相比,这些分布显著改善了拟合。

拟合优度检验

分布ADP极大似然比 P
正态0.7540.046 
Box-Cox 变换0.4140.324 
对数正态0.6500.085 
3 参数对数正态0.341*0.017
指数20.614<0.003 
2 参数指数1.6840.0140.000
Weibull1.442<0.010 
3 参数 Weibull0.230>0.5000.000
最小极值1.656<0.010 
最大极值0.394>0.250 
Gamma0.7020.071 
3 参数 Gamma0.268*0.006
Logistic0.7260.034 
对数 Logistic0.6590.050 
3 参数对数 Logistic0.432*0.027
Johnson 变换0.1240.986