非正态数据的可用分析

选择合适的方法是进行能力分析的重要第一步。如果该方法不能很好地拟合数据,则能力估计值不准确。如果您有非正态数据,则有几种方法可以执行能力分析:
  • 选择可拟合您数据的非正态分布模型,然后使用非正态数据能力分析(如非正态能力分析)来分析数据。
  • 转换数据,使正态分布成为适合的模型,然后使用正态数据能力分析,例如 正态能力分析
  • 选择不对数据分布做出假设的非参数方法,例如 能力分析(非参数)
要选择方法,通常至少要考虑以下条件:
使用过程的工程或历史知识。
大多数情况下,最好使用过程的工程和历史知识来确定适合过程数据的方法。例如,数据是否遵守对称分布?过去有什么方法适用于类似情况?
使用拟合优度评估。
Anderson-Darling 检验评估给定分布是否拟合来自过程的数据。概率图是评估数据与分布的紧密程度的另一种工具。
评估不同的方法如何影响您的结论。
如果几种方法提供了对数据和类似结论的充分拟合,那么选择的重要性就不大了。相反,如果您的结论取决于方法,您可能需要报告最保守的结论或收集更多信息。例如,您可以使用分布 自动化能力分析 结果或百分位数来 个体分布标识 查看结论如何依赖于该方法。
如果几种方法提供了足够的拟合和相似的结论,那么您还可以考虑其他标准:
  • 如果您计划随时间推移对过程执行重复的能力分析,请尝试使用一种可能随时间推移始终如一地充分表征过程的方法。使用相同的方法可以轻松直接地比较重复分析中的指数。
  • 非正态和非参数模型使用实际数据单位。变换中的法线模型使用变换后的单位。
  • 转换的正态模型提供总体和过程内能力的估计值。

用于 自动化能力分析 让 Minitab 统计软件帮助确定拟合数据的合理方法,同时考虑该方法的有用性和实用性。分析首先考虑分布,然后考虑变换。如果没有模型拟合数据,则分析使用非参数方法。

要查看有关数据的更多详细信息,请使用 个体分布标识。该分析提供了不同方法的拟合优度度量,以支持您决定使用哪种方法。

用于 自动化能力分析 选择方法

用于 自动化能力分析 评估几种方法与数据的兼容性并做出合理的选择。

  1. 选择 统计 > 质量工具 > 能力分析 > 自动化
  2. 指定数据是按单列排列还是跨行排列。
  3. 输入流程的规格限。

分析先考虑分布,然后考虑变换。如果没有参数方法拟合数据,则分析使用非参数方法。结果包括提供合理拟合的第一种方法的能力报告。分布结果表显示方法评估的顺序、有关方法拟合的信息以及能力统计量。您可以为替代方法生成结果,以更详细地研究这些方法。

用于 自动化能力分析 选择方法的示例

工程师收集有关瓷砖翘曲程度的数据。数据分布未知,因此她对数据执行 个体分布标识 以确定能力分析的合理方法。

分布结果表显示了方法的评估顺序。在第一行中,安德森-达令检验的结论是,由于 p 值小于 0.05,因此数据不服从显著性 0.05 水平的正态分布。在第二行中,安德森-达林检验的结论是,Weibull 分布与数据是合理的拟合,因为 p 值大于 0.05。能力结果适用于威布尔分布,因为威布尔分布是列表中提供合理拟合的第一种方法。

工程师使用过程知识来考虑威布尔分布是否是一种合理的方法。例如,威布尔分布的边界为 0。在数据中,0 是表示未变形图块的边界。

该分析包括使用 Weibull 分布的能力分析。

自动化能力分布结果: 翘曲程度

分布位置尺度阈值形状PPpkCpk
正态2.92311.7860    0.01004210.57430.5838
Weibull*  3.2781  1.6937>0.250.5133 
对数正态0.84430.7444    <0.0050.4242 
最小极值3.86411.9924    <0.010.5362 
最大极值2.09581.4196    0.2128350.5130 
Gamma  1.2477  2.34280.2383370.4851 
Logistic2.79591.0162    0.01273470.5799 
对数 Logistic0.90970.4217    <0.0050.4090 
指数  2.9231    <0.00250.3780 
3 参数 Weibull  2.99690.20991.50490.4670970.4980 
3 参数对数正态1.37880.4184-1.4002    0.4961 
3 参数 Gamma  1.2314-0.01972.3898  0.4864 
3 参数对数 Logistic1.30430.2700-1.0940    0.4656 
2 参数指数  2.66790.2552  <0.010.3982 
Box-Cox 变换1.62370.5380    0.5743370.51160.5214
Johnson 变换0.01120.9949    0.7988950.4959 
非参数          0.6187 
*表示所选分布
对于非参数案例,能力统计量为 Cnpk。

用于 个体分布标识 查找适当的分布或转换

在执行能力分析之前使用 个体分布标识 来确定最适合您的数据的分布或变换。如果没有分布或变换与您的数据兼容,请考虑 能力分析(非参数)

  1. 选择 统计 > 质量工具 > 个体分布标识
  2. 选择您的数据是安排在单个列中还是跨多个行。
  3. 选择 使用所有分布和变换 或 并选择 指定 最多 4 个分布和变换进行测试。
如果非正态分布提供最佳拟合值,则使用下面的非正态能力模型之一来评估您的过程:
  • 非正态能力分析
  • 多变量非正态能力分析
  • 非正态 Capability Sixpack
当您设置分析时,说明可为您的数据提供最佳拟合值的非正态分布类型。
如果变换对您的数据最有效,请使用下面的正态能力模型之一来评估您的过程:
  • 正态能力分析
  • 正态 Capability Sixpack
  • 多变量正态能力分析
  • 组间/组内能力分析
设置正态能力分析时,单击 变换 并指示是使用 Johnson 变换还是 Box-Cox 变换以使数据服从正态分布。设置组间/组内能力分析时,单击 Box-Cox Box-Cox 变换以使数据服从正态分布

用于 个体分布标识 比较分布和变换拟合的示例

工程师收集有关瓷砖翘曲程度的数据。数据分布未知,因此她对数据执行 个体分布标识 以比较约翰逊变换后指数分布和正态分布之间的拟合优度。

指数分布

此概率图表明,指数分布的拟合优度不佳,其 p 值很低,足以否定数据服从指数分布的原假设。

进行了 Johnson 变换的正态分布

但是,对其应用 Johnson 变换后,您的数据接近正态分布,因为其 p 值较大,且几乎所有数据点都落在正态概率图的置信边界内。

在这两种分布中,进行了 Johnson 变换的正态分布与数据拟合得更好。因此,适当的分析是具有约翰逊变换的正态能力分析。