什么是数据变换?

如果您使用为正态数据设计的能力分析(如正态能力分析),您的数据必须服从正态分布。如果您的数据不是正态的,则分析结果可能不准确。有时,您可以通过向数据应用一个函数来变换非正态数据,该函数可以更改数据的值,使数据更加服从正态分布。

例如,假设您需要针对比萨饼送货所需的时间执行能力分析。由于存在一个最短送货时间,但未设置最长送货时间,则数据会向右偏斜。可以通过应用变换来去除数据中的严重偏斜。

变换前

披萨饼送货时间向右偏斜,而且未呈正态分布。

变换后

数据在变换后,更加服从正态分布。

Box-Cox 变换有什么作用?

Box-Cox 变换是一种幂变换 (W = Y**λ),Minitab 会根据它来确定 λ 的最佳值。

尽管 lambda (λ) 的最佳估计值可能是 -5 到 5 之间的任何数字,但在任何实际情况下,您都需要一个与容易理解的变换对应的 λ 值,如平方根 (λ=0.5) 或自然对数 (λ=0)。

Johnson 变换有什么作用?

Johnson 变换与 Box-Cox 变换使用的算法不同。Johnson 变换函数是从 Johnson 系统中的三个系列的函数中选择的。由于函数通过更改参数可涵盖大量分布,因此 Minitab 通常会找到可接受的变换。Minitab 选择的系列称为“最佳变换类型”。

执行使用数据变换的正态能力分析

如果您的数据是非正态数据,您可以尝试变换,这样便可以使用正态能力分析。

  1. 选择统计 > 质量工具 > 能力分析 > 正态。单击变换
  2. 选择变换:
    Box-Cox 变换
    此变换易于理解并提供子组内能力统计量和整体能力统计量。
    Johnson 变换
    这种变换非常强大,可以用于包括零和负值在内的数据,但它较为复杂,只能提供整体能力统计量。可以在 Box-Cox 变换找不到合适的变换时使用。
  3. 指定变换选项,如果您喜欢的话,请单击确定
如果您数据的变换不起作用,您应该使用个体分布标识调查非正态分布,以便可以使用非正态能力分析。