因子信息表显示设计中的因子、因子类型、水平数和水平值。
因子是您在试验中控制的变量。因子也称为独立变量、解释变量和预测变量。因子只能取有限数量的可能值,称为因子水平。因子可以取文本值或数值。数字因子在试验中使用一些控制值,即便很多值都可用也是如此。
使用因子信息表可验证是否按预期执行了分析。
在一般线性模型中,分子是固定或随机的。一般而言,如果调查人员控制因子水平,则因子是固定的。另一方面,如果调查人员从总体随机抽取因子水平作为样本,则因子是随机的。
例如,一名质量分析师计划研究在制造过程中可能会影响塑性强度的因子。分析师在试验中包含添加剂、温度和操作员。添加剂是可以为类型 A 或类型 B 的类别变量。温度是连续变量,但分析师计划只在试验中包含三种温度设置:100 °C、150 °C 和 200 °C。因为分析师控制试验中的这两个因子的水平,因此这些因子均为固定因子。另一方面,分析师决定从工厂总体中随机选择操作员。因此,操作员是随机因子。
因子 | 添加剂 | 温度 | 操作员 |
---|---|---|---|
类型 | 固定(F) | 固定(F) | 随机 |
水平 | A | 低 (100 °C) | A |
水平 | B | 中 (150 °C) | B |
水平 | 高 (200 °C) | C |
各个因子可以交叉或嵌套。当一个因子的每个水平与另一个因子的每个水平组合发生时,这两个因子就是交叉的。当一个因子的各个水平彼此类似但并不相同,并且每个都与另一个因子的不同水平组合发生时,这两个因子就是嵌套的。
例如,如果一种设计包含机器和操作员,若所有操作员使用了所有机器,则这些因子是交叉的。但是,如果每个机器具有不同组操作员,则操作员嵌套在机器中。
在因子信息表中,括号表示嵌套因子。例如,操作员(机器)表明操作员嵌套于机器中。
有关因子的更多信息,请转到因子和因子水平、什么是因子、交叉因子和嵌套因子?和什么是固定因子和随机因子之间的差值?。
Minitab 可以使用 (0, 1) 或 (−1, 0, +1) 编码方案以在模型中包含类别变量。(0, 1) 方案是回归分析的默认方案,而 (−1, 0, +1) 方案是方差分析和 DOE 的默认方案。在这两种方案之间的选择不会改变类别变量的统计显著性。但是,编码方案的确会改变系数和解释系数的方式。
验证显示的编码方案,以确保执行预期分析。解释类别变量的系数,如下所示:
如果您选择对模型中的协变量进行标准化,Minitab 将提供有关协变量标准化表中的方法的详细信息。
通常可使用标准化来集中变量、调整变量,或同时执行这两种操作。当您集中变量时,会降低由多项式项和交互作用项引起的多重共线性,这会提高系数估计值的精确度。大多数情况下,当您调整变量时,Minitab 会将不同的变量尺度转换为通用尺度,以便于对比系数的大小。
当使用 Box-Cox 变换时,估计的 λ (lambda) 是生成正态分布的变换响应值的最优值。默认情况下,Minitab 使用取整的 lambda 值。
Lambda 是 Minitab 用于变换响应数据的指数。例如,如果 lambda = -1,则所有响应值 (Y) 按以下方式变换:−Y-1 = −1/Y。如果 lambda 等于 0,这代表 Y 的自然对数,而不是 Y0 的自然对数。
λ (lambda) 的置信区间是可能包含从中提取样本的整个总体实际 λ 值的值范围。
由于样本的随机性,来自总体的两个样本不可能生成相同的置信区间。但是如果随机取样多次,则所获得的特定百分比的置信区间会包含未知的总体参数。这些包含参数的置信区间的百分比是区间的置信水平。
使用置信区间可评估样本的 lambda 估计值。
例如,当置信水平为 95% 时,包含总体 lambda 值的置信区间的置信度为 95%。置信区间有助于评估结果的实际意义。利用您的专业知识可以确定置信区间是否包含对您的情形有实际意义的值。如果区间因为太宽而无效,请考虑增加样本数量。
默认情况下,Minitab 将最优 λ (lambda) 值取整为最接近的半数,因为这些值相当于更为直观的变换。如果您希望使用最优值进行变换,请选择。
Lambda | 变换 |
---|---|
-2 | −Y-2 = −1 / Y2 |
-1 | −Y-1 = −1 / Y |
-.5 | −Y-.-.5 = −1 / (Y 的平方根) |
0 | 对数 (Y) |
.5 | Y..5 = Y 的平方根 |
1 | Y |
2 | Y2 |