Minitab 可以使用 (0, 1) 或 (−1, 0, +1) 编码方案以便在模型中包含类别变量。(0, 1) 方案是回归分析的默认方案,而 (−1, 0, +1) 方案是方差分析和 DOE 的默认方案。在这两种方案之间的选择不会改变类别变量的统计显著性。但是,编码方案的确会改变系数和解释系数的方式。
验证显示的编码方案,以确保执行预期分析。解释类别变量的系数,如下所示:
如果您选择对模型中的连续预测变量进行标准化,Minitab 将提供有关连续预测变量标准化表中的方法的详细信息。
通常可使用标准化来集中变量、调整变量,或同时执行这两种操作。当您集中变量时,会降低由多项式项和交互作用项引起的多重共线性,这会提高系数估计值的精确度。大多数情况下,当您调整变量时,Minitab 会将不同的变量尺度转换为通用尺度,以便于对比系数的大小。
当使用 Box-Cox 变换时,估计的 λ (lambda) 是生成正态分布的变换响应值的最优值。默认情况下,Minitab 使用取整的 lambda 值。
Lambda 是 Minitab 用于变换响应数据的指数。例如,如果 lambda = -1,则所有响应值 (Y) 按以下方式变换:−Y-1 = −1/Y。如果 lambda 等于 0,这代表 Y 的自然对数,而不是 Y0 的自然对数。
λ (lambda) 的置信区间是可能包含从中提取样本的整个总体实际 λ 值的值范围。
由于样本的随机性,来自总体的两个样本不可能生成相同的置信区间。但是如果随机取样多次,则所获得的特定百分比的置信区间会包含未知的总体参数。这些包含参数的置信区间的百分比是区间的置信水平。
使用置信区间可评估样本的 lambda 估计值。
例如,当置信水平为 95% 时,包含总体 lambda 值的置信区间的置信度为 95%。置信区间有助于评估结果的实际意义。利用您的专业知识可以确定置信区间是否包含对您的情形有实际意义的值。如果区间因为太宽而无效,请考虑增加样本数量。
默认情况下,Minitab 将最优 λ (lambda) 值取整为最接近的半数,因为这些值相当于更为直观的变换。如果您希望使用最优值进行变换,请选择。
Lambda | 变换 |
---|---|
-2 | −Y-2 = −1 / Y2 |
-1 | −Y-1 = −1 / Y |
-.5 | −Y-.-.5 = −1 / (Y 的平方根) |
0 | 对数 (Y) |
.5 | Y..5 = Y 的平方根 |
1 | Y |
2 | Y2 |
使用检验数据集时,该表将显示检验数据集内数据的百分比。使用交叉验证时,该表将显示折叠数。当您指定的列用于指定检验数据集内具有哪些观测值或者每个折叠中具有哪些观测值时,该表将显示该列的标题。
验证结果中的验证方法,以确保执行了预期分析。