拟合回归模型线性回归和 的方法

请选择您所选的方法或公式。

加权回归

加权最小二乘回归是处理具有非恒定方差的观测值的方法。如果方差不是恒定的,则观测值应具备以下特点:

  • 应当为较大的方差指定相对较小的权重
  • 应当为较小的方差指定相对较大的权重

权重的常用选项是响应中纯误差方程之逆。

估计系数的公式如下所示:
这相当于将加权 SS 误差最小化。

表示法

说明
X设计矩阵
X'转置设计矩阵
W对角线上的 n x n 权重矩阵
Y响应值向量
n观测值个数
wi第 i 个响应值的权重
yi第 i 个观测值的响应值
第 i 个观测值的拟合值

Box-Cox 变换

Box-Cox 变换选择能够最小化残差平方和的 lambda 值(如下所示)。由此生成的变换是 Yλ(当 λ ≠ 0 时)及 ln(Y)(当 λ = 0 时)。当 λ < 0 时,Minitab 还会将变换后响应乘以 −1,以维持未变换响应的顺序。

Minitab 搜索介于 −2 和 2 之间的最优值。此区间以外的值生成的拟合可能较差。

以下是一些常见的变换,其中 Y' 是数据 Y 的变换:

Lambda (λ) 值 变换
λ = 2 Y′ = Y 2
λ = .5 Y′ =
λ = 0 Y′ = ln(Y )
λ = −.5
λ = −1 Y′ = −1 / Y

回归方程

对于具有多个预测变量的模型,方程为:

y = β0 + β1x1 + ... + βkxk + ε

拟合方程为:

在只包含一个预测变量的简单线性回归中,模型为;

y=ß0+ ß1x1+ε

利用回归估计 β0ß0b1ß1的拟合方程为:

带有范畴变量的方程

当你在回归模型中包含类别变量时,有两种选项可以显示回归方程:
  • 每组类别预测水平的独立方程
  • 单个方程
这两个选项是等价的。例如,假设数据具有以下变量:
C1
响应变量
C2
连续预测器
C3
一个类别预测变量,水平为 红色
这些独立方程如下:
  • 蓝:C1 = 0.184 + 0.1964*C2
  • 红:C1 = 0.011 + 0.1964*C²

单个方程使用指示变量表示类别变量。

C1 = 0.184 + 0.1964*C2 + 0.0*C3_蓝 - 0.173*C3_红

在单一方程中,如果观测值是蓝色, C3_蓝 等于1,否则为0。如果观测值是红色,C3_红 等于1,否则为0。对每个组,代入指示变量以验证单个方程是否与两个独立方程相同。
  • 蓝色观测(C3_蓝 = 1,C3_红 = 0):C1 = 0.184 + 0.1964*C2 + 0.0*1- 0.173*0 = 0.184 + 0.1964*C2
  • 红色观测(C3_蓝 = 0, C3_红 = 1:C1 = 0.084 + 0.1964*C2 + 0.0*0 - 0.173*1 = 0.011 + 0.1964*C2

表示法

说明
y响应
xk第K个任 期。每个项可以是单个预测变量、多项式项或交互作用项。
ßk第k 群体回归系数
ε服从平均值为 0 的正态分布的误差项
BK第K个体 回归系数的估计
拟合响应

设计矩阵

设计矩阵包含具有 n 行的矩阵 (X) 中的预测变量,其中 n 是观测值数。模型中的每个系数都有对应列。

类别预测变量使用 1、0 或 -1、0、1 编码方式进行编码。X 不包含因子的参考水平列。

要计算交互作用项的列数,请将交互作用项中预测变量的所有对应值相乘。例如,假设预测变量 A 对应的第一个观测值为 4,预测变量 B 对应的值为 2。在设计矩阵中,A 和 B 之间的交互作用项将表示为 8 (4 x 2)。

X'X 逆

p x p 矩阵,其中,p 是模型中系数的个数。将 x'x 逆乘以 MSE 可生成系数的方差-协方差矩阵。Minitab 还会使用 x'x 逆计算回归系数和帽子矩阵。

Minitab 如何从中的回归方程中删除高度相关的预测变量拟合回归模型

使 rij 为与 Xi 和 Xj 相关联的当前扫掠矩阵中的元素。

一次输入或删除一个变量。对于当前不在其 rkk ≥ 1(默认值为 0.0001 的公差) 的模型中的独立变量,以及当前位于符合以下条件的模型中的每个变量 Xj,可以输入 Xk

要从回归方程中删除高度相关的预测变量,Minitab 将执行以下步骤:
  1. Minitab 针对相关矩阵 R 执行 SWEEP 方法,并将 X1 … Xp 作为随机变量进行处理。
  2. 对于任何连续的预测变量,Minitab 将元素 rkk 与公差进行比较;rkk ≥ 公差,其中 k = 1 到 p。
  3. 对于当前位于模型中的每个变量 Xj,Minitab 检查 (rjj – rjk * (rkj / rkk)) * 公差是否 ≤ 1。
    注意

    其中,rkk、rjk、rjj 是在执行 k 步长 SWEEP 操作之后,Xj 和 Xk 变量相应的对角和非对角元素。

  4. 否则,预测变量将无法通过检验并被从模型中删除。
    注意

    默认的公差值为 8.8e–12。

注意

您可以使用 REGRESS 会话命令的 TOLERANCE 子命令来强制 Minitab 将某个预测变量保留在与另一个预测变量高度关联的模型中。但是,降低公差会很危险,可能会产生不准确的数字结果。