拟合回归模型中模型的方法和公式

请选择您所选的方法或公式。

加权回归

加权最小二乘回归是处理具有非恒定方差的观测值的方法。如果方差不是恒定的,则观测值应具备以下特点:

  • 应当为较大的方差指定相对较小的权重
  • 应当为较小的方差指定相对较大的权重

权重的常用选项是响应中纯误差方程之逆。

估计系数的公式如下所示:
这相当于将加权 SS 误差最小化。

表示法

说明
X设计矩阵
X'转置设计矩阵
W对角线上的 n x n 权重矩阵
Y响应值向量
n观测值个数
wi第 i 个响应值的权重
yi第 i 个观测值的响应值
第 i 个观测值的拟合值

Box-Cox 变换

Box-Cox 变换选择能够最小化残差平方和的 lambda 值(如下所示)。由此生成的变换是 Yλ(当 λ ≠ 0 时)及 ln(Y)(当 λ = 0 时)。当 λ < 0 时,Minitab 还会将变换后响应乘以 −1,以维持未变换响应的顺序。

Minitab 搜索介于 −2 和 2 之间的最优值。此区间以外的值生成的拟合可能较差。

以下是一些常见的变换,其中 Y' 是数据 Y 的变换:

Lambda (λ) 值 变换
λ = 2 Y′ = Y 2
λ = .5 Y′ =
λ = 0 Y′ = ln(Y )
λ = −.5
λ = −1 Y′ = −1 / Y

回归方程

对于具有多个预测变量的模型,方程为:

y = β0 + β1x1 + … + βkxk + ε

拟合方程为:

在只包含一个预测变量的简单线性回归中,模型为;

y=ß0+ ß1x1+ε

使用回归估计 b0 代替 ß0b1 代替 ß1,拟合方程为:

表示法

说明
y响应
xkk 项。每一项都可以是单个预测变量、多项式项或者交互作用项。
ßkk 个总体回归系数
ε服从平均值为 0 的正态分布的误差项
bk对第 k 个总体回归系数的估计
拟合响应

设计矩阵

设计矩阵包含具有 n 行的矩阵 (X) 中的预测变量,其中 n 是观测值数。模型中的每个系数都有对应列。

类别预测变量使用 1、0 或 -1、0、1 编码方式进行编码。X 不包含因子的参考水平列。

要计算交互作用项的列数,请将交互作用项中预测变量的所有对应值相乘。例如,假设预测变量 A 对应的第一个观测值为 4,预测变量 B 对应的值为 2。在设计矩阵中,A 和 B 之间的交互作用项将表示为 8 (4 x 2)。

X'X 逆

p x p 矩阵,其中,p 是模型中系数的个数。将 x'x 逆乘以 MSE 可生成系数的方差-协方差矩阵。Minitab 还会使用 x'x 逆计算回归系数和帽子矩阵。
使用此网站,即表示您同意对数据分析和个性化内容使用 Cookie。  请阅读我们的政策