分析因子设计中拟合值与残差的方法和公式

拟合

表示法

说明
拟合值
xkk 个项。每个项都可以是单个预测变量、多项式项或交互作用项。
bkk 个回归系数的估计值

残差

残差是观测值与相应拟合值之间的差分。该模型不解释这部分观测值。观测值的残差为:

表示法

说明
yi观测的第 i 个响应值
i 个响应拟合值

标准化残差 (Std Resid)

标准化残差也称为“内部 t 化残差”。

公式

表示法

说明
ei i 个残差
hi X(X'X)–1X' 的第 i 个对角线元素
s2 均方误
X设计矩阵
X'转置设计矩阵

删后(t 化)残差

也称为外部 t 化残差。公式为:

此公式的其他表现形式为:

估计第 i 个观测值的模型会从数据集中忽略第 i 个观测值。因此,第 i 个观测值无法对估计值产生影响。每个删后残差均具有学生 t 分布,其中具有 自由度。

表示法

说明
ei第 i 个残差
s(i)2未使用第 i 个观测值计算得出的均方误差
hi X(X'X)–1X' 的第 i 个对角线元素
n观测值个数
p项数,包括常量
SSE误差平方和

整区残差

由裂区设计中的整区变异导致的观测值部分(在解释模型项之后)。

表示法

说明
整个模型的拟合值(包括整区误差项以及固定项)
仅采用固定效应项(而不是整区误差项)的拟合值

拟合值的标准误(拟合值 SE)

具有一个预测变量的回归模型中拟合值的标准误为:

具有多个预测变量的回归模型中拟合值的标准误为:

对于加权回归,在公式中包括权重矩阵:

当数据具有测试数据集或 K 折交叉验证时,公式相同。的值 s2 是从培训数据。设计矩阵和重量矩阵也来自训练数据。

表示法

说明
s2mean square error
nnumber of observations
x0new value of the predictor
mean of the predictor
xii(序号) predictor value
x0 vector of values that produce the fitted values, one for each column in the design matrix, beginning with a 1 for the constant term
x0transpose of the new vector of predictor values
Xdesign matrix
Wweight matrix

裂区设计的拟合值的标准误(拟合值标准误)

系数的标准误是协方差矩阵的对角线元素的平方根:
给定点的拟合值的标准误(用于置信区间)是:
在预测区间中使用的标准误是:

表示法

说明
被计算为 MSE(SP) 的子区方差分量
X因子、协变量、区组和整区误差项的效应的 n × p 设计矩阵
整区方差分量,其在平衡设计中具有以下公式:
m整区中的子区数
Z整区指示符的 n × w 矩阵(所有 1 和 0)
n数据行数
p系数的数量
w整区数
x预测变量水平的行向量
β 的协方差矩阵
β系数向量

置信区间

一组给定预测变量值的估计平均响应将落入的范围。

公式

表示法

说明
一组给定预测变量值的拟合响应值
α类型 I 误差率
n观测值个数
p模型参数个数
S 2(b)系数的方差-协方差矩阵
s 2均方误
X设计矩阵
X0给定预测变量值的矢量,具有 1 列和 p
X'0具有 1 行和 p 列的预测变量值的新矢 量的转

预测区间

预测区间是新观测值的拟合响应预计将落入的范围。

公式

Notation

说明
s(Pred)
一组给定预测变量值的拟合响应值
α显著性水平
n观测值个数
p模型参数个数
s 2均方误
X预测变量矩阵
X0给定预测变量值的矢量,具有 1 列和 p
X'0具有 1 行和 p 列的预测变量值的新矢 量的转