项 | 说明 |
---|---|
拟合值 | |
xk | 第 k 个项。每个项都可以是单个预测变量、多项式项或交互作用项。 |
bk | 第 k 个回归系数的估计值 |
具有一个预测变量的回归模型中拟合值的标准误为:
具有多个预测变量的回归模型中拟合值的标准误为:
对于加权回归,在公式中包括权重矩阵:
当数据具有测试数据集或 K 折交叉验证时,公式相同。的值 s2 是从培训数据。设计矩阵和重量矩阵也来自训练数据。
项 | 说明 |
---|---|
s2 | mean square error |
n | number of observations |
x0 | new value of the predictor |
mean of the predictor | |
xi | i(序号) predictor value |
x0 | vector of values that produce the fitted values, one for each column in the design matrix, beginning with a 1 for the constant term |
x0 | transpose of the new vector of predictor values |
X | design matrix |
W | weight matrix |
对于加权回归,公式包括权重:
其中 tv 是 t 分布的 1–α/2 分位数, v 自由度(对于双侧区间)。对于单侧边界,tv 是 t 分布的 1–α 分位数, v 自由度。
当您使用检验数据集或 k 折叠交叉验证时,自由度和均方误来自训练数据集。
项 | 说明 |
---|---|
fitted value | |
quantile from the t distribution | |
degrees of freedom | |
mean square error | |
leverage for the i(序号) observation | |
wi | weight for the i(序号) observation |
项 | 说明 |
---|---|
yi | 观测的第 i 个响应值 |
第 i 个响应拟合值 |
标准化残差也称为“内部 t 化残差”。
项 | 说明 |
---|---|
ei | 第 i 个残差 |
hi | X(X'X)–1X' 的第 i 个对角线元素 |
s2 | 均方误 |
X | 设计矩阵 |
X' | 转置设计矩阵 |
对于加权回归,公式包括权重:
项 | 说明 |
---|---|
ei | i(序号) residual in the validation data set |
hi | leverage for the i(序号) validation row |
s2 | mean square error for the training data set |
wi | weight for the i(序号) observation in the validation data set |
也称为外部 t 化残差。公式为:
此公式的其他表现形式为:
估计第 i 个观测值的模型会从数据集中忽略第 i 个观测值。因此,第 i 个观测值无法对估计值产生影响。每个删后残差均具有学生 t 分布,其中具有 自由度。
项 | 说明 |
---|---|
ei | 第 i 个残差 |
s(i)2 | 未使用第 i 个观测值计算得出的均方误差 |
hi | X(X'X)–1X' 的第 i 个对角线元素 |
n | 观测值个数 |
p | 项数,包括常量 |
SSE | 误差平方和 |