拟合回归模型中拟合优度统计量的方法和公式

请选择您所选的方法或公式。

S

表示法

说明
MSE均方误

R-sq

R2 也称为确定系数。

公式

表示法

说明
yi i 个观测响应值
平均响应
i 个拟合响应

R-Sq(调整)

当调整的 R2 计算可以产生负值时,Minitab 会针对这些情况显示零。

表示法

说明
i 个观测响应值
i 个拟合响应
平均响应
n观测值个数
p模型中的项数

R-sq(预测)

当 R2(预测)的计算可以产生负值时,Minitab 会针对这些情况显示零。

表示法

说明
yi i 个观测响应值
平均响应
n 观测值个数
ei i 个残差
hi X(X'X)–1X' 的第 i 个对角线元素
X 设计矩阵

PRESS

用于评估模型的预测能力,计算公式为:

表示法

说明
n观测值个数
ei第 i 个残差
hi

第 i 个对角线元素为

X (X' X)-1X'

检验 S

检验 S 汇总了检验数据集中的数据值与拟合值之间的距离。检验 S 以响应的单位进行度量。

公式

其中

对于回归,

,对于加权回归

表示法

说明
number of rows in the test data set
i(序号) observed response value in the test data set
i(序号) fitted value for the response in the test data set
weight for the i(序号) observation in the test data set

检验 R 平方

检验 R2 是模型解释的检验数据集的响应变量中的变异百分比。检验 R2 的值介于 0% 和 100% 之间。(虽然检验 R2 的计算可以产生负值,但 Minitab Statistical Software 会针对这些情况显示 0。)

公式

其中,对于回归

,对于加权回归

总平方和的公式还取决于数据是否包括权重。对于回归,

,对于加权回归
其中

表示法

说明
number of rows in the test data set
i(序号) observed response value in the test data set
i(序号) fitted value for the response in the test data set
weight for the i(序号) observation in the test data set
mean of the response for the test data set
weighted mean of the response for the test data set

K 折叠 S

K 折叠 S 汇总了检验数据集中的数据值与拟合值之间的距离。K 折叠 S 以响应的单位进行度量。

公式

其中

对于回归,

,对于加权回归

表示法

说明
number of rows in fold j
i(序号) observed response value in fold j
i(序号) cross-validated fitted value for the response in fold j
Knumber of folds
wiweight for the i(序号) observation in fold j

K 折叠 R 平方

K 折叠 R2 是模型解释的数据折叠的响应变量中的变异百分比。K 折叠 R2 的值介于 0% 和 100% 之间。(虽然 K 折叠 R2 的计算可以产生负值,但 Minitab Statistical Software 会针对这些情况显示 0。)

公式

Minitab 计算每个折叠的误差平方和。这些计算对每个折叠使用相同的模型项,但系数的估计值可能不同。要计算 k 折叠 R2 统计量,将不同折叠的误差平方和相加。对于回归

,对于加权回归

然后,以下公式给出 K 折叠 R2 的方程:

表示法

说明
number of rows without missing values for the response or missing values for the predictors that form the candidate terms in the model
i(序号) observed response value in fold j
i(序号) cross-validated fitted value for the response in fold j
Knumber of folds
wijweight for the i(序号) observation in fold j
SSTotaltotal sum of squares for all of the data

K 折叠逐步 R 平方

K 折叠逐步 R 平方从一组候选项中评估模型中的项数。Minitab 在 k 折叠逐步 R 平方发生时为其显示负值。

公式

当逐步选择法为前进法并验证,且验证方法为 k 折叠交叉验证时,Minitab 计算 K 折叠逐步 R 平方。Minitab 执行前进法 K 次,忽略一次每个折叠的数据。每个折叠的模型可能不同。完成前进法过程后,Minitab 将对每个步骤中所有折叠的误差平方进行求和。Minitab 使用此总和计算 K 折叠逐步 R 平方。对于回归:

,对于加权回归:

然后,以下公式为步骤提供 k 折叠逐步 R2 值。

表示法

说明
number of rows without missing values for the response or missing values for the predictors that form the candidate terms in the model
i(序号) observed response value in fold j
i(序号) cross-validated fitted value for the response in fold j
Knumber of folds
wijweight for the i(序号) observation in fold j
SSTotaltotal sum of squares for all of the data

对数似然

对于未加权的分析,Minitab 使用以下方程:
对于具有观测值权重的分析,Minitab 使用以下方程:

权重为 0 的观测值不在分析中。

表示法

说明
n观测值个数
R模型的误差平方和
wii 个观测值的权重

AICc(Akaike 更正的信息标准)

在满足以下条件时不计算 AICc:.

表示法

说明
n观测值个数
p模型中系数的个数,包括常量系数

BIC(Bayesian 信息标准)

表示法

说明
p模型中系数的个数,包括常量系数
n观测值个数

Mallows Cp

表示法

说明
SSEp考虑采用的模型的平方和误差
MSEm使用所有候选项的模型的均方误
n观测值个数
p模型中的项数,包括常量
使用此网站,即表示您同意对数据分析和个性化内容使用 Cookie。  请阅读我们的政策