Random Forests® 回归 的响应信息的方法和公式

注意

此命令适用于 预测分析模块单击此处了解更多关于如何激活模块的信息

如果将“使用测试集验证”添加到 OOB 验证中,则表格包括训练集和测试集的单独统计量。

N

当您添加“使用测试集验证”时,表格包括此统计量。这些数字是检验和训练集中未缺失的响应值数量。

N 百分比

当您添加“使用测试集验证”时,表格包括此统计量。这些数字是训练数据集中和检验数据集中的观测值百分比。

均值

一批数字的中心的常用度量。均值又称为平均数。均值是由所有观测值之和除以(非缺失)观测值个数得来的。

标准差

如果数据集包含 ,平均值为 ,则样本的标准差为:
说明
观测值
观测值的均值
N非缺失观测值个数

最小值

数据集中的最小值。

Q1

25% 的样本观测值小于或等于第一四分位数的值。因此,第一四分位数又称为第25个百分位数。

中位数

样本中位数位于数据的中间:至少有一半的观测值小于或等于它,至少有一半的观测值大于或等于它。

假设您有一个包含 N 个值的数据集。要计算中位数,首先按照从小到大的顺序对数据值进行排序。如果 N 为奇数,则样本中位数是位于中间的值。如果 N 为偶数,则样本中位数是两个中间值的平均数。

Q3

75% 的样本观测值小于或等于第三个四分位数的值。因此,第三个四分位数又称为第75 个百分位数。

最大值

数据集中的最大值。