分类有效性 - CART® 分类

选择需要的方式或公式。

这些统计量显示在表中,该表显示了最优和最差终端节点的分类有效性。通常,行按类别概率的大小排列。1E-12 范围内的值为结。Minitab 按加权计数对结进行排序。如果加权计数也为结,则 Minitab 按节点 ID 对结进行排序。

N 百分比

以下公式给出了节点中数据的百分比。此公式适用于无权重数据:

以下公式适用于有权重数据:

表示法

说明
节点中的案例数 k
N数据集中的案例数
节点中第 j 个案例的权重
数据集中第 i 个案例的权重

事件概率和非事件概率

Minitab 会引用二值响应变量的事件概率和非事件概率。
以下公式给出了节点中的事件百分比。此公式适用于无权重数据:

以下公式适用于有权重数据:

非事件概率定义如下:

表示法

说明
节点中的事件数 k
节点中的案例数 k
节点中第 j 个事件的权重
节点中第 i 个观测值的权重

类别概率和非类别概率

Minitab 会引用多项式响应变量的类别概率和非类别概率。
以下公式给出了节点中类别的百分比。此公式适用于无权重数据。

以下公式适用于有权重数据:

非类别概率定义如下:

表示法

说明
节点中类别 y 的案例数 k
节点中的案例数 k
节点中类别 y 的第 j 个案例的权重
节点中第 i 个案例的权重

优势

优势的公式取决于响应变量是二值变量还是多项式变量。

二值响应变量

多项式响应变量