指定先验概率和误分类成本 - CART® 分类

统计 > 预测分析 > CART® 分类 > 先验/成本

响应水平的先验概率

先验概率是指在收集数据之前,观测值落入某个组中的概率。如果您未指定先验概率,Minitab 则假定所有组的概率相等。
  • 所有水平具有相同概率:默认情况下,将对所有响应水平使用相等的先验概率。例如,如果响应有 4 个水平,则每个水平均设置为 0.25。
  • 概率匹配总样本频率:根据样本比例设置先验概率。例如,如果观测值总数为 1000,250 为水平 1,475 为水平 2,100 为水平 3,175 为水平 4,则 Minitab 将 0.25、0.475、0.10 和 0.175 的比例用于每个水平。
  • 指定每个水平的先验概率:为每个水平设置先验概率。每个值都必须介于 0 和 1 之间。所有水平的概率之和必须为 1。

误分类成本

指定误分类的成本。默认情况下,Minitab 使用相等的成本 1。要表示更高的成本,请使用更大的值。成本必须大于 0。

例如,下表反映:对潜在客户进行误分类的成本是对不感兴趣的客户进行误分类的成本的 10 倍。各成本的比率是相关的,而不是实际成本。

预测水平
实际水平 是(事件)
是(事件)   10
1