CART® 分类的相对变量重要性图

使用相对变量重要性图可确定哪些预测变量是分类树最重要的变量。

相对变量重要性图按预测变量对模型改进的影响大小顺序标绘预测变量。重要变量是用作树中主分裂变量或代理分裂变量的变量。改进得分最高的变量设置为最重要的变量,其他变量按重要性依次排序。相对变量重要性将重要性值标准化,以便于解释。相对重要性定义为相对于重要性为 100% 的最重要预测变量的改进百分比。

相对重要性的计算方法是将每个变量重要性得分除以变量的最大重要性得分,然后再乘以 100%。

解释

相对变量重要性的值范围是 0% 到 100%。最重要变量的相对重要性始终为 100%。如果某个变量在分类树中根本没有使用,则该变量就不重要。

在本示例中,最重要的预测变量是“疼痛类型”。如果将顶部预测变量“疼痛类型”的贡献计为 100%,则下一个重要变量“主要血管”的贡献为 86.5%。这表示在您选择的分类树中,“主要血管”的重要性是“疼痛类型”的 86.5%。