R 平方与终端节点数图显示每个树的 R2 值。默认情况下,初始回归树是 R2 值在最大 R2 值的树的 1 个标准误内的最小树。当分析使用交叉验证或检验数据集时,R2 值来自于验证样本。验证样本的值通常趋于平稳,并最终随着树变大而开始下降。
单击选择备择树可打开包含模型汇总统计量表的交互图。可使用该图调查性能相似的备择树。
选择树后,可以调查树状图上独特的终端节点。例如,您可能关注均值较大或标准差较小的节点。从详细视图中,您可以看到每个节点的均值、标准差和总计数。
右键单击树状图可执行以下交互:
节点继续分裂,直到终端节点无法再为了进一步分组而进行分裂。探索其他节点,看看哪些变量最值得关注。
然后,节点 2 按药物滥用的频率分裂,节点 8 按酒精使用分裂。终端节点 17 具有计划药物治疗 = 2、酒精使用 = 1 和转介来源 = 3、5、6、100、300、400、600、700 或 800 的案例。研究人员指出,终端节点 17 具有最高的均值、最小的标准差和最多的案例。
终端节点 1 的均值最小,标准差约为 4.3。由于终端节点 1 的均值约为 5.9,并且响应值不能为负,因此节点统计量表明终端节点 1 中的数据可能向右偏斜。
使用相对变量重要性图可查看哪些预测变量是树最重要的变量。
重要变量是树中的主分裂变量或代理分裂变量。改进得分最高的变量设置为最重要的变量,其他变量依次排序。相对变量重要性将重要性值标准化,以便于解释。相对重要性定义为相对于最重要预测变量的改进百分比。
相对变量重要性的值范围是 0% 到 100%。最重要变量的相对重要性始终为 100%。如果变量不在树中,则该变量就不重要。