此命令适用于 预测分析模块。单击此处了解更多关于如何激活模块的信息。
使用Random Forests® 分类为一个具有很多连续和类别预测变量的类别响应创建高性能预测模型。Random Forests® 分类将来自很多 CART® 树的信息相结合,可实现数据挖掘技术领域的实质性改进。
Random Forests® 分类可以帮助您深入洞察各种应用,包括制造质量控制、药物发现、欺诈检测、信用评分和流失预测。使用获得的结果确定重要变量,从而识别数据中具有所需特征的组,并预测新观测值的响应值。例如,市场研究人员可以使用Random Forests® 分类来识别对特定计划具有更高响应率的客户,并预测这些响应率。
CART® 分类是有效的数据探索分析工具,它提供了易于理解的模型,可以快速确定重要的预测变量。但是,使用CART® 分类进行初步探索后,考虑使用TreeNet® 分类或Random Forests® 分类作为必要的后续步骤。
Random Forests® 分类输出包括相对变量重要性图、ROC 曲线以及提升和收益图。这些图可帮助您评估模型中的变量是否可以非常准确地预测响应类别,并帮助您确定可实现预测准确度的最重要预测变量。当您希望控制设置以实现最优生产结果时,此信息非常有用。
该方法由加州大学伯克利分校的 Leo Breiman 和 Adele Cutler 研发。
要执行Random Forests® 分类,请选择 。
如果要尝试使用具有类别响应变量的参数回归模型,请使用拟合二元 Logistic 模型。