输入数据 - CART® 分类

统计 > 预测分析 > CART® 分类

选择最能描述数据的选项。

二元响应变量

如果分类响应数据有两个类别(如通过和失败),则完成以下步骤。

  1. 从下拉列表中选择 二元响应变量
  2. 响应中,输入包含二值响应的列。值可以是数字或文本。
  3. 响应事件中,选择分析将描述的事件。 默认情况下,选择第二个响应水平作为响应事件。更改响应事件并不影响整体显著性,但会使结果更有意义。
  4. 连续预测变量中,输入可以解释或预测响应变化的连续变量。 连续预测变量必须使用数字值。
  5. 类别预测变量中,输入可以解释或预测响应变化的分类变量。 分类预测变量可以使用文本或数字值。
在此工作表中,“购买” 是指示消费者是否购买了新品牌谷类食品的二值响应。响应事件为 “是”“收入”“儿童” 为连续预测变量。“商店”“收看广告” 为类别预测变量。

工作表中的第一行显示消费者购买了新品牌的谷类食品。该消费者的收入为 37000 美元,在 A 商店购物,有 1 个孩子,看了谷类食品的广告。

C1-T C2 C3-T C4 C5-T
购买 收入 商店 孩子 收看广告
37,000 美元 A 1
47,000 美元 A 3
34,000 美元 A 0
58,000 美元 B 0

多项式响应

如果分类响应变量有三个或更多类别(如轿车、卡车和 SUV),则完成以下步骤。

  1. 从下拉列表中选择 多项式响应
  2. 响应中,输入包含分类响应的列。值可以是数字或文本。
  3. 连续预测变量中,输入可以解释或预测响应变化的连续变量。 连续预测变量必须使用数字值。
  4. 类别预测变量中,输入可以解释或预测响应变化的分类变量。 分类预测变量可以使用文本或数字值。
在此工作表中,“目标” 是指示贷款申请人是低风险、中风险还是高风险的多项式响应。“收入”“卡片数” 为连续预测变量。“婚姻” 为类别预测变量。

工作表中的第一行显示了一位低风险申请人,收入为 2399,有 3 张信用卡,而且是单身。

C1-T C2 C3 C4-T
目标 收入 卡片数 婚姻
2399 3 单身
2915 5 单身
3100 0 已婚
1500 8 已婚