重新编码为数字值

数据 > 重新编码 > 到数字

指定要重新编码的列

重新编码以下列中的值中,输入一个或多个包含要重新编码的值的列。这些列都必须具有相同的数据类型:数字、日期/时间或文本。

指定方法和值

选择重新编码方法,然后输入要重新编码的值和经过重新编码的值。

对一定范围的值重新编码

(仅限数字或日期/时间来源数据)将每个范围的数字或日期/时间值重新编码为一个数字值。例如,可以将小于 0 的所有值更改为 0。要指定需要重新编码的值和经过重新编码的值,请完成以下步骤。

  1. 对于每个范围的数字或日期/时间值,请在表中输入下端点值、上端点值和已重新编码值。例如,可以输入下表中显示的值。
    下端点 上端点 重新编码的值
    0 10 1
    10 100 2
    100 1000 3
    1000 999999 *
  2. 对于要包括的端点,指示您希望如何对您在表中输入的值重新编码。例如,如果您输入上表中显示的值,并选择仅下端点,则 0 将重新编码为 1,10 将重新编码为 2,以此类推。

对单个值重新编码

将各个值重新编码为不同的单个数字值。例如,可以将“红色”的每个实例更改为 3。

要对单个值重新编码,请在已重新编码值下面相应的当前值旁边,输入新值。

对单个值重新编码

将一个数字值重新编码为另一个数字值。例如,可以将 -999 的每个实例更改为缺失值(用 * 表示)。要指定需要重新编码的值和经过重新编码的值,请完成以下步骤。

  1. 当前值中,选择要更改的值。
  2. 已重新编码值中,输入新的数字值。

对频率最低的值重新编码

将出现频率最低的值重新编码为单个值。例如,可以将出现次数少于 5 的值更改为缺失值(用 * 表示)。要指定需要重新编码的值和经过重新编码的值,请完成以下步骤。

  1. 将出现次数少于此次数的值重新编码到一个类别中中,输入一个数字。将对出现次数小于此值的值重新编码。例如,如果您输入 5,将对出现次数为 4 或更少的值重新编码。
  2. 已重新编码值中,输入新值(例如,*)。

对频率最低的百分比重新编码

将出现频率最低的值重新编码为单个值。例如,可以将 20% 的最不频繁值更改为缺失值(用 * 表示)。Minitab 使用 Pareto 图方法确定要重新编码的值。Minitab 按照频率从最高到最低的顺序对值排序,然后为每个值确定累积百分比。当累积百分比超过指定的百分比时,将对剩余的值重新编码。

要指定需要重新编码的值和经过重新编码的值,请完成以下步骤。

  1. 在此百分比后,将剩余值重新编码到一个类别中中,输入一个百分比。例如,如果您输入 80,则将对前 80% 的唯一值之后的每个唯一值重新编码。
  2. 已重新编码值中,输入新值(例如,*)。

指定存储位置

已重新编码列的存储位置中,选择以下存储位置之一:
  • 在原始列中:将原始列替换为经过重新编码的列。
  • 在当前工作表的结尾:将经过重新编码的列放在工作表中包含值的最后一列的后面。
  • 在当前工作表的指定列中:将经过重新编码的列放在指定的列中。在中,输入要重新编码的每个数据列的列编号(例如,C3)或列名。如果列名中包含多个词,请用单引号将名称引起来。
  • 在新工作表中:将经过重新编码的列放在新工作表中。在名称中,输入新工作表的名称。
  • 在指定工作表的结尾:将经过重新编码的列放在已打开的指定工作表中包含值的最后一列的后面。在名称中,选择用于放置重新编码列的工作表。

指定是否显示汇总表

选择显示汇总表可显示已执行命令的汇总。