从数据预览中,确定清理数据所需的数据步骤。有关更多信息,请转到 数据准备步骤。
在此示例中,我们收集有关汽车事故保险索赔的数据。由于我们在许多文件中都有相似的数据,因此我们希望保存数据准备步骤以应用于新数据集。我们创建了 8 个数据步骤:
- 初始清理以适当地修剪空格并设置日期格式。
- 删除驱动程序年龄大于 100 岁的无效行。
- 将 M 更改为 male。
- 将 F 更改为 female。
- 将 marital status 从 numeric 数据类型更改为 text 数据类型。
- 将 0 更改为 no。
- 将 1 更改为 yes。
- 将性别和婚姻状况合并到一个列中。
