导入/导出数据准备步骤的示例

要轻松应用数据准备步骤来清理未来数据集中的数据,请导出这些步骤。然后,将步骤导入到新的数据连接。

指定数据准备步骤

从数据预览中,确定清理数据所需的数据步骤。有关更多信息,请转到 数据准备步骤

在此示例中,我们收集有关汽车事故保险索赔的数据。由于我们在许多文件中都有相似的数据,因此我们希望保存数据准备步骤以应用于新数据集。我们创建了 8 个数据步骤:
  1. 初始清理以适当地修剪空格并设置日期格式。
  2. 删除驱动程序年龄大于 100 岁的无效行。
  3. 将 M 更改为 male。
  4. 将 F 更改为 female。
  5. 将 marital status 从 numeric 数据类型更改为 text 数据类型。
  6. 将 0 更改为 no。
  7. 将 1 更改为 yes。
  8. 将性别和婚姻状况合并到一个列中。

导出数据准备步骤

要保存这些步骤,请将它们导出为 .mdcs 文件。导出文件仅包含您创建的数据准备步骤,而不包含初始清理步骤。
  1. 从下拉菜单中选择 导出步骤
  2. 该文件将保存到您的下载文件夹或其他保存位置,并使用与数据文件相同的名称。相应地更改名称。

导入数据准备步骤

要将这些步骤应用于新的数据文件,请将它们作为 .mdcs 文件导入。从下拉菜单中选择 导入步骤