初始数据清理步骤

将数据集导入 Minitab Data Center时,将根据初始清理设置清理整个数据集。
初始清理步骤始终位于步骤列表中的第一个步骤,并且是唯一影响所有列的步骤。
注意

无法删除或移动初始清理步骤。

确认如何处理空格、不可打印字符、具有区域设置的日期、缺失值和文本大小写不一致的默认选项。这些选择适用于整个数据集。
  1. 要查看所有步骤,请选择 打开步骤
  2. 打开步骤设置以指定初始数据清理选项。
  3. 更改此文件的任何默认设置。
    • 清除空格 单词之间只留下一个空格,没有任何其他空格字符,如 Tab。此外,还会删除第一个单词之前和最后一个单词之后的所有空格。
    • 删除不可打印的字符 删除格式标记,如换行符和制表符。
    • 根据区域设置来设置日期格式 使用全局 Minitab Solution Center 设置的区域设置。
    • 创建长度相等的列 使用缺失值填充空单元格,以使所有列具有相同的行数。选择 删除每列中具有缺失值的行 以删除空行。
      注意

      某些数据准备步骤要求所有数据列具有相同的行数。有关更多信息,请转到 不相等的列长度

    • 规范化大小写 指定文本值的字母大小写。
      • 不规范化保留文件中的原始文本。
      • 大写 将所有字母大写。

        例如, SALES ASSOCIATE

      • 小写 不将任何字母大写。

        例如, sales associate

      • 正确的大小写将每个单词的首字母大写。

        例如, Sales Associate

      • 句子大小写将第一个单词的首字母大写。

        例如, Sales associate

  4. 选择 确定 以保存更改。