指定二值 Logistic 回归的验证方法 拟合二元 Logistic 模型

统计 > 回归 > 二元 Logistic 回归 > 拟合二元 Logistic 模型 > 验证

预测分析模块 > 二值 Logistic 回归 > 验证方式

选择用于检验模型的验证方法。通常,对于较小的样本,K 折叠交叉验证方法比较合适。对于较大的样本,可以选择使用一部分案例来进行训练和检验。

分析不验证模型。

K 折叠交叉验证

完成以下步骤以使用 K 折叠交叉验证。
  1. 从下拉列表中,选择K 折叠交叉验证
  2. 选择下列项之一,指定是随机分配折叠还是使用 ID 列来分配。
    • 随机分配每个折叠的行:选择此选项可以让 Minitab 随机选择每个折叠的行。您可以指定折叠数。大多数情况下,默认值 10 效果良好。使用更小的 K 值可能会引入更多的偏倚;但是,K 值越大,引入的变异性可能更多。也可以为随机数生成元设置基数。
    • 按 ID 列分配每个折叠的行:选择此选项可选择要包含在每个折叠中的行。在 ID 列中,输入标识折叠的列。ID 列中具有相同值的每一行都位于同一折叠中。
    • (可选)选择存储 K 折叠交叉验证的 ID 列以保存 ID 列。

使用测试集验证

完成以下步骤,将数据分为训练数据集和检验数据集。
  1. 从下拉列表中,选择使用测试集验证
  2. 选择下列项之一,指定是随机选择一部分行还是使用 ID 列来选择。
    • 随机选择部分行作为测试集:选择此选项可以让 Minitab 随机选择检验数据集。您可以指定在检验数据集中使用的数据量。大多数情况下,默认值 0.3 效果良好。您希望在检验数据集中包含足够的数据,以便充分评估模型。如果您不确定模型的形式,则较大的检验数据集可提供更有力的验证。您还希望在训练数据集中包含足够的数据,以便充分估计模型。通常,具有较多预测变量的模型需要较多的训练数据来进行估计。
    • 按 ID 列定义训练/测试拆分:选择此选项可自行选择要包含在检验样本中的行。在ID 列中,输入列以指示哪些行用于检验样本。ID 列必须仅包含 2 个值。在测试集水平中,选择用作检验样本的水平。
  3. (可选)选中存储训练/测试拆分的 ID 列以保存 ID 列。