MARS® 回归选择分析选项

预测分析模块 > MARS® 回归 > 选项
注意

此命令适用于 预测分析模块单击此处了解更多关于如何激活模块的信息

选择分析选项。

最优模型的选择标准
在以下条件之间进行选择,以选择模型的最佳基函数数。此选择不会影响对基函数的搜索。如果 2 个准则选择相同数量的基函数,则 2 个准则中的模型是相同的。
  • R 平方: 选择此选项可显示具有最大 R 平方值的模型的结果。
  • 平均绝对偏差: 选择此选项可显示平均绝对偏差最小的模型的结果。
基函数的最大数量
大多数情况下,默认值 30 效果良好。当 30 个基函数对于数据来说似乎太小时,请考虑更大的值。例如,当您认为超过 30 个预测变量很重要时,请考虑较大的值。
如果您不确定 30 是否足够,请查看初始结果。例如,如果 R 平方值随着分析添加基函数而呈上升趋势,则较大的值更有可能改善模型的拟合。
节之间的最小观测值数
允许 MARS® 选择
分析使用样本数量和模型复杂性来自动选择一个值。在大多数情况下,自动值效果很好。
用户指定的
值为 1 表示连续数据点有资格成为基函数更改的点。值 1 允许模型预测中更改最快速。考虑不同的值以查看对模型拟合的影响。例如,对于某些数据,较大的值会创建更平滑的模型,这些模型不太可能过度拟合训练数据。这种更平滑的模型有时在某些数据范围内不太准确。
对以下预测变量禁用变换
输入连续预测变量,以便预测变量只能对响应变量产生线性效应。描述这种效应的另一种方法是,每个预测变量只有 1 个基函数,在预测变量的最小值处有一个结。例如,假设加性模型中的预测变量具有多个基函数来模拟曲率。为具有 3 个基函数的预测变量生成的部分依赖图具有以下形式:
如果没有预测变量的变换,预测变量只有 1 个基函数。由 1 个基函数得出的部分依赖图是一条直线:
权重
输入包含案例权重的列。该列所具有的行数必须与响应列所具有的行数相同。值必须大于等于 0。Minitab 会在分析中忽略包含缺失值或零的行。