和线性回归的数据注意事项拟合回归模型

拟合回归模型并从线性回归不同的菜单执行相同的分析。为确保结果有效，在收集数据、执行分析和解释结果时，请考虑以下准则。

预测变量可以是连续变量或类别变量

可以对连续变量进行测量和排序，而且任意两个值之间有无限个值。例如，轮胎样本的直径即为连续变量。

类别变量包含有限、可数数目的类别或可区分组。类别数据可能不是逻辑顺序。例如，类别预测变量包括性别、材料类型和付款方式。

如果您有离散变量，则可以决定是将它视为连续预测变量还是类别预测变量。可以对离散变量进行测量和排序，但是离散变量具有可计数的值。例如，家庭成员数是离散变量。可根据水平数以及分析的目的来决定将离散变量视为连续变量还是类别变量。有关详细信息，请转到什么是类别、离散和连续变量？。

响应变量应当是连续变量

如果响应变量是类别变量，则您的模型不太可能满足分析假定、准确描述数据或者进行有用的预测。

使用最佳做法收集数据

要确保结果有效，请考虑以下准则：

预测变量之间的相关性（又称为多重共线性）应当不严重

如果多重共线性严重，则可能无法确定要在模型中包括哪些预测变量。要确定多重共线性的严重性，请使用输出的“系数”表格中的方差膨胀因子 (VIF)。

模型应当提供良好的数据拟合

如果模型无法与数据拟合，则结果可能会具有误导性。在输出中，使用残差图、异常观测值的诊断统计量以及模型汇总统计量可以确定模型对数据的拟合优度。

和 线性回归的数据注意事项 拟合回归模型