名义 Logistic 回归的数据注意事项

为了确保结果有效，请在收集数据、执行分析和解释结果时考虑以下准则。

预测变量可以是连续变量或类别变量

连续变量可以测量和排序，它可以拥有介于两个值之间的无限数量的值。例如，轮胎样本的直径是连续变量。

类别变量包含有限、可计数的类别数或可区分组数。类别数据可能不是逻辑顺序。例如，类别变量包括性别、材料类型和付款方式。

如果您有离散变量，则可以决定是将它视为连续预测变量还是类别预测变量。离散变量可以进行测量和排序，但是它具有可计数的值。例如，家庭成员数是离散变量。可根据水平数以及分析的目的来决定将离散变量视为连续变量还是类别变量。有关更多信息，请转到什么是类别、离散和连续变量？。

响应变量应当是名义变量

名义变量有三个或更多没有一定顺序的结果，如擦痕、凹陷和撕裂。

使用最佳做法收集数据

要确保结果有效，请考虑以下准则：

预测变量之间的相关性（又称为多重共线性）应当不严重

如果多重共线性严重，则可能无法确定要在模型中包括哪些预测变量。要确定多重共线性的严重性，可以检查预测变量之间的相关性。要确定预测变量是否高度相关，请选择统计 > 基本统计 > 相关。

模型应当提供良好的数据拟合

如果模型与数据不拟合，则结果可能会具有误导性。拟合优度检验的 p 值大于 alpha 值。此状况指示证据不足，无法充分地声明模型与数据不拟合。拟合优度检验的 p 值大于 alpha 值。此状况指示证据不足，无法充分地声明模型与数据不拟合。