名义 Logistic 回归的数据注意事项

为了确保结果有效,请在收集数据、执行分析和解释结果时考虑以下准则。

预测变量可以是连续变量或类别变量

连续变量可以进行测量和排序,并且在任意两个值之间有无限数量的值。例如,样本轮胎的直径是连续变量。

类别变量包含有限、可计数的类别数或可区分组数。类别数据可能不是逻辑顺序。例如,类别变量包括性别、材料类型和付款方式。

如果您具有离散变量,则可以决定将其视作连续预测变量还是类别预测变量。离散变量可以进行测量和排序,但是它具有可计数的值。例如,某个家庭中居住成员的数量是离散变量。决定将离散变量视作连续还是类别变量取决于水平数以及分析的目的。有关更多信息,请转到什么是类别、离散和连续变量?

  • 如果您有随机的类别因子,请使用拟合混合响应模型对于拟合一般线性模型,响应变量是连续的。
响应变量应当是名义变量
名义变量有三个或更多没有一定顺序的结果,如擦痕、凹陷和撕裂。
  • 如果您的响应变量有两个类别(如通过和失败),请使用拟合二元 Logistic 模型
  • 如果您的响应变量包含三个或更多采用一定自然顺序的类别(如非常不同意、不同意、中立、同意和非常同意),请使用顺序 Logistic 回归
  • 如果您的响应变量对发生次数(如缺陷数量)进行计数,请使用拟合 Poisson 模型
使用最佳做法收集数据
要确保结果有效,请考虑以下准则:
  • 确保数据代表您感兴趣的总体。
  • 收集足够多的数据以提供必要的精确度。
  • 尽可能准确和精确地测量变量。
  • 以数据的收集顺序记录数据。
预测变量之间的相关性(又称为多重共线性)应当不严重

如果多重共线性较严重,您可能无法确定将哪些预测变量包括在模型中。要确定多重共线性的严重性,请检查预测变量之间的相关性。要确定预测变量是否高度相关,请选择统计 > 基本统计 > 相关

模型应当提供良好的数据拟合

如果模型与数据不拟合,则结果可能会具有误导性。足够的模型用于拟合优度检验的 p 值大于 alpha 值。此状况指示证据不足,无法充分地声明模型与数据不拟合。在输出中,检查拟合优度检验。

使用此网站,即表示您同意对数据分析和个性化内容使用 Cookie。  请阅读我们的政策