正交回归的数据注意事项

为了确保结果有效,请在收集数据、执行分析和解释结果时考虑以下准则。

数据应当仅包括一个具有测量误差的连续预测变量
如果您有一个连续预测变量但其中不包含测量误差,请使用 拟合线图
响应变量应当是连续变量

如果响应变量是类别变量,则您的模型不太可能满足分析假定、准确描述数据或者进行有用的预测。

如果不需要评估测量值的相似性,您可以考虑以下备择分析。

  • 如果您的响应变量有两个类别(如通过和失败),请使用拟合二元 Logistic 模型
  • 如果您的响应变量包含三个或更多采用一定自然顺序的类别(如非常不同意、不同意、中立、同意和非常同意),请使用顺序 Logistic 回归
  • 如果您的响应变量包含三个或更多不采用自然顺序的类别(如擦痕、凹陷和撕裂),请使用名义 Logistic 回归
  • 如果您的响应变量对发生次数(如缺陷数量)进行计数,请使用拟合 Poisson 模型
您必须在响应和预测变量中指定测量误差方差的比值。
一种用于获取误差方差估计值的方式是对每个变量执行单独的量具 R&R 研究。
选择可表示实际或预期极差的度量单位。
要验证两种工具或方法能否提供相似的测量值,请选择度量单位来表示其测量值需要相似的所有值。然后,使用这两种工具或方法度量这些单位。
使用最佳做法收集数据
要确保结果有效,请考虑以下准则:
  • 确保数据代表您感兴趣的总体。
  • 收集足够多的数据以提供必要的精确度。
  • 尽可能准确和精确地测量变量。
  • 以数据的收集顺序记录数据。
模型应当提供良好的数据拟合

如果模型无法与数据拟合,则结果可能会具有误导性。在输出中,使用残差图和拟合线图可以确定模型对数据的拟合优度。