平衡方差分析的数据注意事项

为了确保结果有效,请在收集数据、执行分析和解释结果时考虑以下准则。

数据应当仅包括类别因子

如果您的设计中包含协变量,请使用拟合一般线性模型

类别因子可以是交叉因子、嵌套因子、固定因子和随机因子。

有关因子的更多信息,请转到因子和因子水平什么是因子、交叉因子和嵌套因子?什么是固定因子和随机因子之间的差值?

除非拥有单因子设计,否则设计必须是平衡设计
对于每个处理组合来说,平衡设计具有相同数量的观测值。

平衡数据要求也适用于嵌套因子。假设 A 具有 3 个水平,B 嵌套在 A 中。如果 B 在 A 的第一个水平内具有 4 个水平,则 B 在 A 的第二和第三个水平内必须具有 4 个水平。Minitab 将告知您嵌套是否不平衡。忽略缺失数据后,仍然必须满足数据平衡要求。

如果您的设计不平衡,请使用拟合一般线性模型

有关平衡设计的更多信息,请转到平衡与不平衡设计

嵌套因子必须使用同一组下标
用来表示 B 在 A 的每个水平中的 4 个水平的下标必须相同。因此,B 的四个水平不能在 A 的水平 1 中为 (1 2 3 4),在 A 的水平 2 中为 (5 6 7 8),在 A 的水平 3 中为 (9 10 11 12)。
响应变量应当是连续变量
如果响应变量是类别变量,则您的模型不太可能满足分析假定、准确描述数据或者进行有用的预测。
  • 如果您的响应变量有两个类别(如通过和失败),请使用拟合二元 Logistic 模型
  • 如果您的响应变量包含三个或更多采用一定自然顺序的类别(如非常不同意、不同意、中立、同意和非常同意),请使用顺序 Logistic 回归
  • 如果您的响应变量包含三个或更多不采用自然顺序的类别(如擦痕、凹陷和撕裂),请使用名义 Logistic 回归
  • 如果您的响应变量对发生次数(如缺陷数量)进行计数,请使用拟合 Poisson 模型
每个观测值都应当独立于所有其他观测值
如果您的观测值是相关的,则结果可能无效。请考虑以下几点来确定观测值是否为独立值:
  • 如果一个观测值不提供有关另一个观测值的信息,则说明这两个观测值是独立的。
  • 如果一个观测值提供有关另一个观测值的信息,则说明这两个观测值是相关的。
样本数据应当是随机选择的

随机样本用于对总体做出归纳,即推断。如果数据不是随机收集的,则结果可能无法代表总体。

使用最佳做法收集数据
要确保结果有效,请考虑以下准则:
  • 确保数据代表您感兴趣的总体。
  • 收集足够多的数据以提供必要的精确度。
  • 尽可能准确和精确地测量变量。
  • 以数据的收集顺序记录数据。
模型应当提供良好的数据拟合

如果模型无法与数据拟合,则结果可能会具有误导性。在输出中,使用残差图和模型汇总统计量可以确定模型对数据的拟合优度。