数据注意事项均值分析

为了确保结果有效,请在收集数据、执行分析和解释结果时考虑以下准则。

响应数据应当服从正态分布、二项分布或 Poisson 分布
  • 正态分布的数据通常为测量数据,如重量。对于正态分布的数据,Minitab 会将每组的均值与总体均值进行比较。
  • 二项数据将每个观测值分为两个类别之一,如通过/失败。Minitab 使用二项数据将每个样本的比率与总体比率进行比较。
  • Poisson 数据包含计数,如每个部件或样本的缺陷数量。Minitab 使用 Poisson 数据将每个样本的发生率与总体发生率进行比较。
如果您的数据服从正态分布,则数据应当包括一个或两个类别因子
  • 具有两个因子的均值分析设计必须具有平衡设计。衡设计是指因子水平的所有可能组合都具有相等数量的观测值。如果您的设计具有两个类别因子并且不平衡,则在具有所有固定因子时使用拟合一般线性模型,或在具有随机因子时使用拟合混合效应模型
  • 如果您的设计具有两个以上的类别因子或包含协变量,则在具有所有固定因子时使用拟合一般线性模型,或在具有随机因子时使用拟合混合效应模型

有关因子和平衡设计的更多信息,请转到因子和因子水平方差分析模型中的平衡与不平衡设计

如果您有二项数据,则样本数量必须恒定且足够大
  • 所有样本的数量必须相等,才能确保对每个样本的比率与总体比率进行有效的比较。
  • 样本数量必须足够大,才能确保正态分布能够求二项分布的适当近似值,因为决策限基于正态分布。当 np > 5 且 n(1 − p) > 5(其中 n 是样本数量,p 是事件的比率)时,正态分布是足够的。

如果您的样本不满足这些标准,您的结果可能会无效。

如果您有 Poisson 数据,则样本数量必须恒定且足够大
  • 所有样本的数量必须相等,这样每个样本的率才有效。
  • 样本数量必须足够大,才能确保正态分布能够求 Poisson 分布的适当近似值,因为决策限基于正态分布。当均值至少为 5 时,正态分布是足够的。

如果您的样本不满足这些标准,您的结果可能会无效。

每个观测值都应当独立于所有其他观测值
如果您的观测值是相关的,则结果可能无效。请考虑以下几点来确定观测值是否为独立值:
  • 如果一个观测值不提供有关另一个观测值的信息,则说明这两个观测值是独立的。
  • 如果一个观测值提供有关另一个观测值的信息,则说明这两个观测值是相关的。
样本数据应当是随机选择的

随机样本用于对总体做出归纳,即推断。如果数据不是随机收集的,则结果可能无法代表总体。

使用最佳做法收集数据
要确保结果有效,请考虑以下准则:
  • 确保数据代表您感兴趣的总体。
  • 收集足够多的数据以提供必要的精确度。
  • 尽可能准确和精确地测量变量。
  • 以数据的收集顺序记录数据。