边际拟合值表示不同的固定因子水平下的均值响应。边际拟合值通过边际拟合方程计算而得。
拟合值标准误(拟合值 SE)用于估计指定变量设置的估计平均响应中的变异。将使用拟合值标准误来计算平均响应的置信区间。标准误始终为非负值。
自由度 (DF) 表示数据中的信息量,用来估计平均响应的置信区间。
使用自由度可以比较有关不同边际均值的可用信息量。一般而言,自由度越大,均值的置信区间越窄;自由度越小,均值置信区间越宽。由于不同观测值的均值的标准误不同,因此具有较大自由度的均值的置信区间不一定比具有较小自由度的均值的置信区间窄。
这些置信区间 (CI) 是可能包含相应的边际均值响应的值范围。
由于样本的随机性,来自总体的两个样本不可能生成相同的置信区间。但是如果将样本重复许多次,则所获得的特定百分比的置信区间会包含未知的总体参数。这些包含参数的置信区间的百分比是区间的置信水平。
置信区间由以下两部分组成:
使用这些置信区间可以评估边际均值响应在统计意义上是大于、等于还是小于特定值。您也可以使用这些置信区间为相应的未知边际均值响应确定值范围。
残差 (ei) 是观测值 (y) 与其相应的边际拟合值 () 之差。
绘制残差图可确定模型是否适用且符合混合效应模型的假设。检查残差可以提供有关模型对数据的拟合优度的有用信息。一般而言,残差应当是随机分布的,而且没有明显的模式和异常值。如果 Minitab 确定数据包含异常观测值,则会在输出的“异常观测值的边际拟合值与诊断”表中确定这些观测值。Minitab 标记的异常观测值未能很好地遵循建议的边际方程。但是,预计您将得到一些异常观测值。例如,基于较大残差的标准,预计大约 5% 的观测值将标记为具有较大的残差。
标准化边际残差等于残差值 (ei) 除以其标准差的估计值。
使用标准化边际残差可帮助您检测异常值。大于 2 和小于 −2 的标准化边际残差通常被视为较大值。“异常观测值的边际拟合值与诊断”表使用“R”来标识这些观测值。Minitab 标记的观测值未能很好地遵循建议的边际拟合方程。但是,预计您将得到一些异常观测值。例如,基于较大标准化边际残差的标准,预计约 5% 的观测值将标记为具有较大的标准化残差。
标准化边际残差很有用,因为原始边际残差可能不是良好的异常值指示符。每个原始边际残差的方差因与其关联的 X 值而异。这一变异不等情况会导致难以评估原始边际残差的量级。对边际残差进行标准化可以通过将不同的方差转换为公共尺度来解决此问题。
混合效应模型中的 Hi 可以只用于为固定效应项确定具有高杠杆率设置的数据点。用于计算 Hi 的设计矩阵是用于固定效应项的设计矩阵。
Hi 值位于 0 和 1 之间。Minitab 会在异常观测值的边际拟合值与诊断表中用 X 标识杠杆率值大于 3p/n 或 0.99(以较小者为准)的观测值。在 3p/n 中,p 是模型中系数的数目,n 是观测值个数。Minitab 使用“X”标识的观测值可能是有影响的观测值。
有影响的观测值对模型具有不成比例的影响,会产生误导性结果。例如,包含或不包含有影响的点可能会改变系数是否统计意义显著。有影响的观测值可以是杠杆率点、异常值或这两者。
如果看到有影响的观测值,请确定该观测值是否存在数据输入或测量错误。如果该观测值既不存在数据输入错误又不存在测量错误,请确定它会造成何种影响。首先,拟合带该观测值的模型和不带该观测值的模型。然后,比较系数、p 值、R2 和其他模型信息。如果在排除有影响的观测值后模型有显著变化,请进一步检查模型,确定在模型中是否指定了错误内容。您可能需要收集更多数据以解决此问题。