解释拟合混合效应模型的主要结果

请完成以下用于解释混合效应模型的步骤。

步骤 1:确定随机项是否对响应产生显著影响

要确定随机项是否对响应产生显著影响,请将方差分量表中该项的 p 值与您的显著性水平进行比较。通常,显著性水平(用 α 或 alpha 表示)为 0.05 即可。显著性水平 0.05 表示在实际上不存在效应时得出存在效应的风险为 5%。
P 值 ≤ α:随机项会对响应产生显著影响
如果 p 值小于或等于显著性水平,则可以得出随机项会对响应产生显著影响的结论。这意味着随机项的方差与零显著不同。
P 值 > α:随机项不会对响应产生显著影响
如果 p 值大于显著性水平,则无法得出随机项对响应产生显著影响的结论。您可能需要重新拟合没有该非显著项的模型,用于评估该项对其他结果的效应。

方差分量

来源变量总和的 %变量标准误Z 值P 值
田地0.07791972.93%0.0675801.1529960.124
误差0.02892427.07%0.0105622.7386130.003
合计0.106843       
-2 对数似然 = 7.736012
主要结果:P 值

在这些结果中,田地是随机项,并且田地的 P 值为 0.124。因为此值大于 0.05,所以您没有足够的证据得出不同的田地会产生产量变异量的结论。

步骤 2:确定固定效应项是否对响应产生显著影响

要确定项是否对响应产生显著影响,请将 p 值与您的显著性水平进行比较。通常,显著性水平(用 α 或 alpha 表示)为 0.05 即可。显著性水平 0.05 表示在实际上不存在影响时得出存在影响的风险为 5%。

对每个 p 值的解释取决于它是用于固定因子项还是用于协变量项的系数。

固定因子项

对于固定因子项,原假设为固定因子项不会对响应产生显著影响。
P 值 ≤ α:固定因子项会对响应产生显著影响

如果 p 值小于或等于显著性水平,则可以得出固定因子项会对响应产生显著影响的结论。否定原假设则表示,项的一个水平效应与另一个水平效应显著不同。

P 值 > α:固定因子项不会对响应产生显著影响
如果 p 值大于显著性水平,则无法得出固定因子项对响应产生显著影响的结论。您可能需要重新拟合没有该项的模型。

协变量项

对于协变量项,原假设为项和影响之间不存在关联。
P 值 ≤ α:关联在统计意义上显著
如果 P 值小于或等于显著性水平,则可以得出响应与协变量项之间的关联在统计意义上显著的结论。
P 值 > α:关联在统计意义上不显著
如果 p 值大于显著性水平,则无法得出响应与协变量项之间的关联在统计意义上显著的结论。您可能需要重新拟合没有该协变量项的模型。

固定效应检验

分子自由度分母自由度F 值P 值
品种5.0015.0026.290.000
主要结果:P 值

品种是固定因子项,并且品种项的 p 值小于 0.000。因为此值小于 0.05,所以您可以得出水平均值并非全部相等的结论,这意味着紫花苜蓿的品种对产量产生效应。

要更好地了解主效应,请转到因子图

步骤 3:确定模型对数据的拟合优度

要确定模型与数据的拟合优度,请检查模型汇总表中的拟合优度统计量。

S

S 是误差项的估计标准差。在选定的因子设置下,S 值越低,条件拟合方程描述响应的程度越高。但是,S 值本身不会完整描述模型准确度。还要检查其他表和残差图中的主要结果。

R-sq

R2 是由模型解释的响应中的变异百分比。它由 1 减去误差平方和(未由模型解释的变异)与平方总和(模型的总变异)之比计算得出。

R-sq(调整)

当您想要比较的模型具有相同的协方差结构但具有不同数量的固定因子或协变量时,可以使用调整的 R2。假定模型具有相同的协方差结构,在您添加其他的固定因子或者协变量时,R2 将增加。调整的 R2 值包含模型中的固定因子和协变量数,以便帮助您选择正确的模型。

AICc 和 BIC
当您显示分析的扩展结果时,Minitab 会多显示两个统计量。这些统计量是更正的 Akaike 信息标准 (AICc) 和 Bayesian 信息标准 (BIC)。使用这些统计量可以比较不同的模型。对于每个统计量,较小的值比较合意。
解释拟合优度统计量时,请考虑以下几点:
  • 要为模型中的参数获得更精确、偏倚更小的估计值,数据集中的行数通常应该比模型中的参数数目大得多。要为随机项的方差分量获得适宜的估计值,每个随机因子都应该有足够的代表水平。

  • 拟合优度统计量只是模型拟合数据优度的一种度量。即使模型具有合意的值,您也应当检查残差图,以验证模型是否符合模型假设。

模型汇总

SR-sqR-sq(调整)AICcBIC
0.17007192.33%90.20%12.5413.52
主要结果:S、R-sq、R-sq(调整)

在这些结果中,随机误差项的估计标准差 (S) 为 0.17。模型可解释紫花苜蓿植物产量中 92.33% 的变异。在为模型中的固定因子参数进行调整后,该百分比降低至 90.2%。

步骤 4:评估固定效应项的每个水平如何对响应产生影响

如果 p 值指示某项较显著,您可以检查该项的系数以了解该项与响应的关系。对每个系数的解释取决于它是用于固定因子项还是用于协变量项。

固定因子项的系数可显示项的水平均值之间有何不同。您也可以对项执行多重比较分析来进一步将水平效应划分为统计意义上相同或不同的组。

协变量项的系数表示与该项的每个单位变化相关的平均响应的变化,同时模型中的其他项保持不变。系数的符号表明项与响应之间关系的方向。通常,系数的大小可提供用于评估项对于响应变量是否具有实际显著影响的较好方式。

系数

系数系数标准误自由度T 值P 值
常量3.0945830.1438223.0021.5166920.000
品种         
  10.3854170.07762615.004.9650160.000
  20.1454170.07762615.001.8732870.081
  30.1079170.07762615.001.3902050.185
  4-0.3195830.07762615.00-4.1169380.001
  50.3954170.07762615.005.0938380.000
主要结果:系数

在六种紫花苜蓿的试验中,输出结果显示出五种类型的系数。默认情况下,Minitab 会删除一个因子水平以避免完全多重共线性。主效应的系数代表每个水平均值和总体均值之间的差值。例如,与品种 1 相关的紫花苜蓿产量大约比总体均值高 0.385 个单位。

步骤 5:确定模型是否符合分析的假设条件

使用残差图可帮助您确定模型是否适用并符合分析的假设。如果不符合此假设,则模型可能无法充分拟合数据,在解释结果时应当格外小心。

注意

您可以绘制边际和条件残差图。边际残差等于观测响应值与相应的估计平均响应的差值,不取决于随机因子的水平。相反,给定特定随机因子水平时,条件残差等于观测响应值与相应的条件平均响应的差值。使用条件残差可以检查模型中误差项的正态性。

残差与拟合值图

残差与拟合值图形分别在 y 轴和 x 轴上绘制残差和拟合值。使用此图可以确定包含的残差比其他行大得多的数据行。进一步研究这些行以确定它们是否得到正确收集。此外,您还可以使用此图查找可能指示其他需考虑变量的残差中的特定模式。

残差与顺序图

残差与顺序图按照数据的收集顺序显示残差。使用此图可以确定包含的残差比其他行大得多的数据行。进一步研究这些行以确定它们是否得到正确收集。如果该图以时间顺序显示模式,则可以尝试在模型中包含一个时间相关项以删除该模式。