拟合线图的拟合线图

请查找定义和解释,了解拟合线图。

拟合线图

拟合线图将显示响应变量和预测变量数据。该图包含回归线,可表示回归方程。您还可以选择在图上显示 95% 置信区间和预测区间。

解释

评估模型与数据的拟合优度以及模型是否符合您的目标。检查拟合线图来确定是否符合下列标准:
  • 在具有所有预测变量值的整个范围中,样本包含充足的观测值个数。
  • 模型与数据中的任何弯曲正确拟合。如果要拟合线性模型并查看数据中的弯曲,则重复执行分析并选择二次模型或立方模型。要确定最佳模型,请检查图及拟合优度统计量。查看模型中项的 p 值,以确保这些项在统计意义上显著,并应用过程知识来评估实际显著性。
  • 查找任何异常值,这些值可能对结果产生较强的效应。尝试确定导致任何异常值的原因。更正任何数据输入错误或测量误差。考虑删除与异常的单次事件(也称为特殊原因)相关联的数据值。然后,重新执行分析。有关检测异常值的更多信息,请转到异常观测值

回归方程

使用回归方程来描述模型中响应和项之间的关系。回归方程是回归线的代数表示。线性模型的回归方程采取如下形式:Y= b0 + b1x1。在回归方程中,Y 是响应变量,b0 是常量或截距,b1 是线性项的估计系数(也称为直线斜率),x1 是项值。

具有多个项的回归方程采取以下形式:

y = b0 + b1X1 + b2X2 + ... + bkXk

回归方程中的字母代表如下内容:
  • y 是响应变量
  • b0 是常量
  • b1、b2、...、bk 是系数
  • X1、X2、...、Xk 是项的值

方程系数

回归系数描述了预测变量和响应变量之间关系的大小和方向。系数是回归方程中要与项值相乘的数值。

解释

项系数代表该项中单位变化的均值变化。系数的符号表明项和响应之间关系的方向。如果系数为负,随着项递增,响应的均值将递减。如果系数为正,随着项递增,响应的均值也将递增。

例如,某经理要确定员工在工作技能检验中的分数是否可以使用回归模型 y = 130 + 4.3x 进行预测。在方程中,x 是内部培训的小时数(0 到 20 之间),而 y 是检验分数。系数或斜率为 4.3,这表示每小时培训的平均检验分数按照 4.3 点递增。

通常,系数的大小是评估项对于响应变量是否具有实际显著效应的好方式。但是,系数的大小不代表一个项是否在统计意义上显著,因为显著性的计算还要考虑响应数据中的变异。要确定统计显著性,请检查该项的 p 值。

95% 置信区间

在指定的预测变量设置条件下,拟合值的置信区间为均值响应提供可能值的范围。

解释

使用置信区间为变量的观测值评估拟合值的估计值。

例如,对于 95% 置信区间,置信区间包含模型中指定变量值的总体均值的可信度为 95%。该置信区间有助于评估结果的实际意义。使用您的专业知识可以确定置信区间是否包括对您的情形有实际意义的值。置信区间越宽,未来值的平均值的可信度越低。如果区间因太宽而毫无用处,请考虑增加样本数量。

95% 预测区间

预测区间是可能包含预测变量值的一个未来响应变量的范围。

解释

95% 预测带表明,新观测值落于紫线所指的区间内的置信度为 95%。(但是,请注意只有密度值在分析中所包括的范围内时才是这样。)

例如,一家家具生产厂的材料工程师开发了一个简单回归模型来根据刨花板的密度预测其刚度。该工程师验证模型是否符合分析假定。然后,分析人员使用该模型预测刚度。

回归方程预测密度为 20 的新观测值的硬度为 12.70 – 1.517*20 + 0.1622*202,即 47.24。虽然该观测值的硬度不太可能就是 47.24,但预测区间表明,工程师认为实际值介于大约 31 到 63 之间的置信度为 95%。

预测区间总是要比对应的置信区间大。在此示例中,95% 的置信区间表明,工程师认为平均硬件介于大约 43 到 50 之间的置信度为 95%。