什么是加权回归?

加权回归是一种可以在违反残差中常量方差的最小二乘假设(也称为异方差性)时使用的方法。如果权重正确,此过程会使加权平方残差和最小化,从而产生具有常量方差的残差(也称为同方差性)。

重要信息

如果省略的参数导致了异方差性,则加权回归不是合适的解决方案。

关于选择要使用的权重

确定要使用的正确权重可能是一项挑战性的任务。理想的权重是误差的方差的倒数。但是,这通常无法计算,而必须使用其他方法。可供选择的方法如下:
  • 如果方差与预测变量成比例,则使用预测变量或平方预测变量的倒数。结合经验与尝试和误差来确定哪种有效。
  • 基于理论、文献或早先研究的值。

通常,方差较小的观测值应当具有相对较大的权重,方差较大的观测值应当具有相对较小的权重。

假设您的回归模型预测不同城市中每年的交通事故数。由于人口较多的城市往往发生更多的事故,因此大城市的残差往往也更大。解决这种情况的一种方法是使用每个城市人口的倒数作为权重。

权重不影响自由度

除非您为一个或多个观测值指定了零权重,否则指定一列权重不会影响自由度。如果为某个观测值赋予权重零,则会将该观测值从分析中删除,因此会降低自由度。

指定一列权重会按照以下方式影响平方和和参数估计值:
  • 平方和变成加权的平方和。
  • 加权均值用在总平方和中。
  • 加权最小平方标准用于估计参数。

为加权线性回归创建拟合线图

与使用统计 > 回归 > 拟合线图创建的拟合线图不同,使用以下步骤创建的图形将不包含回归方程、s、R 方和调整的 R 方 (adj)。但是,Minitab 在输出中显示此信息,您可以将复制它并将它粘贴到图形上。

假设响应在 C1 中,预测变量在 C2 中,权重在 C3 中:

  1. 选择。统计 > 回归 > 回归 > 拟合回归模型
  2. 响应中,输入 C1。在连续预测变量中,输入 C2
  3. 单击选项
  4. 权重中,输入 C3。单击确定
  5. 单击存储
  6. 选中拟合
  7. 单击每个对话框中的确定
  8. 选择图形 > 散点图
  9. 单击简单。单击确定
  10. Y 变量中,输入 C1
  11. X 变量中,输入 C2。单击确定
  12. 右键单击散点图并选择添加 > 计算线
  13. Y 列列中,输入拟合值列(通常名为 FITS1)。
  14. X 列中,输入 C2。单击确定

编辑线条颜色和图表标题

您可以更改线条的颜色。要使线条为蓝色,请双击它。在属性选项卡的线下,选择自定义,并从“颜色”下拉列表中选择蓝色。单击确定

您还可以更改标题。双击标题。在字体选项卡的文本下,键入所需的标题。单击确定