二元拟合线图中估计方程的方法和公式

请选择您所选的方法或公式。

系数

存在两种可以确定系数的极大似然估计的方法。一种方法是直接最大化系数对应的似然函数。这些表达式的系数呈非线性。另一种方法是使用迭代重加权最小二乘法,Minitab 使用该方法获得系数的估计值。McCullagh 和 Nelder1 证明了这两种方法等效。但是,迭代重加权最小二乘法更易于执行。有关详细信息,请参见 1。

[1] P. McCullagh 和 J. A. Nelder (1989)。Generalized Linear Models(广义线性模型),第 2 版,Chapman & Hall/CRC, London。

系数的标准误

i 个系数的标准误是方差-协方差矩阵的第 i 个对角线元素的正平方根。方差-协方差矩阵具有以下形式:

W 是对角矩阵,其中通过以下公式可以得出对角线元素的:

其中

此方差-协方差矩阵基于与 Fisher 的信息矩阵相对的已观测的 Hessian 矩阵。Minitab 使用已观测的 Hessian 矩阵,因为针对任何条件均值错误设定,该矩阵生成的模型更稳健。

如果使用规范链接,则已观测的 Hessian 矩阵与 Fisher 的信息矩阵相同。

表示法

说明
yii 行的响应值
i 行的估计均值响应
V(·)下表列出的方差函数
g(·)链接函数
V '(·)方差函数的一阶导数
g'(·)链接函数的一阶导数
g''(·)链接函数的二阶导数

方差函数取决于模型:

模型 方差函数
二项
Poisson

有关详细信息,请参见 [1] 和 [2]。

[1] A. Agresti (1990)。Categorical Data Analysis(类别数据分析)。John Wiley & Sons, Inc.

[2] P. McCullagh 和 J.A. Nelder (1992)。Generalized Linear Model(广义线性模型)。Chapman & Hall。

二元 Logistic 回归的优势比

仅当您为二元响应模型选择 Logit 链接函数时才会提供优势比。在这种情况下,优势比可用于解释预测变量与响应变量之间的关系。

优势比 (τ) 可以是任何非负数。优势比 = 1 可用作比较的基线。如果 τ = 1,则响应变量和预测变量之间没有关联。如果 τ < 1,则因子的参考水平(或连续预测变量的较低水平)的事件的几率较大。如果 τ > 1,则因子的参考水平(或连续预测变量的较低水平)的事件的几率较小。距离 1 较远的值表示关联度越大。

注意

对于具有一个协变量或因子的二元 Logistic 回归模型,估计的成功几率为:

指数关系可为 β 提供解释:x 每增加一个单位,几率就成倍增加 eβ1。优势比等于 exp(β1)。

例如,如果 β 为 .75,则优势比为 exp(.75),即 2.11。这意味着 x 每增加一个单位,成功几率就增加 111%。

表示法

说明
数据中第 i 行的估计成功概率
估计的截距系数
预测变量 x 的估计系数
i 行的数据点

方差-协方差矩阵

d x d 矩阵,其中,d 为预测变量数加一。每个系数的方差在对角线单元中,每对系数的协方差在相应的非对角线单元中。方差是系数标准误的平方。

方差-协方差矩阵来自信息矩阵的逆矩阵的最后一次迭代。方差-协方差矩阵具有以下形式:

W 是对角矩阵,其中通过以下公式可以得出对角线元素:

其中

此方差-协方差矩阵基于与 Fisher 的信息矩阵相对的已观测的 Hessian 矩阵。Minitab 使用已观测的 Hessian 矩阵,因为针对任何条件均值错误设定,该矩阵生成的模型更稳健。

如果使用规范链接,则已观测的 Hessian 矩阵与 Fisher 的信息矩阵相同。

表示法

说明
yi i 行的响应值
i 行的估计均值响应
V(·)下表列出的方差函数
g(·)链接函数
V '(·)方差函数的一阶导数
g'(·)链接函数的一阶导数
g''(·)链接函数的二阶导数

方差函数取决于模型:

模型 方差函数
二项
Poisson

有关详细信息,请参见 [1] 和 [2]。

[1] A. Agresti (1990)。Categorical Data Analysis(类别数据分析)。John Wiley & Sons, Inc.

[2] P. McCullagh 和 J.A. Nelder (1992)。Generalized Linear Model(广义线性模型)。Chapman & Hall。

使用此网站,即表示您同意对数据分析和个性化内容使用 Cookie。  请阅读我们的政策