系数和回归方程的方法和公式 仅使用固定预测变量拟合 Cox 模型

选择需要的方法或公式。

回归方程

半参数考克斯比例危险模型使用个人的预测值, ,预测风险评分, 。回归方程的一般形式如下:

其中, 是估计系数的向量。估计系数可以包括更高阶值的值,例如连续预测器的正方形。估计的风险评分适用于整个研究期间,不取决于时间。在输出中,方程有以下形式,其中不同级别的分类因子出现单独的方程:

系数

让考克斯比例危险模型的日志部分可能性函数 求逆。最大化偏似然函数的向量,,给出模型的估计系数。找到 ,设置日志部分可能性函数的部分导数等于零,并解解方程 )。Minitab 统计软件使用牛顿-拉普森迭代方法来解解方程。见默里 (1972)1 牛顿-拉普森迭代方法的描述。

日志部分可能性函数的部分衍生物的向量取决于响应变量是否包括绑定事件时间。如果响应变量包括领带,则估计使用 Efron 近似或布雷斯洛近似。如果响应变量没有联系,所有 3 种方法都提供相同的估计值。数据中的联系越少,两种近似方法的结果越接近。数据中的联系越多,Efron 近似度在布雷斯洛近似度上就越有改进。

计算使用以下定义:
说明
与事件时间对应的样本单位的共变值的载体

无领带数据

没有联系的数据计算使用以下定义:
说明
活动次数
及时设置的风险 ,这是所有尚未在时间之前失败的样本单位的集
模型中参数数量的计数变量, 哪里 是模型中的参数个数

考克斯比例危险模型的部分可能性函数没有联系,其形式如下:

损失函数具有以下形式:

部分衍生品的载体与 具有以下形式:

使特定系数的部分导数, 具有以下形式:

带领带的数据

带联系的数据的计算使用以下定义:
说明
时间时的事件数
同时具有事件的所有示例单元集
及时设置的风险 ,这是所有尚未在时间之前失败的样本单位的集
此外,请允许

带领带的数据的 Efron 近似

损失函数具有以下形式:

损失函数具有以下形式:
使特定系数的部分导数, 具有以下形式:

带领带的数据的布雷斯洛近似

损失函数具有以下形式:

损失函数具有以下形式:
使特定系数的部分导数, 具有以下形式:

已编码系数

当分析标准化连续预测器时,表显示编码系数。要查找编码系数,请将标准化预测器替换为前方方程。

系数标准误

系数的标准误是协方差矩阵的对角线元素的平方根:方差-协方差矩阵具有以下形式:

所观察到的信息矩阵, 取决于响应变量是否包括绑定事件时间。如果响应变量包括领带,则估计使用 Efron 近似或布雷斯洛近似。如果响应变量没有联系,所有 3 种方法都提供相同的估计值。数据中的联系越少,两种近似方法的结果越接近。数据中的联系越多,Efron 近似度在布雷斯洛近似度上就越有改进。

无领带数据

观测到的费舍尔信息矩阵的(kl) 元素有以下形式:
其中(kl)部分日志可能性函数的赫斯矩阵元素有以下形式:

带领带的数据的 Efron 近似

观测到的费舍尔信息矩阵的(kl)元素有以下形式:
其中(k,l)部分日志可能性函数的赫斯矩阵元素有以下形式:

其中

带领带的数据的布雷斯洛近似

观测到的费舍尔信息矩阵的(kl)元素有以下形式:
其中(kl)部分日志可能性函数的赫斯矩阵元素有以下形式:

其中

Z 值

按下列步骤计算检验统计量:
损失函数具有以下形式:

其中, 是系数 的估计标准误差。价值 k 角线元素的正方形根 .

置信区间

系数的近似 100(1 – α) 置信区间具有以下形式:

其中, 标准正态分布的上 α 百分位点

P 值

调整的 p 值具有以下表达式:
说明
标准正态分布的随机变量
的检验统计量 反对备择假设

分层比例危险模型

对于包含以 s 水平为分层变量 的 分类变量的模型,整个地层的回归系数是恒定的。分层模型中回归系数的估计过程与不分层的比例危险模型的过程相同。对于分层模型,日志部分可能性函数具有以下形式:

其中, 是地层 j中的日志部分可能性 。汇总每个层的衍生物,以获得部分可能性方程。每个层的衍生物与比例危险模型的衍生物相同,无需分层。Breslow 和 Efron 方法相应地适用。

1 Murray, W. Ed. (1972)。 Numerical Methods for Unconstrained Optimization. Academic Press.