仅使用固定预测变量拟合 Cox 模型 数据注意事项

为确保结果有效,在收集数据、执行分析和解释结果时,请考虑以下准则。

响应变量应当是连续变量
连续数据是测量值,可以是连续尺度上位于某个值范围内的任何数值(包括分数值或小数值)。
响应数据通常是失效时间
要收集数据,通常需要度量受制于不同条件(这些条件由一个或多个变量和/或系数度量)的项目在失效之前的时间长度。例如,您可以度量在不同温度下运行的项目在失效之前的时间。
如果主体的响应数据的特点是主题处于危险中的时间间隔,则使用 以计数过程格式拟合 Cox 模型
失效时间必须是独立的
一个项目的故障时间不应影响另一个项目的故障时间。如果您的观测值是相关的,则结果可能无效。例如,可修复系统故障之间的时间通常不独立。如果您有数据,主题可以多次体验感兴趣的事件,如可修复系统,使用 以计数过程格式拟合 Cox 模型
预测变量应定量
当您在研究开始时知道其值时,预测器是固定的,并且在研究期间不会更改。例如,一个主题的诞生地是一个固定的预测器。
必须考虑删失数据
由于响应数据是按事件进行的时间,因此需要进行审查和截断。对于考克斯回归模型,最常见的审查形式是右审查,最常见的截断形式是左截断。您可以指定一个列,以指示哪些响应时间受到审查和未经审查。
  • 右删失如果主题在研究结束前没有体验到感兴趣的事件,或者主题在经历事件之前从研究中删除,则主题响应时间将受到正确的审查。例如,如果一个单位在测试期后工作,或者一个受试者迁往新城市并退出研究,则会进行审查观察。
  • 左截断或延迟条目:当你在研究开始时没有观察到一个主题时,就会出现左截断。相反,当中间事件发生时,您会在研究的后期将其包括在内。受试者进入研究的时间称为进入时间或截断时间。例如,在器官可供移植之前,您不包括等待器官移植的患者。
不同治疗的受试者以成比例的速度体验该事件
考克斯回归模型不需要您指定响应数据的参数分布。但是,该模型假定在两种不同的治疗中,个人有比例的危险或风险来体验该事件。比例危险假设从危险比率或相对风险的角度对回归系数提供了简单的解释。如果比例风险假设不成立,则相对风险表可能会得出错误的结论。使用比例危险表、安徒生图和 Arjas 图的测试来验证此假设。
模型必须满秩。
满秩模型包括用于估计模型中所有项的足够数据。缺失数据、非充分数据或高度共线性可能会阻止模型满秩。如果模型不是全等级,Minitab 将在执行分析时提醒您。您通常可以通过从模型中删除不重要、高阶的交互来解决这个问题。