以计数过程格式拟合 Cox 模型 数据注意事项

为确保结果有效,在收集数据、执行分析和解释结果时,请考虑以下准则。

响应变量应当是连续变量
连续数据是测量值,可以是连续尺度上位于某个值范围内的任何数值(包括分数值或小数值)。
响应数据可以是单个事件时间或多个事件时间
要收集数据,通常要测量事件发生前的时间量。对于计数过程表单,您还必须指定主题进入研究的时间。例如,在研究的7个月、11个月、15个月和27个月中,一个受试者有一种皮肤癌。之后,该主题是无癌症6个月。在每个时间间隔,研究人员记录治疗组的固定预测器,他们记录受试者的激素水平的时间依赖预测器。
您还可以使用描述多个事件的数据。例如,汽车抛锚、修理、恢复服务、然后再次抛锚等等。数据值表示每次故障的时间,而不考虑修复时间。
数据必须处于输入的计数过程样式中
在计数过程输入表单中,多个行表示每个主题。每行描述所有变量值保持不变的时间间隔。时间依赖预测器在行之间变化。间隔从开始时间之后开始,包括结束时间。预测器可以固定或视时间而定。有关详细信息,请转到以计数过程格式拟合 Cox 模型 为输入数据
必须考虑删失数据
由于响应数据是按事件进行的时间,因此需要进行审查和截断。对于考克斯回归模型,最常见的审查形式是右审查,最常见的截断形式是左截断。您可以指定一个列,以指示哪些响应时间受到审查和未经审查。
  • 右删失:如果主题在研究结束前没有体验到感兴趣的事件,或者主题在经历事件之前从研究中删除,则主题响应时间将受到正确的审查。例如,测试单元在测试期后可能仍然正常工作,或者受试者可能出于死亡以外的原因提前退出研究。
  • 左截断或延迟条目:当你在研究开始时没有观察到一个主题时,就会出现左截断。相反,当中间事件发生时,您会在研究的后期将其包括在内。受试者进入研究的时间称为进入时间或截断时间。例如,在器官可供移植之前,您不包括等待器官移植的患者。
不同治疗的受试者以成比例的速度体验该事件
考克斯回归模型不需要您指定响应数据的参数分布。但是,该模型假定在两种不同的治疗中,个人有比例的危险或风险来体验该事件。比例危险假设从危险比率或相对风险的角度对回归系数提供了简单的解释。如果比例风险假设不成立,则相对风险表可能会得出错误的结论。使用比例危险表、安徒生图和 Arjas 图的测试来验证此假设。
模型必须满秩。
满秩模型包括用于估计模型中所有项的足够数据。缺失数据、非充分数据或高度共线性可能会阻止模型满秩。如果模型不是全等级,Minitab 将在执行分析时提醒您。您通常可以通过从模型中删除不重要、高阶的交互来解决这个问题。