Methoden für Cox-Modell in einem Zählprozessformular anpassen

Wählen Sie die gewünschte Methode oder Formel aus.

In diesem Thema

Das Eingabeformular für den Zählprozess
Korrelierte Beobachtungen und der robuste Kovarianzschätzer

Für jedes Fach lass die Step-Funktion sein, die die Anzahl der Ereignisse darstellt, die Erlebnisse bis zur Zeit . Dann stellt einen Zählvorgang für das Subjekt dar . Sei eine Indikatorvariable sein, die den Wert 1 hat, wenn das Subjekt i zum Zeitpunkt t gefährdet ist und andernfalls 0, was äquivalent ist zu wenn und sonst

Das Cox-Proportional-Hazards-Modell geht davon aus, dass die Hazard-Rate zum Zeitpunkt

Für Einzelwerte

mit einem Vektor von Prädiktorwerten

Hat die folgende Form:

Dabei gilt: ist die Baseline-Hazard-Rate, die die nicht spezifizierte Verteilung der Überlebenszeit charakterisiert und ist ein p-Komponentenvektor unbekannter Regressionskoeffizienten.

Zum Beispiel eine Formulierung des Cox-Proportional-Hazards-Modells als Zählprozess basierend auf Andersen et al. (1993)¹ und Fleming und Harrington (1991)², unter der Annahme, dass keine gebundenen Ereigniszeiten vorliegen, hat eine partielle Logwahrscheinlichkeit mit der folgenden Form:

Der Vektor partieller Derivate in Bezug auf die Komponenten von

Hat die folgende Form:

Die p-mal-p-Informationsmatrix hat die folgende Form:

wobei der gewichtete Mittelwert der zu einem Zeitpunkt gefährdeten Probanden

Hat die folgende Form:

Diese Formulierung des Cox-Proportional-Hazards-Modells ist das multiplikative Hazards-Modell. Das multiplikative Gefahrenmodell weist folgende Merkmale auf:

Das Subjekt kann mehr als ein Ereignis von Interesse erleben.
Das Subjekt kann ein Ereignis mehrmals erleben. Diese Aussage bedeutet, dass die Indikatorvariable, die angibt, ob das Subjekt gefährdet ist, , kann zustände von 1 auf 0 und wieder zurück mehrmals ändern.
Das Subjekt kann nach Zeit 0 in die Studie eintreten. Diese Aussage entspricht der Vorstellung, dass ein Subjekt nach Zeit 0 in die Risikomenge eintreten kann. Eine Zeit wird links abgeschnitten, wenn der Betreff nach Zeit 0 eingegeben wird.

Therneau (1999)³ enthält Details zur Eingabeform des Zählprozesses von Daten. Die Eingabeform der Daten des Zählprozesses bietet eine Technik, um das multiplikative Gefahrenmodell mit den gleichen Algorithmen zu passen, die dem Cox-Proportionalgefahrenmodell entsprechen.

Das Eingabeformular für den Zählprozess

Im Eingabeformular des Zählprozesses stellen mehrere Zeilen jedes Thema dar. Jede Zeile beschreibt ein Zeitintervall, in dem die Werte aller Variablen konstant sind. Zeitabhängige Prädiktoren ändern sich zwischen Zeilen. Die Intervalle beginnen direkt nach der Startzeit und schließen die Endzeit ein. Die Startzeit für das Intervall ist die Eingabezeit für das Subjekt. Die Endzeit ist die Antwortvariable für das Subjekt. Die Zensurspalte gibt jede Zeile an, in der die Endzeit keine Ereigniszeit ist.

Korrelierte Beobachtungen und der robuste Kovarianzschätzer

Obwohl mehrere Zeilen jedes Subjekt im Eingabeformular des Zählprozesses darstellen, trägt jeweils nur eine Zeile der Beobachtungen pro Subjekt zur Wahrscheinlichkeit bei, es sei denn, es besteht eine Korrelation zwischen den Beobachtungen in einer Untergruppe, die sich auf jedes Subjekt beziehen. Beispielsweise werden die Beobachtungen der Probanden in Modellen korreliert, die wiederholte oder wiederkehrende Ereignisse enthalten. Lin und Wei (1989)⁴ eine Anpassung der Kovarianzmatrix vorschlagen, um die Korrelation zwischen Beobachtungen innerhalb des Subjekts zu berücksichtigen. Sei die Matrix der Score-Residuen sein. Die Varianz-Kovarianz-Matrix hat die folgende Form:

Dabei gilt: und ist die reduzierte Score-Restmatrix. Um die reduzierte Bewertungsrestmatrix zu erhalten, ersetzen Sie jeden Cluster von Bewertungsrestzeilen durch die Summe dieser Restzeilen.

Eine Analyse, die die robuste Varianz-Kovarianz-Matrix verwendet, weist die folgenden Merkmale auf:

Berechnungen für Inferenzen verwenden die robuste Varianz-Kovarianz-Matrix.
Die Wald- und Score-Tests in der Goodness-of-Fit-Tabelle verwenden die robuste Varianz-Kovarianz-Matrix. Der Wahrscheinlichkeitsverhältnistest in der Goodness-of-Fit-Tabelle fehlt, da der Wahrscheinlichkeitsverhältnistest davon ausgeht, dass die Beobachtungen innerhalb eines Clusters unabhängig sind.
Die ANOVA-Tabelle kann nur den Wald-Test verwenden.

¹ Andersen, P. K., Borgon, O., Gill, R.D., und Keiden, N. (1993). Statistische Modelle basierend auf Zählprozessen. Springer-Verlag.

² Fleming, T. R., und Harrington, D. P. (1991). Zählprozesse und Überlebensanalyse. Wiley.

³ Therneau, T.M. (1999). Technische Berichtsreihe Nr. 53: Ein Paket zur Überlebensanalyse in S.

⁴ Lin, D.Y. & Wei, L.J. (1989). Die robuste Inferenz für das Cox-Proportional-Hazards-Modell. Journal of the American Statistical Association, 84 (408), 1074-1078. https://doi.org/10.1080/01621459.1989.10478874