Für jedes Fach
lass
die Step-Funktion sein, die die Anzahl der Ereignisse darstellt, die
Erlebnisse
bis zur Zeit . Dann
stellt einen Zählvorgang für das Subjekt dar . Sei
eine Indikatorvariable sein, die den Wert 1 hat, wenn das Subjekt
i zum Zeitpunkt
t gefährdet ist und andernfalls 0, was äquivalent ist zu
wenn
und sonst
Das Cox-Proportional-Hazards-Modell geht davon aus, dass die Hazard-Rate zum
Zeitpunkt Für
Einzelwerte mit einem
Vektor von Prädiktorwerten
Hat die folgende Form:
Dabei gilt:
ist die Baseline-Hazard-Rate, die die nicht spezifizierte Verteilung der
Überlebenszeit charakterisiert und
ist ein
p-Komponentenvektor unbekannter Regressionskoeffizienten.
Zum Beispiel eine Formulierung des Cox-Proportional-Hazards-Modells als
Zählprozess basierend auf Andersen et al. (1993)1 und Fleming und Harrington (1991)2, unter der
Annahme, dass keine gebundenen Ereigniszeiten vorliegen, hat eine partielle
Logwahrscheinlichkeit mit der folgenden Form:
Der Vektor partieller Derivate in Bezug auf die Komponenten von
Hat die folgende Form:
Die
p-mal-p-Informationsmatrix hat die folgende Form:
wobei der gewichtete Mittelwert der zu einem Zeitpunkt gefährdeten Probanden
Hat die
folgende Form:
Diese Formulierung des Cox-Proportional-Hazards-Modells ist das
multiplikative Hazards-Modell. Das multiplikative Gefahrenmodell weist folgende
Merkmale auf:
Das Subjekt kann mehr als ein
Ereignis von Interesse erleben.
Das Subjekt kann ein Ereignis
mehrmals erleben. Diese Aussage bedeutet, dass die Indikatorvariable, die
angibt, ob das Subjekt gefährdet ist, ,
kann zustände von 1 auf 0 und wieder zurück mehrmals ändern.
Das Subjekt kann nach Zeit 0
in die Studie eintreten. Diese Aussage entspricht der Vorstellung, dass ein
Subjekt nach Zeit 0 in die Risikomenge eintreten kann. Eine Zeit wird links
abgeschnitten, wenn der Betreff nach Zeit 0 eingegeben wird.
Therneau (1999)3 enthält Details zur Eingabeform des Zählprozesses von Daten. Die
Eingabeform der Daten des Zählprozesses bietet eine Technik, um das
multiplikative Gefahrenmodell mit den gleichen Algorithmen zu passen, die dem
Cox-Proportionalgefahrenmodell entsprechen.
Das Eingabeformular für den Zählprozess
Im Eingabeformular des Zählprozesses stellen mehrere Zeilen jedes Thema dar.
Jede Zeile beschreibt ein Zeitintervall, in dem die Werte aller Variablen
konstant sind. Zeitabhängige Prädiktoren ändern sich zwischen Zeilen. Die
Intervalle beginnen direkt nach der Startzeit und schließen die Endzeit ein.
Die Startzeit für das Intervall ist die Eingabezeit für das Subjekt. Die
Endzeit ist die Antwortvariable für das Subjekt. Die Zensurspalte gibt jede
Zeile an, in der die Endzeit keine Ereigniszeit ist.
Korrelierte Beobachtungen und der robuste Kovarianzschätzer
Obwohl mehrere Zeilen jedes Subjekt im Eingabeformular des Zählprozesses
darstellen, trägt jeweils nur eine Zeile der Beobachtungen pro Subjekt zur
Wahrscheinlichkeit bei, es sei denn, es besteht eine Korrelation zwischen den
Beobachtungen in einer Untergruppe, die sich auf jedes Subjekt beziehen.
Beispielsweise werden die Beobachtungen der Probanden in Modellen korreliert,
die wiederholte oder wiederkehrende Ereignisse enthalten. Lin und Wei
(1989)4
eine Anpassung der Kovarianzmatrix vorschlagen, um die Korrelation zwischen
Beobachtungen innerhalb des Subjekts zu berücksichtigen. Sei
die Matrix der Score-Residuen sein. Die Varianz-Kovarianz-Matrix hat die
folgende Form:
Dabei gilt:
und
ist die reduzierte Score-Restmatrix. Um die reduzierte Bewertungsrestmatrix zu
erhalten, ersetzen Sie jeden Cluster von Bewertungsrestzeilen durch die Summe
dieser Restzeilen.
Eine Analyse, die die robuste Varianz-Kovarianz-Matrix verwendet, weist die
folgenden Merkmale auf:
Berechnungen für Inferenzen
verwenden die robuste Varianz-Kovarianz-Matrix.
Die Wald- und Score-Tests in
der Goodness-of-Fit-Tabelle verwenden die robuste Varianz-Kovarianz-Matrix. Der
Wahrscheinlichkeitsverhältnistest in der Goodness-of-Fit-Tabelle fehlt, da der
Wahrscheinlichkeitsverhältnistest davon ausgeht, dass die Beobachtungen
innerhalb eines Clusters unabhängig sind.
Die ANOVA-Tabelle kann nur den
Wald-Test verwenden.
1 Andersen, P. K., Borgon,
O., Gill, R.D., und Keiden, N. (1993).
Statistische Modelle basierend auf Zählprozessen.
Springer-Verlag.
2 Fleming, T. R., und
Harrington, D. P. (1991).
Zählprozesse und Überlebensanalyse. Wiley.
3 Therneau, T.M. (1999).
Technische Berichtsreihe Nr. 53: Ein Paket zur Überlebensanalyse in
S.
4 Lin, D.Y. & Wei, L.J. (1989). Die robuste Inferenz für das
Cox-Proportional-Hazards-Modell.
Journal of the American Statistical Association, 84 (408),
1074-1078.
https://doi.org/10.1080/01621459.1989.10478874