Methoden und Formeln für Schätzmethoden in Verteilungsfreie Analyse (Rechtszensierung)

In diesem Thema

Kaplan-Meier-Schätzmethode
Versicherungsmathematische Schätzmethode
Turnbull-Schätzmethode
Konfidenzintervalle

Kaplan-Meier-Schätzmethode

Mit dem Kaplan-Meier-Schätzwert, der auch als Produktlimitschätzung bezeichnet wird, können Überlebenswahrscheinlichkeiten für verteilungsfreie Datensätze mit mehreren Ausfällen und Aussetzungen berechnet werden. Die Gleichung des Schätzwerts lautet wie folgt:

mit S(t₀) = 1 und t₀ = 0.

Empirische Hazard-Funktion

Die Hazard-Funktion beschreibt die Ausfallrate für ein Intervall. Vor der ersten zensierten Beobachtung ist die Hazard-Funktion 0. Die Hazard-Funktion ändert sich nur bei unzensierten Beobachtungen. Minitab stellt die Hazard-Funktion nach dem letzten unzensierten Datenpunkt nicht dar.

Wenn Bindungen vorhanden sind, verwendet Minitab den größten Rang in der Bindung, um die Hazard-Funktion zu schätzen. Weitere Informationen finden Sie bei Nelson¹.

Mittlere Zeit bis zum Ausfall

Für unzensierte Daten entspricht die mittlere Zeit bis zum Ausfall der durchschnittlichen Ausfallzeit. Die allgemeine Formel für zensierte oder unzensierte Daten lautet wie folgt:

Wenn die größte Beobachtung zensiert ist, behandelt Minitab die Zeit der größten unzensierten Beobachtung zudem als Zeitlimit für die Berechnung. Weitere Informationen finden Sie bei Lee².

Standardfehler der MTTF

Der Standardfehler der mittleren Zeit bis zum Ausfall ist die Quadratwurzel der Varianz. Wenn alle Beobachtungen unzensiert sind, berechnet Minitab einen erwartungstreuen Schätzwert:

Für die Fälle, in denen einige Daten zensiert sind, wird der erwartungstreue Schätzwert der Varianz mit der folgenden Formel ausgedrückt:

Aufgrund der Form der empirischen Hazard-Funktion sind die Flächen unter der Überlebenskurve A_r Rechtecke, deren Höhen der Überlebensfunktion und deren Längen den Intervallen zwischen unzensierten Beobachtungen entsprechen.

Notation

Begriff	Beschreibung
t_r	Zeit des Datenpunkts mit Rang r
r	Rang des Datenpunkts, wobei der früheste Ausfall den niedrigsten Rang aufweist
n	Gesamtzahl der Einheiten
δ_r	0, wenn die j-te Beobachtung zensiert ist, oder 1, wenn die j-te Beobachtung unzensiert ist
c	Anzahl der Datenpunkte bis zur nächsten unzensierten Beobachtung
S(t_r)	empirische Überlebensfunktion zum Zeitpunkt t_r
	durchschnittlicher Ausfallstress
A_r	Fläche unter der Kurve des Überlebensdiagramms rechts von t_r
m	Gesamtzahl der unzensierten Beobachtungen

Literaturhinweise

1. W. Nelson (1982). Applied Life Data Analysis. Applied Life Data Analysis. S. 133.

2. Elisa T. Lee (1992). Statistical Methods for Survival Data Analysis, Second Edition. John Wiley & Sons, Inc. S. 73-76.

Versicherungsmathematische Schätzmethode

Das versicherungsmathematische Modell ist eine alternative verteilungsfreie Analyse, bei der Informationen für Gruppierungen von Ausfallzeiten angezeigt werden. Bei der Kaplan-Meier-Methode wird angenommen, dass die Aussetzungen in einem Intervall am Ende des Intervalls auftreten, nachdem die Ausfälle aufgetreten sind. Im versicherungsmathematischen Modell von Minitab wird angenommen, dass die Aussetzungen in der Mitte des Intervalls auftreten; hierdurch wird die Anzahl der verfügbaren Einheiten im Intervall verringert. Der Schätzwert der Überlebensfunktion bei Verwendung der versicherungsmathematischen Funktion wird wie folgt ausgedrückt:

für i = 0

für i > 0

Empirische Hazard-Funktion

Die Hazard-Funktion beschreibt die Ausfallrate für ein Intervall. Bei der versicherungsmathematischen Schätzmethode wird angenommen, dass die Berechnung für den Mittelpunkt des Intervalls erfolgt. Im Hazard-Diagramm wird die Funktion von Mittelpunkt zu Mittelpunkt gezeichnet. Weitere Einzelheiten finden Sie in den Literaturhinweisen nach dem Abschnitt „Notation“.

Notation

Begriff	Beschreibung
n_i	Anzahl der Einheiten, die in ein Intervall eingehen
d_i	Anzahl der Ausfälle im Intervall
n'_i
	zensierte Anzahl in einem Intervall
	bedingte Wahrscheinlichkeit eines Ereignisses; diese ist gleich d_i/n'_i

t_mi	Zeit zum Mittelpunkt des versicherungsmathematischen Intervalls
b_i	Länge des versicherungsmathematischen Intervalls

Literaturhinweise

Collett, D. (1994) Modelling Survival Data in Medical Research, Chapman and Hall.

Lee, Elisa T. (1992) Statistical Methods for Survival Data Analysis, 2nd Edition, John Wiley & Sons.

Turnbull-Schätzmethode

Turnbull^{1, 2} hat einen iterativen Algorithmus zum Berechnen eines verteilungsfreien Maximum-Likelihood-Schätzwerts der kumulativen Verteilungsfunktion für die Daten entwickelt. Diese Methode gilt für allgemeinere Situationen, z. B. bei einander überschneidenden Intervallen.

In der Minitab-Ausgabe werden eine Zusammenfassung des Turnbull-Schätzwerts der Intervallwahrscheinlichkeiten sowie die Standardfehler für diese Wahrscheinlichkeiten angezeigt.

Literaturhinweise

B. W. Turnbull (1976). „The Empirical Distribution Function with Arbitrarily Grouped, Censored and Truncated Data“, Journal of the Royal Statistical Society 38, S. 290-295.
B. W. Turnbull (1974). „Nonparametric Estimation of a Survivorship Function with Doubly Censored Data“, Journal of the American Statistical Association 69, 345, S. 169-173.

Konfidenzintervalle

Minitab verwendet ungeachtet der Schätzmethode eine Normal-Approximation, um Konfidenzintervalle zu berechnen. Die Konfidenzintervalle werden wie folgt ausgedrückt:

Formel

Schätzwert der Überlebenswahrscheinlichkeit z_α × Standardfehler des Schätzwerts

Notation

Begriff	Beschreibung
z_α	der obere kritische Wert für die Standardnormalverteilung
α	Konfidenzniveau