Methoden und Formeln für Schätzmethoden in Verteilungsfreie Analyse (Rechtszensierung)

Kaplan-Meier-Schätzmethode

Mit dem Kaplan-Meier-Schätzwert, der auch als Produktlimitschätzung bezeichnet wird, können Überlebenswahrscheinlichkeiten für verteilungsfreie Datensätze mit mehreren Ausfällen und Aussetzungen berechnet werden. Die Gleichung des Schätzwerts lautet wie folgt:

mit S(t0) = 1 und t0 = 0.

Empirische Hazard-Funktion

Die Hazard-Funktion beschreibt die Ausfallrate für ein Intervall. Vor der ersten zensierten Beobachtung ist die Hazard-Funktion 0. Die Hazard-Funktion ändert sich nur bei unzensierten Beobachtungen. Minitab stellt die Hazard-Funktion nach dem letzten unzensierten Datenpunkt nicht dar.

Wenn Bindungen vorhanden sind, verwendet Minitab den größten Rang in der Bindung, um die Hazard-Funktion zu schätzen. Weitere Informationen finden Sie bei Nelson1.

Mittlere Zeit bis zum Ausfall

Für unzensierte Daten entspricht die mittlere Zeit bis zum Ausfall der durchschnittlichen Ausfallzeit. Die allgemeine Formel für zensierte oder unzensierte Daten lautet wie folgt:

Wenn die größte Beobachtung zensiert ist, behandelt Minitab die Zeit der größten unzensierten Beobachtung zudem als Zeitlimit für die Berechnung. Weitere Informationen finden Sie bei Lee2.

Standardfehler der MTTF

Der Standardfehler der mittleren Zeit bis zum Ausfall ist die Quadratwurzel der Varianz. Wenn alle Beobachtungen unzensiert sind, berechnet Minitab einen erwartungstreuen Schätzwert:

Für die Fälle, in denen einige Daten zensiert sind, wird der erwartungstreue Schätzwert der Varianz mit der folgenden Formel ausgedrückt:

Aufgrund der Form der empirischen Hazard-Funktion sind die Flächen unter der Überlebenskurve Ar Rechtecke, deren Höhen der Überlebensfunktion und deren Längen den Intervallen zwischen unzensierten Beobachtungen entsprechen.

Notation

BegriffBeschreibung
tr Zeit des Datenpunkts mit Rang r
rRang des Datenpunkts, wobei der früheste Ausfall den niedrigsten Rang aufweist
nGesamtzahl der Einheiten
δr 0, wenn die j-te Beobachtung zensiert ist, oder 1, wenn die j-te Beobachtung unzensiert ist
cAnzahl der Datenpunkte bis zur nächsten unzensierten Beobachtung
S(tr)empirische Überlebensfunktion zum Zeitpunkt tr
durchschnittlicher Ausfallstress
ArFläche unter der Kurve des Überlebensdiagramms rechts von tr
mGesamtzahl der unzensierten Beobachtungen

Literaturhinweise

1. W. Nelson (1982). Applied Life Data Analysis. Applied Life Data Analysis. S. 133.

2. Elisa T. Lee (1992). Statistical Methods for Survival Data Analysis, Second Edition. John Wiley & Sons, Inc. S. 73-76.

Versicherungsmathematische Schätzmethode

Das versicherungsmathematische Modell ist eine alternative verteilungsfreie Analyse, bei der Informationen für Gruppierungen von Ausfallzeiten angezeigt werden. Bei der Kaplan-Meier-Methode wird angenommen, dass die Aussetzungen in einem Intervall am Ende des Intervalls auftreten, nachdem die Ausfälle aufgetreten sind. Im versicherungsmathematischen Modell von Minitab wird angenommen, dass die Aussetzungen in der Mitte des Intervalls auftreten; hierdurch wird die Anzahl der verfügbaren Einheiten im Intervall verringert. Der Schätzwert der Überlebensfunktion bei Verwendung der versicherungsmathematischen Funktion wird wie folgt ausgedrückt:

für i = 0

für i > 0

Empirische Hazard-Funktion

Die Hazard-Funktion beschreibt die Ausfallrate für ein Intervall. Bei der versicherungsmathematischen Schätzmethode wird angenommen, dass die Berechnung für den Mittelpunkt des Intervalls erfolgt. Im Hazard-Diagramm wird die Funktion von Mittelpunkt zu Mittelpunkt gezeichnet. Weitere Einzelheiten finden Sie in den Literaturhinweisen nach dem Abschnitt „Notation“.

Notation

BegriffBeschreibung
ni Anzahl der Einheiten, die in ein Intervall eingehen
di Anzahl der Ausfälle im Intervall
n'i
zensierte Anzahl in einem Intervall
bedingte Wahrscheinlichkeit eines Ereignisses; diese ist gleich di/n'i
tmiZeit zum Mittelpunkt des versicherungsmathematischen Intervalls
biLänge des versicherungsmathematischen Intervalls

Literaturhinweise

Collett, D. (1994) Modelling Survival Data in Medical Research, Chapman and Hall.

Lee, Elisa T. (1992) Statistical Methods for Survival Data Analysis, 2nd Edition, John Wiley & Sons.

Turnbull-Schätzmethode

Turnbull1, 2 hat einen iterativen Algorithmus zum Berechnen eines verteilungsfreien Maximum-Likelihood-Schätzwerts der kumulativen Verteilungsfunktion für die Daten entwickelt. Diese Methode gilt für allgemeinere Situationen, z. B. bei einander überschneidenden Intervallen.

In der Minitab-Ausgabe werden eine Zusammenfassung des Turnbull-Schätzwerts der Intervallwahrscheinlichkeiten sowie die Standardfehler für diese Wahrscheinlichkeiten angezeigt.

Literaturhinweise

  1. B. W. Turnbull (1976). „The Empirical Distribution Function with Arbitrarily Grouped, Censored and Truncated Data“, Journal of the Royal Statistical Society 38, S. 290-295.
  2. B. W. Turnbull (1974). „Nonparametric Estimation of a Survivorship Function with Doubly Censored Data“, Journal of the American Statistical Association 69, 345, S. 169-173.

Konfidenzintervalle

Minitab verwendet ungeachtet der Schätzmethode eine Normal-Approximation, um Konfidenzintervalle zu berechnen. Die Konfidenzintervalle werden wie folgt ausgedrückt:

Formel

Schätzwert der Überlebenswahrscheinlichkeit zα × Standardfehler des Schätzwerts

Notation

BegriffBeschreibung
zα der obere kritische Wert für die Standardnormalverteilung
α Konfidenzniveau