Der angepasste Wert wird auch als Ereigniswahrscheinlichkeit oder prognostizierte Wahrscheinlichkeit bezeichnet. Die Ereigniswahrscheinlichkeit ist die Chance, dass ein bestimmtes Ergebnis oder Ereignis eintritt. Die Ereigniswahrscheinlichkeit ist ein Schätzwert, der angibt, mit welcher Wahrscheinlichkeit ein bestimmtes Ereignis eintritt, z. B. ein Ass aus einem Kartenspiel zu ziehen oder ein unzulängliches Teil herzustellen. Die Wahrscheinlichkeit eines Ereignisses liegt zwischen 0 (unmöglich) und 1 (sicher).
Bei der binären logistischen Regression hat eine binäre Antwortvariable nur zwei mögliche Ergebnisse, beispielsweise Erkrankung oder Nichterkrankung. Die Ereigniswahrscheinlichkeit ist die Wahrscheinlichkeit, mit der der Wert der Antwortvariablen für einen bestimmten Faktor oder ein bestimmtes Kovariatenmuster 1 oder ein Ereignis ist (z. B. die Wahrscheinlichkeit, mit der bei einer Frau über 50 Jahre Diabetes vom Typ 2 ausbricht).
Jeder Durchlauf in einem Experiment wird als Versuch bezeichnet. Wenn Sie beispielsweise eine Münze zehnmal werfen und die Anzahl der Würfe mit „Kopf“ festhalten, führen Sie zehn Versuche des Experiments durch. Wenn die Versuche unabhängig und gleich wahrscheinlich sind, können Sie die Ereigniswahrscheinlichkeit schätzen, indem Sie Anzahl der Ereignisse durch die Gesamtzahl der Versuche dividieren. Wenn Sie beispielsweise bei zehn Münzwürfen sechsmal „Kopf“ werfen, errechnet sich die geschätzte Wahrscheinlichkeit des Ereignisses („Kopf“) wie folgt:
Anzahl der Ereignisse ÷ Anzahl der Versuche = 6 ÷ 10 = 0,6
Bei der ordinalen und nominalen logistischen Regression kann eine Antwortvariable drei oder mehr Kategorien aufweisen. Die Ereigniswahrscheinlichkeit gibt an, mit welcher Wahrscheinlichkeit ein gegebener Faktor oder ein gegebenes Kovariatenmuster eine bestimmte Kategorie der Antwortvariablen aufweist. Die kumulative Ereigniswahrscheinlichkeit ist die Wahrscheinlichkeit, mit der der Wert der Antwortvariablen für einen bestimmten Faktor oder ein bestimmtes Kovariatenmuster in die Kategorie k oder darunter fällt (für jedes mögliche k), wobei k gleich den Kategorien der Antwortvariablen 1…k ist.
Das Residuum ist ein Maß dafür, wie genau die Beobachtung durch das Modell prognostiziert wird. Beobachtungen, an die das Modell schlecht angepasst ist, weisen große Residuen auf. Minitab berechnet die Residuen für jedes eindeutige Faktoren-/Kovariatenmuster.
Stellen Sie die Residuen grafisch dar, um zu ermitteln, ob das Modell angemessen ist und die Annahmen für die Regression erfüllt. Eine Untersuchung der Residuen kann nützliche Informationen darüber liefern, wie gut das Modell an die Daten angepasst ist. Im Allgemeinen sollten die Residuen zufällig verteilt sein und weder offensichtliche Muster noch ungewöhnliche Werte aufweisen. Wenn Minitab feststellt, dass die Daten ungewöhnliche Beobachtungen enthalten, werden diese Beobachtungen in der Tabelle „Anpassungen und Bewertung für ungewöhnliche Beobachtungen“ in der Ausgabe identifiziert. Weitere Informationen zu ungewöhnlichen Werten finden Sie unter Ungewöhnliche Beobachtungen.
Das standardisierte Residuum entspricht dem Wert eines Residuums ei dividiert durch einen Schätzwert von dessen Standardabweichung.
Verwenden Sie die standardisierten Residuen, um Ausreißer zu erkennen. Standardisierte Residuen größer als 2 bzw. kleiner als −2 werden im Allgemeinen als groß erachtet. In der Tabelle „Anpassungen und Bewertung für ungewöhnliche Beobachtungen“ werden die betreffenden Beobachtungen mit einem „R“ gekennzeichnet. Wenn eine Analyse darauf hindeutet, dass viele ungewöhnliche Beobachtungen vorliegen, weist das Modell in der Regel eine signifikante fehlende Anpassung auf. Dies bedeutet, dass das Modell die Beziehung zwischen den Faktoren und der Antwortvariablen nicht adäquat beschreibt. Weitere Informationen finden Sie unter Ungewöhnliche Beobachtungen.
Standardisierte Residuen sind hilfreich, da Rohresiduen u. U. keine geeigneten Anzeichen für Ausreißer darstellen. Die Varianz jedes Rohresiduums kann um die mit ihm verbundenen x-Werte abweichen. Diese ungleichen Skalen erschweren es, die Größen der Rohresiduen zu beurteilen. Durch das Standardisieren der Residuen wird dieses Problem behoben, indem die unterschiedlichen Varianzen in eine gemeinsame Skala konvertiert werden.