Tabelle der Anpassungen und Bewertung für Binäre Antwort für definitiven Screening-Versuchsplan analysieren

Beobachtete Wahrscheinlichkeit

Die beobachtete Wahrscheinlichkeit ist die Anzahl der Ereignisse dividiert durch die Anzahl der Versuche. Wenn die Anzahl der Ereignisse beispielsweise 30 und die Anzahl der Versuche 495 beträgt, ist die beobachtete Wahrscheinlichkeit gleich 0,06061.

Anpassung

Der angepasste Wert wird auch als Ereigniswahrscheinlichkeit oder prognostizierte Wahrscheinlichkeit bezeichnet. Die Ereigniswahrscheinlichkeit ist die Chance, mit der ein bestimmtes Ereignis im Experiment auftritt. Die Ereigniswahrscheinlichkeit ist ein Schätzwert, der angibt, mit welcher Wahrscheinlichkeit ein Ereignis im Versuch eintritt, z. B. ein Ass aus einem Kartenspiel zu ziehen oder ein unzulängliches Teil herzustellen. Die Wahrscheinlichkeit eines Ereignisses liegt zwischen 0 (unmöglich) und 1 (sicher).

Interpretation

Die Antwortvariable im Versuch hat nur zwei mögliche Werte, beispielsweise Erkrankung oder Nichterkrankung. Die Ereigniswahrscheinlichkeit ist die Wahrscheinlichkeit, mit der der Wert der Antwortvariablen für ein bestimmtes Faktor- oder Kovariatenmuster auftritt (z. B. die Wahrscheinlichkeit, mit der sich bei einer Frau über 50 Diabetes vom Typ 2 entwickelt).

Jeder Durchlauf in einem Experiment wird als Versuch bezeichnet. Wenn Sie beispielsweise eine Münze zehnmal werfen und die Anzahl der Würfe mit „Kopf“ festhalten, führen Sie zehn Versuche des Experiments durch. Wenn die Versuche unabhängig und gleich wahrscheinlich sind, können Sie die Ereigniswahrscheinlichkeit schätzen, indem Sie Anzahl der Ereignisse durch die Gesamtzahl der Versuche dividieren. Wenn Sie beispielsweise bei zehn Münzwürfen sechsmal „Kopf“ werfen, errechnet sich die geschätzte Wahrscheinlichkeit des Ereignisses („Kopf“) wie folgt:

Anzahl der Ereignisse ÷ Anzahl der Versuche = 6 ÷ 10 = 0,6

SE Anpassung

Der Standardfehler der Anpassung (SE Anpassung) ist ein Schätzwert der Streuung in der Ereigniswahrscheinlichkeit für die angegebenen Variableneinstellungen. Der Standardfehler der Anpassung wird bei der Berechnung des Konfidenzintervalls für die Ereigniswahrscheinlichkeit verwendet. Standardfehler sind immer nicht negativ.

Interpretation

Verwenden Sie den Standardfehler der Anpassung, um zu ermitteln, wie genau der Schätzwert für die Ereigniswahrscheinlichkeit ist. Je kleiner der Standardfehler, desto genauer ist der prognostizierte Mittelwert der Antwortvariablen.

Ein Forscher untersucht beispielsweise die Faktoren, die sich auf die Aufnahme in eine medizinische Studie auswirken. Für einen Satz von Faktoren beläuft sich die Wahrscheinlichkeit, dass sich ein Patient für die Teilnahme an einer Studie für eine neue Behandlung qualifiziert, auf 0,63, bei einem Standardfehler von 0,05. Für einen zweiten Satz von Faktoreinstellungen wird die gleiche Wahrscheinlichkeit erhalten, jedoch mit einem Standardfehler der Anpassung von 0,03. Der Analytiker kann sich sicherer sein, dass die Ereigniswahrscheinlichkeit für den zweiten Satz von Variableneinstellungen nahe bei 0,63 liegt.

Konfidenzintervall für Anpassung (95%-KI)

Diese Konfidenzintervalle (KI) sind Bereiche von Werten, die wahrscheinlich die Ereigniswahrscheinlichkeit für die Grundgesamtheit enthalten, die die beobachteten Werte der im Modell enthalten Prädiktorvariablen aufweist.

Da die Stichproben zufällig sind, ist es unwahrscheinlich, dass zwei Stichproben aus einer Grundgesamtheit identische Konfidenzintervalle ergeben. Wenn Sie die Stichprobennahme jedoch viele Male wiederholen, enthält ein gewisser Prozentsatz der resultierenden Konfidenzintervalle den unbekannten Parameter der Grundgesamtheit. Der Prozentsatz dieser Konfidenzintervalle, die den Parameter enthalten, stellt das Konfidenzniveau des Intervalls dar.

Das Konfidenzintervall setzt sich aus den folgenden zwei Teilen zusammen:
Punktschätzung
Die Punktschätzung ist der Schätzwert des Parameters, der auf der Grundlage der Stichprobendaten berechnet wird.
Fehlerspanne
Die Fehlerspanne definiert die Breite des Konfidenzintervalls, und sie wird durch die Spannweite der Ereigniswahrscheinlichkeiten, den Stichprobenumfang und das Konfidenzniveau bestimmt.

Interpretation

Verwenden Sie das Konfidenzintervall, um den Schätzwert des angepassten Werts für die beobachteten Werte der Variablen auszuwerten.

Bei einem 95%-Konfidenzniveau können Sie sich beispielsweise zu 95 % sicher sein, dass das Konfidenzintervall die Ereigniswahrscheinlichkeit für die angegebenen Werte der Variablen im Modell enthält. Anhand des Konfidenzintervalls können Sie die praktische Signifikanz Ihrer Ergebnisse beurteilen. Bestimmen Sie anhand Ihrer Fachkenntnisse, ob das Konfidenzintervall Werte umfasst, die in der jeweiligen Situation von praktischer Signifikanz sind. Wenn das Intervall zu breit und damit nicht hilfreich ist, erwägen Sie, den Stichprobenumfang zu vergrößern.

Resid

Das Residuum ist ein Maß dafür, wie genau die Beobachtung durch das Modell prognostiziert wird. In der Standardeinstellung berechnet Minitab die Abweichungsresiduen. Beobachtungen, an die das Modell nicht gut angepasst ist, weisen hohe Abweichungsresiduen und hohe Residuen nach Pearson auf. Minitab berechnet die Residuen für jedes eindeutige Faktoren-/Kovariatenmuster.

Das Residuum wird ungeachtet davon, ob Abweichungsresiduen oder Residuen nach Pearson verwendet werden, gleich interpretiert. Wenn im Modell die Logit-Linkfunktion verwendet wird, liegt die Verteilung der Abweichungsresiduen näher an der Verteilung der Residuen aus einem Regressionsmodell kleinster Quadrate. Bei zunehmender Anzahl der Versuche für jede Kombination von Prädiktoreinstellungen werden die Abweichungsresiduen und die Residuen nach Pearson einander ähnlicher.

Interpretation

Stellen Sie die Residuen grafisch dar, um zu ermitteln, ob das Modell angemessen ist und die Annahmen für die Regression erfüllt. Eine Untersuchung der Residuen kann nützliche Informationen darüber liefern, wie gut das Modell an die Daten angepasst ist. Im Allgemeinen sollten die Residuen zufällig verteilt sein und weder offensichtliche Muster noch ungewöhnliche Werte aufweisen. Wenn Minitab feststellt, dass die Daten ungewöhnliche Beobachtungen enthalten, werden diese Beobachtungen in der Tabelle „Anpassungen und Bewertung für ungewöhnliche Beobachtungen“ in der Ausgabe identifiziert. Weitere Informationen zu ungewöhnlichen Werten finden Sie unter Ungewöhnliche Beobachtungen.

Std. Resid

Das standardisierte Residuum entspricht dem Wert eines Residuums ei dividiert durch einen Schätzwert von dessen Standardabweichung.

Interpretation

Verwenden Sie die standardisierten Residuen, um Ausreißer zu erkennen. Standardisierte Residuen größer als 2 bzw. kleiner als −2 werden im Allgemeinen als groß erachtet. In der Tabelle „Anpassungen und Bewertung für ungewöhnliche Beobachtungen“ werden die betreffenden Beobachtungen mit einem „R“ gekennzeichnet. Wenn eine Analyse darauf hindeutet, dass viele ungewöhnliche Beobachtungen vorliegen, weist das Modell in der Regel eine signifikante fehlende Anpassung auf. Dies bedeutet, dass das Modell die Beziehung zwischen den Faktoren und der Antwortvariablen nicht adäquat beschreibt. Weitere Informationen finden Sie unter Ungewöhnliche Beobachtungen.

Standardisierte Residuen sind hilfreich, da Rohresiduen u. U. keine geeigneten Anzeichen für Ausreißer darstellen. Die Varianz jedes Rohresiduums kann um die mit ihm verbundenen x-Werte abweichen. Diese ungleichen Skalen erschweren es, die Größen der Rohresiduen zu beurteilen. Durch das Standardisieren der Residuen wird dieses Problem behoben, indem die unterschiedlichen Varianzen in eine gemeinsame Skala konvertiert werden.

Das Residuum wird ungeachtet davon, ob Abweichungsresiduen oder Residuen nach Pearson verwendet werden, gleich interpretiert. Wenn im Modell die Logit-Linkfunktion verwendet wird, liegt die Verteilung der Abweichungsresiduen näher an der Verteilung der Residuen aus einem Regressionsmodell kleinster Quadrate. Bei zunehmender Anzahl der Versuche für jede Kombination von Prädiktoreinstellungen werden die Abweichungsresiduen und die Residuen nach Pearson einander ähnlicher.

Entfernte Residuen

Jedes entfernte studentisierte Residuum wird mit einer Formel berechnet, die diesem Verfahren entspricht: Jede einzelne Beobachtung wird systematisch aus dem Datensatz entfernt, die Regressionsgleichung wird geschätzt, und es wird ermittelt, wie genau das Modell die entfernte Beobachtung prognostiziert. Jedes entfernte studentisierte Residuum wird zudem standardisiert, indem das entfernte Residuum einer Beobachtung durch einen Schätzwert seiner Standardabweichung dividiert wird. Die Beobachtung wird entfernt, um das Verhalten des Modells ohne die betreffende Beobachtung zu ermitteln. Wenn eine Beobachtung ein großes studentisiertes entferntes Residuum aufweist (dessen Absolutwert größer als 2 ist), kann es sich um einen Ausreißer in den Daten handeln.

Interpretation

Verwenden Sie die entfernten studentisierten Residuen, um Ausreißer zu erkennen. Jede Beobachtung wird entfernt, um zu ermitteln, wie genau das Modell die Antwortvariable prognostiziert, wenn sie nicht in den Prozess der Modellanpassung eingebunden wird. Entfernte studentisierte Residuen größer als 2 oder kleiner als −2 werden in der Regel als groß erachtet. Die von Minitab gekennzeichneten Beobachtungen werden durch die vorgeschlagene Regressionsgleichung nicht gut modelliert. Es ist jedoch zu erwarten, dass einige ungewöhnliche Beobachtungen vorliegen. Entsprechend den Kriterien für große Residuen ist beispielsweise zu erwarten, dass ca. 5 % der Beobachtungen als Beobachtungen mit einem großen Residuum gekennzeichnet werden. Wenn die Analyse viele ungewöhnliche Beobachtungen aufdeckt, beschreibt das Modell die Beziehung zwischen den Prädiktoren und der Antwortvariablen höchstwahrscheinlich nicht adäquat. Weitere Informationen finden Sie unter Ungewöhnliche Beobachtungen.

Standardisierte und entfernte Residuen können beim Ermitteln von Ausreißern nützlicher als Rohresiduen sein. Es wird eine Korrektur für mögliche Differenzen in der Varianz der Rohresiduen vorgenommen, die auf unterschiedliche Werte der Prädiktoren oder Faktoren zurückzuführen sind.

Hoch (Hebelwirkung)

„Hoch“ (auch als Hebelwirkung bezeichnet) ist ein Maß für den Abstand vom x-Wert einer Beobachtung zum Durchschnitt der x-Werte aller Beobachtungen in einem Datensatz.

Interpretation

Hoch-Werte liegen zwischen 0 und 1. Minitab kennzeichnet Beobachtungen mit Hebelwirkungswerten von mehr als 3p/n oder, falls kleiner, 0,99 in der Tabelle „Anpassungen und Bewertung für ungewöhnliche Beobachtungen“ mit einem „X“. Im Ausdruck 3p/n ist p die Anzahl der Koeffizienten im Modell und n die Anzahl der Beobachtungen. Die von Minitab mit einem „X“ gekennzeichneten Beobachtungen können einflussreich sein.

Beobachtungen mit großem Einfluss wirken sich disproportional auf das Modell aus und können irreführende Ergebnisse verursachen. Das Einbinden oder Ausschließen eines einflussreichen Punkts könnte beispielsweise ändern, ob ein Koeffizient statistisch signifikant ist. Beobachtungen mit großem Einfluss können Hebelwirkungspunkte, Ausreißer oder beides sein.

Wenn Sie eine einflussreiche Beobachtung feststellen, ermitteln Sie, ob es sich bei der Beobachtung um einen Dateneingabe- oder Messfehler handelt. Wenn die Beobachtung weder einen Dateneingabefehler noch einen Messfehler darstellt, ermitteln Sie, wie einflussreich die Beobachtung ist. Passen Sie das Modell zuerst mit der Beobachtung und dann ohne die Beobachtung an. Vergleichen Sie anschließend die Koeffizienten, p-Werte, R2-Werte und weitere Modellinformationen. Wenn sich das Modell nach Entfernen der einflussreichen Beobachtung signifikant ändert, untersuchen Sie das Modell eingehender, um festzustellen, ob Sie das Modell falsch angegeben haben. Möglicherweise müssen Sie weitere Daten erfassen, um das Problem zu beheben.

Cook-Distanz (D)

Die Cook-Distanz (D) ist ein Maß für den Effekt einer Beobachtung auf eine Gruppe von Koeffizienten in einem linearen Modell. Bei der Cook-Distanz werden sowohl die Hebelwirkung als auch das standardisierte Residuum jeder Beobachtung berücksichtigt, um den Effekt der betreffenden Beobachtung zu ermitteln.

Interpretation

Beobachtungen mit einem großen D-Wert können einflussreich sein. Ein D-Wert wird häufig als groß betrachtet, wenn er größer als der Median der F-Verteilung F(0,5; p; n–p) ist, wobei p die Anzahl der Modellterme einschließlich der Konstanten und n die Anzahl der Beobachtungen ist. Sie können die D-Werte auch untersuchen, indem Sie sie in einer Grafik vergleichen, beispielsweise in einem Einzelwertdiagramm. Beobachtungen, deren D-Werte im Verhältnis zu denen anderer Beobachtungen groß sind, können einen starken Einfluss ausüben.

Beobachtungen mit großem Einfluss wirken sich disproportional auf das Modell aus und können irreführende Ergebnisse verursachen. Das Einbinden oder Ausschließen eines einflussreichen Punkts könnte beispielsweise ändern, ob ein Koeffizient statistisch signifikant ist. Beobachtungen mit großem Einfluss können Hebelwirkungspunkte, Ausreißer oder beides sein.

Wenn Sie eine einflussreiche Beobachtung feststellen, ermitteln Sie, ob es sich bei der Beobachtung um einen Dateneingabe- oder Messfehler handelt. Wenn die Beobachtung weder einen Dateneingabefehler noch einen Messfehler darstellt, ermitteln Sie, wie einflussreich die Beobachtung ist. Passen Sie das Modell zuerst mit der Beobachtung und dann ohne die Beobachtung an. Vergleichen Sie anschließend die Koeffizienten, p-Werte, R2-Werte und weitere Modellinformationen. Wenn sich das Modell nach Entfernen der einflussreichen Beobachtung signifikant ändert, untersuchen Sie das Modell eingehender, um festzustellen, ob Sie das Modell falsch angegeben haben. Möglicherweise müssen Sie weitere Daten erfassen, um das Problem zu beheben.

DFITS

DFITS ist ein Maß für den Effekt der einzelnen Beobachtungen auf die angepassten Werte in einem linearen Modell. DFITS stellt die annähernde Anzahl der Standardabweichungen dar, um die sich der angepasste Wert ändert, wenn je eine Beobachtung aus dem Datensatz entfernt und das Modell erneut angepasst wird.

Interpretation

Beobachtungen mit einem großen DFITS-Wert können einflussreich sein. Häufig wird ein DFITS-Wert als groß betrachtet, wenn er den folgenden Wert überschreitet:
BegriffBeschreibung
pAnzahl der Modellterme
nAnzahl der Beobachtungen

Wenn Sie eine einflussreiche Beobachtung feststellen, ermitteln Sie, ob es sich bei der Beobachtung um einen Dateneingabe- oder Messfehler handelt. Wenn die Beobachtung weder einen Dateneingabefehler noch einen Messfehler darstellt, ermitteln Sie, wie einflussreich die Beobachtung ist. Passen Sie das Modell zuerst mit der Beobachtung und dann ohne die Beobachtung an. Vergleichen Sie anschließend die Koeffizienten, p-Werte, R2-Werte und weitere Modellinformationen. Wenn sich das Modell nach Entfernen der einflussreichen Beobachtung signifikant ändert, untersuchen Sie das Modell eingehender, um festzustellen, ob Sie das Modell falsch angegeben haben. Möglicherweise müssen Sie weitere Daten erfassen, um das Problem zu beheben.