Interpretieren der wichtigsten Ergebnisse für Darstellung der Anpassungslinie

Führen Sie die folgenden Schritte aus, um eine Darstellung der Anpassungslinie zu interpretieren. Zu den wichtigsten Ergebnissen zählen der p-Wert, die Darstellung der Anpassungslinie, R2 und die Residuendiagramme.

Schritt 1: Bestimmen, ob die Assoziation zwischen der Antwortvariablen und dem Term statistisch signifikant ist

Um zu bestimmen, ob die Assoziation zwischen der Antwortvariablen und jedem Term im Modell statistisch signifikant ist, vergleichen Sie den p-Wert für den Term mit dem Signifikanzniveau, um die Nullhypothese auszuwerten. Die Nullhypothese besagt, dass der Koeffizient des Terms gleich null ist, was darauf hinweist, dass keine Assoziation zwischen dem Term und der Antwortvariablen besteht. In der Regel ist ein Signifikanzniveau (als α oder Alpha bezeichnet) von 0,05 gut geeignet. Ein Signifikanzniveau von 0,05 bedeutet ein Risiko, dass auf eine vorhandene Assoziation geschlossen wird, während tatsächlich keine vorhanden ist, von 5 %.
p-Wert ≤ α: Die Assoziation ist statistisch signifikant
Wenn der p-Wert kleiner oder gleich dem Signifikanzniveau ist, können Sie schlussfolgern, dass eine statistisch signifikante Assoziation zwischen der Antwortvariablen und dem Term besteht. Wenn Sie ein quadratisches oder ein kubisches Modell anpassen und die quadratischen bzw. kubischen Terme signifikant sind, können Sie schlussfolgern, dass die Daten eine Krümmung aufweisen.
p-Wert > α: Die Assoziation ist statistisch nicht signifikant

Wenn der p-Wert größer als das Signifikanzniveau ist, können Sie nicht schlussfolgern, dass eine statistisch signifikante Assoziation zwischen der Antwortvariablen und dem Term besteht. Wenn Sie ein quadratisches oder ein kubisches Modell anpassen und die quadratischen bzw. kubischen Terme statistisch nicht signifikant sind, empfiehlt es sich möglicherweise, ein anderes Modell auszuwählen.

Varianzanalyse Quelle DF SS MS F p Regression 1 11552,8 11552,8 146,86 0,000 Fehler 27 2124,0 78,7 Gesamt 28 13676,7
Wichtigstes Ergebnis: p-Wert

In diesen Ergebnissen beträgt der p-Wert für die Dichte 0,000 und liegt somit unter dem Signifikanzniveau 0,05. Diese Ergebnisse zeigen, dass die Assoziation zwischen Steife und Dichte statistisch relevant ist.

Schritt 2: Bestimmen, ob die Regressionslinie an Ihre Daten angepasst ist

Werten Sie aus, wie gut das Modell an die Daten angepasst ist und ob es Ihren Zielen gerecht wird. Untersuchen Sie die Darstellung der Anpassungslinie, um festzustellen, ob die folgenden Kriterien erfüllt werden:
  • Die Stichprobe enthält eine angemessene Anzahl von Beobachtungen über die gesamte Spannweite aller Prädiktorwerte.
  • Das Modell ist an eine ggf. vorhandene Krümmung in den Daten angepasst. Wenn Sie ein lineares Modell anpassen und eine Krümmung in den Daten feststellen, wiederholen Sie die Analyse, und wählen Sie das quadratische oder kubische Modell aus. Um das beste Modell zu ermitteln, untersuchen Sie das Diagramm sowie die Statistiken für die Güte der Anpassung. Prüfen Sie den p-Wert für die Terme im Modell, um sich zu vergewissern, dass sie statistisch signifikant sind, und bewerten Sie anhand Ihrer Kenntnis des Prozesses die praktische Signifikanz.
  • Suchen Sie nach Ausreißern, die einen starken Einfluss auf die Ergebnisse ausüben können. Versuchen Sie, die Ursache für die Ausreißer zu ermitteln. Korrigieren Sie sämtliche Dateneingabe- oder Messfehler. Erwägen Sie, Datenwerte zu entfernen, die auf ungewöhnliche, einmalige Ereignisse (Ausnahmebedingungen) zurückzuführen sind. Wiederholen Sie anschließend die Analyse. Weitere Informationen zum Erkennen von Ausreißern finden Sie unter Ungewöhnliche Beobachtungen.
In dieser Darstellung der Anpassungslinie folgen die Punkte allgemein der Regressionslinie. Die Punkte decken die gesamte Spannweite der Dichtewerte angemessen ab. Es scheint keine Krümmung in den Daten vorhanden zu sein. Der Punkt in der rechten oberen Ecke des Diagramms scheint jedoch ein Ausreißer zu sein. Untersuchen Sie diesen Punkt, um dessen Ursache zu ermitteln.

Schritt 3: Untersuchen der Assoziation zwischen Term und Antwortvariable

Wenn der p-Wert des Terms signifikant ist, können Sie die Regressionsgleichung und die Koeffizienten untersuchen, um festzustellen, in welcher Beziehung der Term zur Antwortvariablen steht.

Verwenden Sie die Regressionsgleichung, um die Beziehung zwischen der Antwortvariablen und den Termen im Modell zu beschreiben. Die Regressionsgleichung ist eine algebraische Darstellung der Regressionslinie. Die Regressionsgleichung für das lineare Modell nimmt die folgende Form an: Y = b0 + b1x1. In der Regressionsgleichung steht Y für die Antwortvariable, b0 ist die Konstante bzw. der Schnittpunkt mit der y-Achse, b1 ist der geschätzte Koeffizient für den linearen Term (auch als Steigung der Linie bezeichnet), und x1 steht für den Wert des Terms.

Der Koeffizient des Terms stellt die Änderung des Mittelwerts der Antwortvariablen bei einer Änderung dieses Terms um eine Einheit dar. Das Vorzeichen des Koeffizienten gibt die Richtung der Beziehung zwischen dem Term und der Antwortvariablen an. Wenn der Koeffizient negativ ist, nimmt der Mittelwert der Antwortvariablen bei Zunahme des Terms ab. Wenn der Koeffizient positiv ist, nimmt der Mittelwert der Antwortvariablen bei zunehmendem Term zu.

Ein Manager stellt beispielsweise fest, dass das Ergebnis eines Mitarbeiters in einem Test seiner beruflichen Fähigkeiten mit dem Regressionsmodell y = 130 + 4,3x prognostiziert werden kann. In der Gleichung steht x für die Anzahl der absolvierten Stunden interner Schulung (von 0 bis 20), und y ist das Testergebnis. Der Koeffizient bzw. die Steigung ist 4,3, womit angegeben wird, dass sich das mittlere Testergebnis mit jeder absolvierten Schulungsstunde um 4,3 Punkte erhöht.

Weitere Informationen zu Koeffizienten finden Sie unter Regressionskoeffizienten.

Die Regressionsgleichung lautet Steife = - 21,53 + 3,541 Dichte
Wichtigste Ergebnisse: Regressionsgleichung, Koeffizient

In diesen Ergebnissen beträgt der Koeffizient für den Prädiktor „Dichte“ 3,541. Die durchschnittliche Steife der Spanplatte nimmt mit jeder Zunahme der Dichte um 1 Einheit um ungefähr 3,5 zu. Das Vorzeichen des Koeffizienten ist positiv, was darauf hinweist, dass mit zunehmender Dichte auch die Steife zunimmt.

Schritt 4: Bestimmen, wie gut das Modell an die Daten angepasst ist

Um zu ermitteln, wie gut das Modell an die Daten angepasst ist, untersuchen Sie die Statistiken für die Güte der Anpassung in der Tabelle „Zusammenfassung des Modells“.

R-Qd

R2 gibt den Prozentsatz der Streuung der Antwortvariablen an, der durch das Modell erklärt wird. Je höher das R2, desto besser ist das Modell an die Daten angepasst. Das R2 liegt immer zwischen 0 % und 100 %.

Der Wert von R2 nimmt beim Einbinden zusätzlicher Prädiktoren in das Modell stets zu. Das beste Modell mit fünf Prädiktoren weist beispielsweise immer ein R2 auf, das mindestens so hoch wie das des besten Modells mit vier Prädiktoren ist. Daher ist R2 am nützlichsten, wenn Sie Modelle derselben Größe vergleichen.

R-Qd(kor)

Verwenden Sie das korrigierte R2, wenn Sie Modelle vergleichen möchten, die eine unterschiedliche Anzahl von Prädiktoren enthalten. R2 nimmt stets zu, wenn Sie einen zusätzlichen Prädiktor in das Modell aufnehmen, selbst wenn damit keine tatsächliche Verbesserung des Modells verbunden ist. Der Wert des korrigierten R2 berücksichtigt die Anzahl der Prädiktoren im Modell, so dass Ihnen das Auswählen des richtigen Modells erleichtert wird.

Berücksichtigen Sie beim Vergleich der R2-Werte Folgendes:
  • Kleine Stichproben ermöglichen keinen genauen Schätzwert für die Stärke der Beziehung zwischen der Antwortvariablen und den Prädiktoren. Wenn das R2 genauer sein muss, sollten Sie einen größeren Stichprobenumfang (im Allgemeinen 40 oder mehr) wählen.

  • R2 ist nur eines der Maß für die Güte der Anpassung des Modells an die Daten. Selbst wenn ein Modell ein hohes R2 aufweist, sollten Sie die Residuendiagramme untersuchen, um sich zu vergewissern, dass das Modell die Modellannahmen erfüllt.

Zusammenfassung des Modells S R-Qd R-Qd(kor) 8,86937 84,47% 83,89%
Wichtigstes Ergebnis: R-Qd

In diesen Ergebnissen lassen sich mit der Dichte der Spanplatte 84,5 % der Streuung bei der Steife der Platten erklären. Das R2 gibt an, dass das Modell gut an die Daten angepasst ist.

Schritt 5: Bestimmen, ob das Modell die Annahmen der Analyse erfüllt

Verwenden Sie die Residuendiagramme, um zu ermitteln, ob das Modell angemessen ist und die Annahmen der Analyse erfüllt. Wenn die Annahmen nicht erfüllt werden, ist das Modell u. U. nicht gut an die Daten angepasst, und Sie sollten beim Interpretieren der Ergebnisse vorsichtig sein.

Diagramm der Residuen im Vergleich zu den Anpassungen

Verwenden Sie das Diagramm der Residuen im Vergleich zu den Anpassungen, um die Annahme zu überprüfen, dass die Residuen zufällig verteilt sind und eine konstante Varianz aufweisen. Im Idealfall sollten die Punkte zufällig auf beiden Seiten von null verteilt sein, und es sollten keine Muster in den Punkten erkennbar sein.

Die Muster in der folgenden Tabelle können darauf hinweisen, dass das Modell die Modellannahmen nicht erfüllt.
Muster Mögliche Bedeutung des Musters
Aufgefächerte oder ungleichmäßig gestreute Residuen für die angepassten Werte Nicht konstante Varianz
Krümmung Ein fehlender Term höherer Ordnung
Ein weit von null entfernt liegender Punkt Ein Ausreißer
Ein in x-Richtung weit von den anderen Punkten entfernter Punkt Ein einflussreicher Punkt
In diesem Diagramm der Residuen im Vergleich zu den Anpassungen scheinen die Punkte zufällig im Diagramm gestreut zu sein. Der Punkt in der rechten oberen Ecke scheint jedoch ein Ausreißer zu sein. Versuchen Sie, die Ursache für den Ausreißer zu ermitteln. Korrigieren Sie sämtliche Dateneingabe- oder Messfehler. Erwägen Sie, Datenwerte zu entfernen, die auf ungewöhnliche, einmalige Ereignisse (Ausnahmebedingungen) zurückzuführen sind. Wiederholen Sie anschließend die Analyse.

Diagramm der Residuen im Vergleich zur Reihenfolge

Verwenden Sie das Diagramm der Residuen im Vergleich zur Reihenfolge, um die Annahme zu überprüfen, dass die Residuen zufällig verteilt sind. Bei in chronologischer Reihenfolge angezeigten unabhängigen Residuen sind weder Trends noch Muster zu erkennen. Muster in den Punkten können darauf hinweisen, dass nahe beieinander liegende Residuen korrelieren und daher nicht unabhängig sind. Im Idealfall sollten die Residuen im Diagramm zufällig um die Mittellinie gestreut sein:
Wenn Sie ein Muster erkennen, untersuchen Sie die Ursache. Die folgenden Typen von Mustern können darauf hinweisen, dass die Residuen abhängig sind.
Trend
Shift
Zyklus
In diesem Diagramm der Residuen im Vergleich zur Reihenfolge scheint der Ausreißer, der auch in den anderen Residuendiagrammen zu sehen ist, der Beobachtung in Zeile 21 des Arbeitsblatts zu entsprechen.

Wahrscheinlichkeitsnetz für Normalverteilung

Verwenden Sie das Wahrscheinlichkeitsnetz (Normal) der Residuen, um die Annahme zu überprüfen, dass die Residuen normalverteilt sind. Die Residuen im Wahrscheinlichkeitsnetz für Normalverteilung sollten ungefähr einer Geraden folgen.

Die Muster in der folgenden Tabelle können darauf hinweisen, dass das Modell die Modellannahmen nicht erfüllt.
Muster Mögliche Bedeutung des Musters
Keine Gerade Nicht-Normalverteilung
Ein Punkt weit entfernt von der Linie Ein Ausreißer
Unbeständige Steigung Eine nicht identifizierte Variable
In diesem Wahrscheinlichkeitsnetz für Normalverteilung scheinen die Residuen allgemein einer geraden Linie zu folgen. Der Punkt in der rechten oberen Ecke des Diagramms liegt jedoch weit entfernt von der Linie und scheint ein Ausreißer zu sein, der auch in den anderen Residuendiagrammen zu sehen war.

Weitere Informationen zum Umgang mit Mustern in den Residuendiagrammen finden Sie unter Residuendiagramme für Darstellung der Anpassungslinie.

Durch Ihre Nutzung dieser Website stimmen Sie zu, dass Cookies verwendet werden. Cookies dienen zu Analysezwecken und zum Bereitstellen personalisierter Inhalte.  Lesen Sie unsere Richtlinien