Sowohl mit einem verallgemeinerten linearen Modell als auch mit der Regression kleinster Quadrate wird die Beziehung zwischen einer Antwortvariablen und einem oder mehreren Prädiktoren untersucht. Ein praxisrelevanter Unterschied zwischen diesen beiden Ansätzen besteht darin, dass die Verfahren des verallgemeinerten linearen Modells in der Regel für kategoriale Antwortvariablen, die der Regression kleinster Quadrate hingegen für stetige Antwortvariablen verwendet werden. Eine ausführliche Beschreibung verallgemeinerter linearer Modelle finden Sie in 1
Die Verfahren für verallgemeinerte lineare Modelle und die Regression kleinster Quadrate schätzen gleichermaßen Parameter im Modell, um die Anpassung des Modells zu optimieren. Mit dem Verfahren der kleinsten Quadrate wird die Summe der quadrierten Fehler minimiert, um Maximum-Likelihood-Schätzwerte der Parameter zu erhalten. In verallgemeinerten linearen Modellen werden Maximum-Likelihood-Schätzwerte mit einem iterativen Algorithmus der jeweils neu gewichteten kleinsten Quadrate bestimmt.
Beispielsweise können Sie mit einem verallgemeinerten linearen Modell die Beziehung zwischen der Erfahrung von Maschinenbedienern in Jahren (eine nicht negative stetige Variable) und deren Teilnahme an einem optionalen Schulungsprogramm (eine binäre Variable – Ja oder Nein) modellieren, um zu prognostizieren, ob die von ihnen gefertigten Produkte die Spezifikationen erfüllen (eine binäre Variable – Ja oder Nein). Die ersten beiden Variablen sind die Prädiktoren, die dritte ist die kategoriale Antwortvariable.
Die Minitab Statistical Software bietet vier Verfahren für verallgemeinerte lineare Modelle, mit denen Sie die Beziehung zwischen einer oder mehreren Prädiktorvariablen und einer Antwortvariablen der folgenden Typen untersuchen können. Im vorherigen Beispiel wird die binäre logistische Regression verwendet, da die Antwortvariable zwei Stufen aufweist.
Variablentyp | Anzahl der Kategorien | Merkmale | Beispiele |
---|---|---|---|
Binär |
2 |
Zwei Stufen |
Bestanden/nicht bestanden Ja/nein Hoch/tief |
Ordinal |
3 oder mehr |
Natürliche Rangfolge der Stufen |
Geschmack (mild, mittel, scharf) Medizinischer Zustand (kritisch, ernst, stabil, gut) Umfrageergebnisse (Ablehnung, neutral, Zustimmung) |
Nominal |
3 oder mehr |
Keine natürliche Rangfolge der Stufen |
Geschmack (bitter, süß, sauer) Farbe (rot, blau, schwarz) Schulfach (Mathematik, Naturwissenschaften, Kunst) |
Poisson |
3 oder mehr |
Die Antwortvariable beschreibt die Anzahl des Auftretens eines Ereignisses in einem endlichen Beobachtungsraum. |
0, 1, 2, ... |
Für ein Modell mit einem stetigen Prädiktor und einer binären Antwortvariablen bietet Minitab ein fünftes Verfahren. In einer Darstellung der binären Anpassungslinie wird rasch die Beziehung zwischen dem Prädiktor und der Antwortvariablen veranschaulicht.