Verwenden Sie das Mallows-Cp, um eine Auswahl zwischen mehreren Regressionsmodellen zu treffen. Dieses Maß unterstützt Sie beim Ermitteln einer ausgeglichenen Anzahl von Prädiktoren im Modell. Mit dem Mallows-Cp wird die Genauigkeit und die Verzerrung des vollständigen Modells mit Modellen mit einer Teilmenge der Prädiktoren verglichen.
Im Allgemeinen sollten Sie nach Modellen suchen, in denen das Mallows-Cp klein und nahe der Anzahl der Prädiktoren im Modell plus der Konstanten (p) ist. Ein kleiner Wert des Mallows-Cp weist darauf hin, dass das Modell beim Schätzen der wahren Regressionskoeffizienten und Prognostizieren der künftigen Werte der Antwortvariablen relativ genau ist (eine geringe Streuung aufweist). Ein Mallows-Cp, das sich nahe an der Anzahl der Prädiktoren plus der Konstanten befindet, weist darauf hin, dass das Modell bei der Schätzung der tatsächlichen Regressionskoeffizienten und der Prognose künftiger Werte der Antwortvariablen relativ unverzerrt ist. Modelle mit fehlender Anpassung und großer Verzerrung weisen Mallows-Cp-Werte auf, die größer als p sind.
Ein Vergleich von Regressionsmodellen unter Verwendung des Mallows-Cp ist nur gültig, wenn Sie jeweils mit dem gleichen vollständigen Satz von Prädiktoren beginnen.
Wenn ein Prädiktor stark mit einem anderen Prädiktor korreliert, wird das Mallows-Cp in der Ausgabe nicht angezeigt.
Angenommen, Sie sind für einen Hersteller von Kartoffelchips tätig, der die Faktoren untersucht, die den Prozentsatz der zerkrümelten Kartoffelchips in jeder Packung beeinflussen. Sie nehmen den Prozentsatz an Kartoffeln relativ zu den anderen Zutaten, die Abkühlgeschwindigkeit und die Frittiertemperatur in das Regressionsmodell auf.
Treppenförmig | %Kartoffel | Abkühlgeschwindigkeit | Frittiertemperatur | Mallows-Cp |
---|---|---|---|---|
1 | X | 7,2 | ||
2 | X | X | 2,9 | |
3 | X | X | X | 5,5 |
Die Ergebnisse verweisen darauf, dass das Modell mit den beiden Termen „%Kartoffel“ und „Abkühlgeschwindigkeit“ relativ genau und unverzerrt ist, da sein Mallows-Cp (2,9) am nächsten an der Anzahl der Prädiktoren plus der Konstanten (3) liegt. Sie sollten das Mallows-Cp zusammen mit anderen in den Ergebnissen enthaltenen Statistiken untersuchen, z. B. mit dem R2, dem korrigierten R2 und S.