Güte der Anpassung für Identifikation der Verteilung

Hier finden Sie Definitionen und Anleitungen zur Interpretation für alle Statistiken zur Güte der Anpassung, die für die Identifikation der Verteilung bereitgestellt werden.

Wahrscheinlichkeitsnetz

Ein Wahrscheinlichkeitsnetz zeigt jeden Datenpunkt im Vergleich zum Prozentsatz der Werte in der Stichprobe an, die kleiner oder gleich diesem Datenpunkt sind.
Das Diagramm besteht aus folgenden Elementen:
Mittellinie
Das erwartete Perzentil aus der Verteilung auf der Grundlage der geschätzten Maximum-Likelihood-Parameter.
Linien der Konfidenzgrenzen
Eine gekrümmte Linie links bildet die Untergrenzen der Konfidenzintervalle für die Perzentile ab. Eine gekrümmte Linie rechts bildet die Obergrenzen der Konfidenzintervalle für die Perzentile ab.

Interpretation

Verwenden Sie das Wahrscheinlichkeitsnetz, um zu ermitteln, wie eng die Daten jeder Verteilung folgen.

Wenn die Verteilung gut an die Daten angepasst ist, sollten die Punkte eng um die angepasste Verteilungslinie liegen. Abweichungen von der Geraden weisen darauf hin, dass die Anpassung nicht akzeptabel ist.

Gute Anpassung
Schlechte Anpassung

Verwenden Sie neben dem Wahrscheinlichkeitsnetz die Maße für die Güte der Anpassung, z. B. die p-Werte für AD und die LVT-p-Werte, um die Anpassung der Verteilung zu beurteilen.

Beziehen Sie bei der Auswahl einer Verteilung zum Modellieren der Daten auch Ihre Kenntnisse des Prozesses ein. Wenn mehrere Verteilungen eine gute Anpassung bieten, wählen Sie mit Hilfe der folgenden Strategien eine Verteilung aus:
  • Wählen Sie die Verteilung aus, die in Ihrer Branche oder Anwendung am gängigsten ist.
  • Wählen Sie die Verteilung aus, die die konservativsten Ergebnisse liefert. Sie können beispielsweise eine Prozessfähigkeitsanalyse mit verschiedenen Verteilungen durchführen und anschließend die Verteilung auswählen, die die konservativsten Prozessfähigkeitsindizes liefert. Weitere Informationen finden Sie unter Verteilungsperzentile für Identifikation der Verteilung; klicken Sie dort auf „Prozente und Perzentile“.
  • Wählen Sie die einfachste Verteilung aus, die eine gute Anpassung an die Daten bietet. Wenn beispielsweise sowohl eine Verteilung mit 2 Parametern als auch eine Verteilung mit 3 Parametern eine gute Anpassung bieten, könnten Sie die einfachere Verteilung mit 2 Parametern auswählen.

p

Für jede Verteilung gibt Minitab einen p-Wert (p) für den Anderson-Darling-Test (AD) aus. Der p-Wert ist ein Wahrscheinlichkeitsmaß für die Anzeichen gegen die Annahme der Nullhypothese. Für einen AD-Test besagt die Nullhypothese, dass die Daten der Verteilung folgen. Daher bieten kleinere p-Werte deutlichere Anzeichen dafür, dass die Daten der Verteilung nicht folgen.
Hinweis

Für die Verteilungen mit 3 Parametern (mit Ausnahme der Weibull-Verteilung) sind keine p-Werte für den AD-Test verfügbar.

Interpretation

Verwenden Sie den p-Wert, um die Anpassung der Verteilung zu beurteilen.

Vergleichen Sie den p-Wert jeder Verteilung oder Transformation mit dem Signifikanzniveau. In der Regel ist ein Signifikanzniveau (als α oder Alpha bezeichnet) von 0,05 gut geeignet. Ein Signifikanzniveau von 0,05 bedeutet ein Risiko der Schlussfolgerung, dass die Daten der Verteilung nicht folgen, wenn sie dieser tatsächlich folgen, von 5 %.
P ≤ α: Die Daten folgen der Verteilung nicht (H0 verwerfen)
Wenn der p-Wert kleiner oder gleich dem Signifikanzniveau ist, weisen Sie die Nullhypothese zurück und schlussfolgern, dass die Daten der Verteilung nicht folgen.
P > α: Es kann nicht gefolgert werden, dass die Daten der Verteilung nicht folgen (H0 nicht zurückweisen)
Wenn der p-Wert größer als das Signifikanzniveau ist, weisen Sie die Nullhypothese nicht zurück. Es liegen nicht genügend Anzeichen dafür vor, dass die Daten der Verteilung nicht folgen. Sie können annehmen, dass die Daten der Verteilung folgen.
Beziehen Sie bei der Auswahl einer Verteilung zum Modellieren der Daten auch Ihre Kenntnisse des Prozesses ein. Wenn mehrere Verteilungen eine gute Anpassung bieten, wählen Sie mit Hilfe der folgenden Strategien eine Verteilung aus:
  • Wählen Sie die Verteilung aus, die in Ihrer Branche oder Anwendung am gängigsten ist.
  • Wählen Sie die Verteilung aus, die die konservativsten Ergebnisse liefert. Sie können beispielsweise eine Prozessfähigkeitsanalyse mit verschiedenen Verteilungen durchführen und anschließend die Verteilung auswählen, die die konservativsten Prozessfähigkeitsindizes liefert. Weitere Informationen finden Sie unter Verteilungsperzentile für Identifikation der Verteilung; klicken Sie dort auf „Prozente und Perzentile“.
  • Wählen Sie die einfachste Verteilung aus, die eine gute Anpassung an die Daten bietet. Wenn beispielsweise sowohl eine Verteilung mit 2 Parametern als auch eine Verteilung mit 3 Parametern eine gute Anpassung bieten, könnten Sie die einfachere Verteilung mit 2 Parametern auswählen.
Wichtig

Seien Sie beim Interpretieren von Ergebnissen, die aus sehr kleinen oder sehr großen Stichproben stammen, vorsichtig. Bei einer sehr kleinen Stichprobe besitzt ein Test der Anpassungsgüte möglicherweise nicht die erforderliche Trennschärfe, um signifikante Abweichungen von der Verteilung zu erkennen. Bei einer sehr großen Stichprobe hingegen ist die Trennschärfe so groß, dass auch kleine Abweichungen von der Verteilung erkannt werden, die keine praktische Bedeutung besitzen. Verwenden Sie zusätzlich zu den p-Werten die Wahrscheinlichkeitsnetze, um die Verteilungsanpassung zu beurteilen.

Test auf Güte der Anpassung

VerteilungADpLVT p
Normal0,7540,046 
Box-Cox-Transformation0,4140,324 
Lognormal0,6500,085 
Lognormal mit 3 Parametern0,341*0,017
Exponential20,614<0,003 
Exponential mit 2 Parametern1,6840,0140,000
Weibull1,442<0,010 
Weibull mit 3 Parametern0,230>0,5000,000
Kleinster Extremwert1,656<0,010 
Größter Extremwert0,394>0,250 
Gamma0,7020,071 
Gamma mit 3 Parametern0,268*0,006
Logistisch0,7260,034 
Loglogistisch0,6590,050 
Loglogistisch mit 3 Parametern0,432*0,027
Johnson-Transformation0,1240,986 

In diesen Ergebnissen weisen mehrere Verteilungen einen p-Wert auf, der größer als 0,05 ist. Die Weibull-Verteilung mit 3 Parametern (p > 0,500) und die Verteilung des größten Extremwerts (p > 0,250) haben die größten p-Werte und scheinen eine bessere Anpassung an die Stichprobendaten als die anderen Verteilungen zu bieten. Außerdem können die Daten gut mit der Box-Cox-Transformation (p = 0,324) und der Johnson-Transformation (p = 0,986) transformiert werden, so dass diese einer Normalverteilung folgen.

Hinweis

Bei einer Reihe von Verteilungen zeigt Minitab außerdem die Ergebnisse für die betreffende Verteilung mit einem zusätzlichen Parameter an. Zum Beispiel zeigt Minitab für die lognormale Verteilung die Ergebnisse für die Verteilung mit 2 Parametern und mit 3 Parametern an. Verwenden Sie bei Verteilungen mit zusätzlichen Parametern den p-Wert des Likelihood-Verhältnis-Tests (LVT p), um zu ermitteln, ob die Anpassung der Verteilung signifikant verbessert wird, wenn ein zusätzlicher Parameter hinzugefügt wird. Ein LVT-p-Wert kleiner als 0,05 deutet auf eine signifikante Verbesserung der Anpassung hin. Weitere Informationen finden Sie im Abschnitt zum LVT p.

LVT p

Bei einer Reihe von Verteilungen zeigt Minitab außerdem die Ergebnisse für die betreffende Verteilung mit einem zusätzlichen Parameter an. Für jede Version einer Verteilung mit einem zusätzlichen Parameter meldet Minitab einen p-Wert für den Likelihood-Quotienten-Test (LVT p). Ein p-Wert ist ein Wahrscheinlichkeitsmaß für die Anzeichen gegen die Annahme der Nullhypothese. Für den Likelihood-Quotienten-Test in der Identifikation der Verteilung besagt die Nullhypothese, dass die Daten der kleineren Verteilung (weniger Parameter) folgen. Daher bieten kleinere LVT-p-Werte deutlichere Anzeichen dafür, dass die Verteilungsanpassung durch Verwendung eines zusätzlichen Parameters signifikant verbessert wird.

Interpretation

Ermitteln Sie anhand des LVT-p-Werts, ob die Anpassung durch Hinzufügen des zusätzlichen Parameters im Vergleich zur Verteilung ohne den zusätzlichen Parameter signifikant verbessert wird.

Vergleichen Sie den LVT-p-Wert jeder Verteilung oder Transformation mit dem Signifikanzniveau. In der Regel ist ein Signifikanzniveau (als α oder Alpha bezeichnet) von 0,05 gut geeignet. Ein Signifikanzniveau von 0,05 bedeutet ein Risiko der Schlussfolgerung, dass der zusätzliche Parameter die Verteilungsanpassung signifikant verbessert, obwohl dies nicht der Fall ist, von 5 %.
p ≤ α: Die größere Verteilung (mehr Parameter) bietet eine signifikant bessere Anpassung (H0 verwerfen)
Wenn der p-Wert kleiner oder gleich dem Signifikanzniveau ist, weisen Sie die Nullhypothese zurück und schlussfolgern, dass die Verteilungsanpassung durch Verwendung eines zusätzlichen Parameters signifikant verbessert wird.
p > α: Es kann nicht gefolgert werden, dass die größere Verteilung (mehr Parameter) eine signifikant bessere Anpassung bietet (H0 nicht verwerfen)
Wenn der p-Wert größer als das Signifikanzniveau ist, weisen Sie die Nullhypothese nicht zurück. Es liegen nicht genügend Anzeichen dafür vor, dass die Verteilungsanpassung durch Verwendung eines zusätzlichen Parameters signifikant verbessert wird.

Der LVT-p-Wert eignet sich auch für Verteilungen mit 3 Parametern, für die keine bewährte Methode zum Berechnen des p-Werts vorhanden ist. Betrachten Sie in diesem Fall zunächst den p-Wert für die entsprechende Verteilung mit 2 Parametern. Ziehen Sie anschließend den LVT-p-Wert für die Verteilung mit 3 Parametern heran, um zu ermitteln, ob diese signifikant besser als die Verteilung mit 2 Parametern ist.

In diesen Ergebnissen deuten die LVT-p-Werte für die lognormale Verteilung mit 3 Parametern (0,017), die Weibull-Verteilung mit 3 Parametern (0,000), die Gamma-Verteilung mit 3 Parametern (0,006) und die loglogistische Verteilung mit 3 Parametern (0,027) darauf hin, dass die Anpassungen bei diesen Verteilungen deutlich besser ausfallen als die Anpassungen der entsprechenden Verteilungen mit 2 Parametern.

Test auf Güte der Anpassung

VerteilungADpLVT p
Normal0,7540,046 
Box-Cox-Transformation0,4140,324 
Lognormal0,6500,085 
Lognormal mit 3 Parametern0,341*0,017
Exponential20,614<0,003 
Exponential mit 2 Parametern1,6840,0140,000
Weibull1,442<0,010 
Weibull mit 3 Parametern0,230>0,5000,000
Kleinster Extremwert1,656<0,010 
Größter Extremwert0,394>0,250 
Gamma0,7020,071 
Gamma mit 3 Parametern0,268*0,006
Logistisch0,7260,034 
Loglogistisch0,6590,050 
Loglogistisch mit 3 Parametern0,432*0,027
Johnson-Transformation0,1240,986