Kovariaten kommen im Allgemeinen in der ANOVA und der Versuchsplanung zur Anwendung. In diesen Modellen ist eine Kovariate eine stetige Variable, die während der Datenerfassung im Allgemeinen nicht kontrolliert wird. Das Einbinden von Kovariaten ermöglicht das Modellieren von und Anpassen für Eingabevariablen, die zwar erfasst, jedoch im Experiment weder randomisiert noch kontrolliert wurden. Durch Hinzufügen von Kovariaten können Sie die Genauigkeit des Modells erheblich steigern; zudem können sich diese wesentlich auf die endgültigen Ergebnisse der Analyse auswirken. Das Einbinden einer Kovariate in das Modell kann den Fehler im Modell verringern und somit die Trennschärfe der Faktortests erhöhen. Zu den üblichen Kovariaten gehören Umgebungstemperatur, Luftfeuchtigkeit sowie Merkmale eines Teils oder Prüfobjekts vor der Behandlung.
Ein Techniker möchte beispielsweise den Korrosionsgrad bei vier Typen von Eisenträgern untersuchen. Der Techniker unterzieht die Eisenträger jeweils einer Behandlung mit Flüssigkeit, um die Korrosion zu beschleunigen, kann aber die Temperatur der Flüssigkeit nicht kontrollieren. Die Temperatur ist eine Kovariate, die im Modell berücksichtigt werden sollte.
In der Versuchsplanung kann ein Ingenieur beispielsweise am Effekt der Kovariate Umgebungstemperatur auf die Trockenzeit zweier unterschiedlicher Lacktypen interessiert sein.
Ein Textilunternehmen verwendet für die Produktion von monofilen Fäden drei unterschiedliche Maschinen. Es soll bestimmt werden, ob die Reißfestigkeit der Fäden abhängig von der verwendeten Maschine variiert. Es werden Daten zu Festigkeit und Durchmesser von 5 zufällig ausgewählten Fäden von jeder Maschine erfasst. Da die Festigkeit der Fäden im Zusammenhang mit ihrem Durchmesser steht, wird auch der Fadendurchmesser als mögliche Kovariate aufgezeichnet.
C1 | C2 | C3 |
---|---|---|
Maschine | Durchmesser | Festigkeit |
1 | 20 | 36 |
1 | 25 | 41 |
1 | 24 | 39 |
1 | 25 | 42 |
1 | 32 | 49 |
2 | 22 | 40 |
2 | 28 | 48 |
2 | 22 | 39 |
2 | 30 | 45 |
2 | 28 | 44 |
3 | 21 | 35 |
3 | 23 | 37 |
3 | 26 | 42 |
3 | 21 | 34 |
3 | 15 | 32 |
Minitab zeigt die folgenden Ergebnisse für die Daten zur Fadenproduktion an:
Die F-Statistik für die Maschinen beträgt 2,61, und der p-Wert beträgt 0,118. Da der p-Wert größer als 0,05 ist, weisen Sie die Nullhypothese, dass sich die Fadenfestigkeit abhängig von der verwendeten Maschine nicht unterscheidet, bei einem Signifikanzniveau von 5 % nicht zurück. Sie können annehmen, dass die Fadenfestigkeit bei allen Maschinen gleich ist. Beachten Sie, dass die F-Statistik für den Durchmesser (Kovariate) 69,97 und der entsprechende p-Wert 0,000 beträgt. Dies bedeutet, dass ein signifikanter Kovariateneffekt vorliegt. Somit hat der Durchmesser einen statistisch signifikanten Einfluss auf die Fadenfestigkeit.
Angenommen, Sie führen die Analyse nun erneut aus, jedoch ohne die Kovariate. Sie erhalten dann die folgende Ausgabe:
Beachten Sie, dass die F-Statistik 4,09 und der p-Wert 0,044 beträgt. Ohne die Kovariate im Modell verwerfen Sie die Nullhypothese bei einem Signifikanzniveau von 5 % und schlussfolgern, dass die Fadenfestigkeit abhängig von der verwendeten Maschine variiert.
Diese Schlussfolgerung ist das Gegenteil der Schlussfolgerung aus der Analyse mit der Kovariate. Dieses Beispiel zeigt, dass das Weglassen einer Kovariate zu irreführenden Analyseergebnissen führen kann.