Vergleich von Datenmittelwerten und angepassten Mittelwerten

Datenmittelwerte sind die rohen Mittelwerte der Antwortvariablen für sämtliche Faktorstufenkombinationen, während bei angepassten Mittelwerten die Mittelwerte der Antwortvariablen eines balancierten Designs mit Hilfe der kleinsten Quadrate geschätzt werden. Die beiden Arten von Mittelwerten sind daher bei balancierten Designs identisch, können bei nicht balancierten Designs jedoch voneinander abweichen.

Angepasste Mittelwerte eignen sich gut für die Untersuchung von Differenzen der Werte der Antwortvariablen aufgrund von Änderungen der Faktorstufen, jedoch weniger für Differenzen aufgrund nicht balancierter experimenteller Bedingungen. Während Sie mit Hilfe von Rohdaten in nicht balancierten Designs eine allgemeine Vorstellung davon gewinnen können, welche Haupteffekte möglicherweise vorhanden sind, empfiehlt es sich in der Regel, mit Hilfe der angepassten Mittelwerte präzisere Ergebnisse zu erzielen.

Beispiel für Datenmittelwerte und angepasste Mittelwerte

Angenommen, Sie untersuchen die Auswirkungen von Zeit und Temperatur auf die Ausbeute einer chemischen Reaktion. Beide Faktoren weisen je zwei Stufen auf, so dass sich vier experimentelle Bedingungen ergeben. Dies ist ein übertriebenes Beispiel für ein nicht balanciertes Experiment, um die Unterschiede zwischen beiden Arten von Mittelwerten zu verdeutlichen. Alle experimentellen Bedingungen werden zweimal gemessen, mit Ausnahme der Zeit-Temperatur-Kombination von 50 und 200, die viermal gemessen wird. In den folgenden Tabellen werden das Design und die Ergebnisse zusammengefasst.

Tabelle 1. Anzahl der Beobachtungen pro experimenteller Bedingung
	Temperatur 150	Temperatur 200
Zeit 20	2	2
Zeit 50	2	4

Tabelle 2. Mittelwerte nach Faktorstufe
	Datenmittelwerte	Angepasste Mittelwerte
Zeit 20	44,01	44,03
Zeit 50	47,63	47,02
Temperatur 150	44,13	44,14
Temperatur 200	47,55	46,90

Die Mittelwerte und angepassten Mittelwerte der Daten für „Zeit 20“ und „Temperatur 150“ sind praktisch identisch, da sämtliche experimentellen Bedingungen, die einen oder beide Faktorstufen einbeziehen, genau zweimal gemessen werden (obere Tabelle). Die Kombination von „Zeit 50“ und „Temperatur 200“ wurde jedoch viermal gemessen, wodurch ihr Effekt in den Mittelwerten der Rohdaten überrepräsentiert ist. In den angepassten Mittelwerten wird dies kompensiert, so dass diese den Ergebnissen eines balancierten Designs entsprechen.