Beispiel: für Ermitteln von wichtigen Prädiktoren für TreeNet® Regression

Hinweis

Dieser Befehl ist mit dem Predictive Analytics-Modul verfügbar. Klicken Sie hier, um weitere Informationen zum Aktivieren des Moduls zu erhalten.

Ein Forscherteam will anhand von Daten aus einem Spritzgießprozess Einstellungen für Maschinen untersuchen, die eine bestimmte Art von Festigkeit eines Kunststoffteils maximieren. Zu den Variablen gehören Steuerungen an den Maschinen, verschiedene Kunststoffformeln und die Spritzgießmaschinen.

Im Rahmen der anfänglichen Untersuchung der Daten beschließt das Team, Ermitteln von wichtigen Prädiktoren für den Vergleich von Modellen zu verwenden, indem es unwichtige Prädiktoren sequenziell entfernt, um wichtige Prädiktoren zu identifizieren. Die Forscher hoffen, wichtige Prädiktoren zu identifizieren, die den größten Einfluss haben und mehr Einblick in die Beziehungen zwischen der Antwort und den wichtigsten Prädiktoren zu gewinnen.

  1. Öffnen Sie den Beispieldatensatz Injektionsprozess.MTW.
  2. Wählen Sie Predictive Analytics-Modul > TreeNet® Regression > Wichtige Prädiktoren ermitteln aus.
  3. Geben Sie im Feld Antwort die Spalte Stärke ein.
  4. Geben Sie im Feld Stetige Prädiktoren die Spalten InjektionsdruckTemperatur bei der Messung ein.
  5. Geben Sie im Feld Kategoriale Prädiktoren die Spalten MaschineFormel ein.
  6. Klicken Sie auf OK.

Interpretieren der Ergebnisse

Für diese Analyse vergleicht Minitab Statistical Software 20 Modelle. Das Sternchen in der Spalte „Modell“ der Tabelle Modellauswertung zeigt, dass das Modell mit dem größten Wert der kreuzvalidierten R2-Statistik Modell 16 ist. Modell 16 enthält 5 wichtige Prädiktoren. Die Ergebnisse, die der Modellauswertungstabelle folgen, beziehen sich auf Modell 16.

Obwohl Modell 16 den größten Wert der kreuzvalidierten R2-Statistik hat, weisen andere Modelle ähnliche Werte auf. Das Team kann auf Auswählen eines alternativen Modells klicken, um Ergebnisse für andere Modelle aus der Tabelle Modellauswertung zu erstellen.

In den Ergebnissen für Modell 16 zeigt das Diagramm von R-Quadrat vs. Anzahl der Bäume, dass die optimale Anzahl von Bäumen der Anzahl der Bäume in der Analyse entspricht, 300. Das Team kann auf Anpassen von Hyperparametern zum Identifizieren eines besseren Modells klicken, um die Anzahl der Bäume zu erhöhen und zu sehen, ob Änderungen an anderen Hyperparametern die Leistung des Modells verbessern.

Das Diagramm „Relative Variablenwichtigkeit“ zeigt die Prädiktoren in der Reihenfolge ihrer Auswirkungen auf die Modellverbesserung, wenn Teilungen anhand eines Prädiktors über die Abfolge der Bäume hinweg vorgenommen werden. Die wichtigste Prädiktorvariable ist die Formtemperatur. Wenn die Wichtigkeit der obersten Prädiktorvariablen, „Formtemperatur“, 100 % beträgt, hat die nächstwichtige Variable, „Maschine“, einen Beitrag von 58,7 %. Das bedeutet, dass die Maschine, die einspritzt, zu 58,7 % so wichtig ist wie die Temperatur im Inneren der Form.

Verwenden Sie die Diagramme der partiellen Abhängigkeit, um zu erfahren, wie sich die wichtigen Variablen oder Variablenpaare auf den prognostizierten Wert der Antwortvariablen auswirken. Die Werte der Antwortvariablen auf der 1/2 Log-Skala sind die Prognosen aus dem Modell. Die Diagramme der partiellen Abhängigkeit zeigen, ob die Beziehung zwischen der Antwortvariablen und einer Variablen linear, monoton oder komplexer ist.

Die Diagramme der partiellen Abhängigkeit bei einem Prädiktor zeigen, dass Formtemperatur, Einspritzdruck und Kühltemperatur alle einen positiven Bezug zur Festigkeit haben. Das Diagramm der Maschinen zeigt die Unterschiede zwischen den Maschinen, wobei Maschine 1 im Durchschnitt die schwächsten Teile und Maschine 4 im Durchschnitt die stärksten Teile herstellt. Das Team stellt fest, dass die Formtemperatur und die Maschine die stärkste Wechselwirkung in den Daten haben, also betrachten Sie das Diagramm der partiellen Abhängigkeit, um besser zu verstehen, wie diese Variablen die Festigkeit beeinflussen. Das Team kann auf Auswählen weiterer Prädiktoren zur Darstellung klicken, um Diagramme für andere Variablen zu erstellen, z. B. für die Einspritztemperatur.

Das Diagramm der partiellen Abhängigkeit bei zwei Prädiktoren „Formtemperatur und Maschine“ gibt einen Einblick in die unterschiedlichen durchschnittlichen Festigkeiten der Maschinen. Ein Grund ist, dass die Daten von Maschine 1 nicht so viele Beobachtungen bei den höchsten Formtemperaturen enthalten wie die anderen Maschinen. Das Team könnte sich immer noch entscheiden, nach anderen Gründen zu suchen, dass die Maschinen unterschiedliche Festigkeiten erzeugen, wenn andere Einstellungen identisch sind. Das Team kann auf Auswählen weiterer Prädiktoren zur Darstellung klicken, um Diagramme für andere Variablenpaare zu erstellen.

TreeNet®-Regression: Stärke vs Injektionsdr; Injektionste; Kühltemperat; ...

Methode Verlustfunktion Quadrierter Fehler Kriterium für Auswahl der optimalen Anzahl von Bäumen Maximales R-Quadrat Modellvalidierung Kreuzvalidierung mit 3 Faltungen Trainingsrate 0,01408 Teilstichbruchfraktionschefin 0,5 Maximale Anzahl von Endknoten pro Baum 6 Minimale Endknotengröße 3 Anzahl der für die Knotenteilung ausgewählten Prädiktoren Gesamtanzahl der Prädiktoren = 21 Verwendete Zeilen 1408
Informationen zur Antwortvariablen Mittelwert StdAbw Minimum Q1 Median Q3 Maximum 485,247 318,611 41,2082 301,099 398,924 562,449 2569,04

Ein Prädiktor Partielle Abhängigkeitsdiagramme

Weitere Prädiktoren für Diagramm auswählen...

Zwei Predictor PartI-Abhängigkeitsdiagramme

Weitere Prädiktoren für Diagramm auswählen...

TreeNet® Regression – Ermitteln von wichtigen Prädiktoren: Stärke vs. Einspritzdruck, Einspritztemp, ...

Prädiktor-Eliminationsdiagramm

Modellauswahl durch Eliminierung unwichtiger Prädiktoren Test Optimale Anzahl R-Quadrat Anzahl des Baummodells (%) Prädiktoren Eliminierte Prädiktoren 1 300 89.32 21 Keine 2 300 89.34 19 Kunststoff-Durchflussrate, Wechselposition 3 300 89.39 18 Trocknungstemperatur 4 300 89.46 17 Schmelztemperatur Zone 2 5 300 89.51 16 Kunststoff Temperatur 6 300 89.50 15 Formel 7 300 89.59 14 Haltedruck 8 300 89.57 13 Schraubenkissen 9 300 89.69 12 Schmelztemperatur Zone 4 10 300 89.70 11 Gegendruck 11 300 89.86 10 Schmelztemperatur Zone 1 12 300 89.90 9 Trocknungszeit 13 300 89.92 8 Temperatur bei Messung 14 300 90.06 7 Schmelztemperatur Zone 5 15 300 90.16 6 Schmelztemperatur Zone 3 16* 300 90.23 5 Schraubendrehzahl 17 300 89.96 4 Einspritztemperatur 18 297 79.37 3 Kühltemperatur 19 244 66.64 2 Einspritzdruck 20 164 46.19 1 Maschine Der Algorithmus entfernte einen Prädiktor und alle Prädiktoren mit 0 Wichtigkeit bei jedem Schritt. * Ausgewähltes Modell hat maximales R-Quadrat. Die Ausgabe für das ausgewählte Modell folgt.

TreeNet® Regression: Strength vs Injection Pr, Injection Te, Cooling Temp, ...

Model Summary Total predictors 5 Important predictors 5 Number of trees grown 300 Optimal number of trees 300 Statistics Training Test R-squared 92.23% 90.23% Root mean squared error (RMSE) 88.8049 99.5673 Mean squared error (MSE) 7886.3152 9913.6420 Mean absolute deviation (MAD) 68.9231 74.4113 Mean absolute percent error (MAPE) 0.2083 0.2175

One Predictor Partial Dependence Plots

Select More Predictors to Plot...

Two Predictor Partial Dependence Plots

Select More Predictors to Plot...

Durch Ihre Nutzung dieser Website stimmen Sie zu, dass Cookies verwendet werden. Cookies dienen zu Analysezwecken und zum Bereitstellen personalisierter Inhalte.  Lesen Sie unsere Richtlinien