このコマンドは、予測分析モジュールで使用できます。モジュールをアクティブにする方法については、ここをクリックしてください。
研究チームは、射出成形プロセスのデータを使用して、プラスチック部品の強度タイプを最大化する機械の設定を研究したいと考えています。変数には、機械の制御、様々なプラスチック製法、射出成形機が含まれます。
データの最初の調査の一環として、研究者は主要な予測変数を検出を使用して重要でない予測変数を順に除去して主要な予測変数を特定することで、モデルを比較することを決めました。研究者は、応答に大きな影響を与える主要な予測変数を特定し、応答と主要な予測変数の関係に関するより多くの洞察を得たいと考えています。
この分析では、20のモデルを比較します。モデル評価表のモデル列のアスタリスクは、交差検証されたR2統計量の最小値を持つモデルがモデル16であることを示しています。モデル16には5つの重要な予測変数が含まれています。モデル評価表に続く結果は、モデル16に対するものです。
モデル16は交差検証されたR2統計量の最大値を持ちますが、他のモデルも同様の値を持ちます。チームは、代替モデルを選択をクリックして、モデル評価表から他のモデルの結果を生成できます。
モデル16の結果で、R二乗対木の数プロットは、最適な木の数が分析の木の数と同じ300であることを示しています。より良いモデルを識別するためにハイパーパラメーターを調整するをクリックすると、木の数を増やしたり、他のハイパーパラメーターに加えた変更によってモデルのパフォーマンスが向上するかどうかを確認できます。
相対変数重要度グラフは、木のシーケンスに対して予測変数で分岐が行われたときに、モデルの改善に対する予測変数の効果の順に予測変数をプロットします。最も重要な予測変数は金型温度です。最上の予測変数である金型温度の重要度が100%の場合、次に重要な変数である機械は58.7%の寄与度を有します。これは、射出する機械は金型内部の温度と58.7%同じくらい重要であることを意味します。
部分依存プロットを使用して、重要な変数または変数のペアが予測応答に与える影響を把握します。1/2 ログ スケールの応答値は、モデルからの予測です。部分依存プロットは、応答と変数の関係が線形、単調、またはより複雑であるかどうかを示します。
1つの予測変数の部分的依存性プロットは、金型温度、射出圧力、冷却温度のすべてが強度と正の関係を持つことを示しています。機械のプロットは機械間の違いを示し、機械1は平均で最も弱い部品を製作し、機械4は平均して最も強い部品を製作します。チームは、金型温度と機械がデータ内で最も強い交互作用を持っていることを発見しこれらの変数が強度に与える影響をさらに調査するために2つの予測変数の部分依存プロットを調べます。プロットする予測変数をさらに多く選択するをクリックすると、射出温度などの他の変数のプロットを作成できます。
金型温度と機械の2つの予測変数の部分依存プロットトは、機械に対する平均強度の差に関するいくつかの洞察を提供します。理由の1つとして、機械1からのデータには、他の機械ほど高い金型温度での観測値がそれほど多く含まれていません。チームは、他の設定が同じである場合、機械が異なる強度のものを生産する他の理由を探すことに決めました。プロットする予測変数をさらに多く選択するをクリックすると、他のペア変数のプロットを作成ができます。