このコマンドは、予測分析モジュールで使用できます。モジュールをアクティブにする方法については、ここをクリックしてください。
分析では、指定した数の基底関数が構築され、各関数の情報からモデルに少し変更を加えます。分析に検証方法が含まれている場合、分析では、トレーニング データのモデル選択基準の値と、基底関数の数ごとのテスト データが計算されます。テストデータの最適値によって、最適モデルの関数数が決まります。
最大R2などの最適化基準は、モデルに適合するために使用するのと同じデータで計算する場合、楽観的になる傾向があります。モデル検証法は、データのある割合をモデル適合プロセス外に残し、除外されたデータに対するモデルのパフォーマンスを評価する統計量を計算します。モデル検証法は、モデルが新しいデータに対してどの程度良好に機能するかを良く推定します。分析の損失関数の選択に応じて、基準は最大R2または最小平均絶対偏差(MAD)となります。Minitabでは、K分割交差検証と、別のテストデータセットによる検証の2つの検証法を提供しています。
K分割交差検証は、データのケース数が2000以下の場合のMinitabのデフォルトの方法です。このプロセスはK回繰り返されるため、交差検証は、通常、テストデータによる検証よりも時間がかかります。
テストセットを使用した検証では、データの一部が検証用に確保されます。残りのデータはトレーニングセットです。まず、学習セットとともに基底関数を追加します。次に、Minitabは、テストセットを使用して関数の数ごとにモデル選択基準の値を計算します。最良の値を持つ関数の数が最適なモデルになります。
検証を行わない場合、Minitabではデータセット全体を使用してモデルを適合します。最終モデルには通常、最大数の基底関数が含まれています。