Minitab統計ソフトウェアは、最適性基準の最良の値を持つモデルの結果を生成します。選択に応じて、基準は最小平方誤差または最小絶対偏差のいずれかになります。Minitabでは、最適なモデルの特定につながるシーケンスから他のモデルを探すことができます。通常、代替モデルは次の 2 つの理由のいずれかで選択します。
- 分析によって選択されるモデルは、基準が改善されるパターンの一部です。通常は、できるだけ高い予測精度でモデルから予測を行います。
- 分析によって選択されるモデルは、基準が比較的平坦なパターンの一部です。類似したモデル要約統計量を持つ1つ以上のモデルは、最適モデルよりも基底関数がはるかに少なくなります。通常、基底関数が少ないモデルでは、各予測変数が応答値にどのように影響するかがより明確になります。小さいモデルの予測精度の差が無視できる場合は、小さいモデルを使用して応答変数と予測変数の関係を評価できます。
たとえば、次のプロットは、20の基底関数を持つモデルに関する結果に付随しています。シーケンス内の他のモデルは、同様のR
2 値を有する。
10個の基底関数を持つモデルのR
2 値は、20個の基底関数を持つモデルとほぼ同じです。通常、基底関数が少ないモデルでは、各予測変数が応答値にどのように影響するかがより明確になります。はるかに小さいモデルからの予測精度の低下が無視できる場合は、はるかに小さいモデルを使用して、応答変数と予測変数の関係を評価できます。
代替モデルの基準値に加えて、モデルの複雑さとさまざまな領域の有用性を比較することもできます。アナリストが他のモデルと比較してパフォーマンスを犠牲にしない特定のモデルを選択する理由の次の例を考えてみましょう。
- アナリストは、最も重要な変数をより明確に把握できる小さなモデルを選択します。
- 基底関数が別のモデルの変数よりも測定しやすい変数に対するものであるため、分析でモデルが選択されます。
- 分析者がモデルを選択するのは、予測変数の特定の領域が対象であるためです。