Minitab統計ソフトウェアの予測分析モデルの種類

予測分析のモデルは、製造品質管理、創薬、不正検出、クレジットスコアリング、解約予測など、幅広いアプリケーションの洞察を提供します。この結果を使用して、重要な変数を識別し、望ましい特性をもつデータ内のグループを識別し、新しい観測値の応答値を予測します。たとえば、市場調査員は予測分析モデルを使用して、特定のイニシアチブに対する応答率が高い顧客を特定し、それらの応答率を予測できます。

多くのアプリケーションでは、モデル構築の重要なステップは、さまざまなタイプのモデルを検討することです。アナリストは、特定の時間におけるアプリケーションに最適なタイプを見つけ、そのモデルの最適なバージョンを見つけ、そのモデルを使用して可能な限り最も正確な予測を生成します。Minitab統計ソフトウェアでは、さまざまなモデルの検討を支援するために、連続応答変数または2値応答変数がある場合、1回の分析で異なるモデルタイプを比較することができます。

2つ以上のカテゴリを持つカテゴリ応答変数がある場合は、モデルを1つずつ作成します。

線形回帰モデル

線形回帰モデルでは、平均応答が予測変数のパラメトリック関数であると仮定します。このモデルでは、最小二乗基準を使用してデータセットのパラメータを推定します。パラメトリック回帰モデルが応答とその予測変数の関係に適合する場合、モデルは新しい観測値を含む応答値を正確に予測します。たとえば、物理学におけるフックの法則によると、ばねを伸ばす力は伸びの距離と線形の関係にあるため、回帰モデルはその関係に非常によく適合します。

線形回帰モデルを使用すると、予測子の最適な設定を簡単に特定できます。また、有効適合は、適合パラメータと標準誤差が、予測応答値の信頼区間の推定などの統計的推論に役立つことも意味します。

線形回帰モデルは柔軟性があり、多くの場合、データ内の関係の実際の形式に適合します。それでも、線形回帰モデルがデータセットにうまく適合しなかったり、データの特性が線形回帰モデルの構築を妨げたりすることがあります。次の例は、線形回帰モデルの適合度が低い場合の一般的なケースです。
  • 応答と予測変数の関係は、線形回帰モデルが適合できるモデルに従っていません。
  • データには、適合する線形回帰モデルを見つけるのに十分なパラメーターを推定するのに十分な観測値がありません。
  • 予測変数は確率変数です。
  • 予測変数には多くの欠損値が含まれています。

このような場合、ツリーベースのモデルは検討に適した代替モデルです。

予測分析モジュールでは、Minitab統計ソフトウェアは、最良モデルの検出コマンドを使用して、線形回帰モデルを連続応答変数と2値応答変数に適合させます。Minitab Statistical Softwareの他の線形回帰モデルのリストについては、「 Minitabに含まれている回帰分析と相関分析」を参照してください。

ツリーベースのモデル

CART®、TreeNet®、Random Forests® は、3つのツリーベースのメソッドです。ツリーベースのモデルの中で、CART® は単一の決定木を使用するため、CART® が最も理解しやすいです。1 つのデシジョン ツリーは、データ セット全体から最初の親ノードとして開始されます。次に、ツリーは、ノード分割基準を使用して、データをさらに 2 つの同種の子ノードに分割します。この手順は、分割されていないすべてのノードがターミナル ノードになるための基準を満たすまで繰り返し繰り返されます。その後、クロス検証または別のテストセットを使用した検証を使用してツリーをトリミングし、CART® モデルである最適なツリーを取得します。単一の決定木は理解しやすく、さまざまな特性を持つデータセットに適合できます。

単一の決定木は、他の2つのツリーベースの方法よりも堅牢性が低く、強力でない場合があります。たとえば、データセット内の予測変数値のわずかな変更により、CART® モデルが大きく異なる可能性があります。TreeNet® メソッドとRandom Forests® メソッドでは、個々のツリーのセットを使用して、単一のデシジョン ツリーのモデルよりも堅牢で正確なモデルを作成します。

Minitab統計ソフトウェアは、木ベースのモデルを連続応答変数、2値応答変数、および名義応答変数に適合させます。Minitab統計ソフトウェアで各モデルの例を表示するには、モデルタイプを選択します。

MARS® 回帰 モデル

MARS® 回帰 まず、可能な限りデータに適合する基底関数の広範なセットを構築します。広範なモデルを形成した後、分析は基底関数の最適なサブセットを検索することにより、オーバーフィットのリスクを軽減します。縮約モデルは、データ内のさまざまな非線形依存関係に適応できます。結果のモデルは、これらの基底関数の空間における線形回帰モデルです。データのさまざまな領域に対してさまざまな適合を段階的に検索する特性は、ツリーベースのモデルに接続します MARS® 回帰 。ツリーベースの特性により、 MARS® 回帰 には同じ利点がいくつかあります。
  • モデルフォームの自動検出
  • 欠損値の自動処理
  • 最も関連性の高い予測変数の自動選択
方程式の使用は、線形回帰モデルに接続します MARS® 回帰 。線形回帰特性のため、 は MARS® 回帰 、このモデル タイプの利点の一部も提供します。
  • 回帰式を使用すると、変数の効果を理解しやすくなります。
  • 連続関数は、予測変数の小さな変化が予測の小さな変化をもたらすことを意味します。
  • 小さなモデルの場合でも、予測変数の値が異なると、異なる予測結果が得られます。
柔軟なモデルは MARS® 回帰 、正確な予測を提供し、他の種類のモデルの適合を向上させるモデルの形式に関する洞察を提供できます。Minitab統計ソフトウェアは、MARS® 回帰モデルを連続応答変数に適合させます。Minitab統計ソフトウェアの例 MARS® 回帰 を見るには、 MARS® 回帰の例を参照してください。