ベストモデルの検出(2値応答) の予測の例

このコマンドは、で使用できます予測分析モジュール.。モジュールをアクティブにする方法については、ここをクリックしてください

ある研究チームが、心臓病に影響を与える要因に関する詳細な情報を収集し、公開しています。変数には、年齢、性別、コレステロール値、最大心拍数などがあります。この例は、心臓病に関する詳細情報を提供する公開データセットに基づいています。元のデータはarchive.ics.uci.eduからのものです。

研究者は、ランダムフォレスト分類木モデルを使用して、新しい観測値の応答クラス確率を予測することができます。

  1. ベストモデルの検出(2値応答)例を完了します。
  2. ナビゲーターで ベストモデルの検出(2値応答)の結果を選択します。
  3. 結果の下部にある予測ボタンをクリックします。
  4. ドロップダウンリストから個別値を入力を選択します。
  5. 次の値を入力します。 この例では、各予測変数に2つの値を使用しますが、最大3つの値を使用できます。この例では、意図的にの欠損値を 運動狭心症使用します。
    年齢 35 35  
    レスト血圧 140 140  
    コレステロール 233 233  
    最大心拍数 150 165  
    オールドピーク 2.3 2.3  
    セックス 0 1  
    胸痛タイプ 2 1  
    断食血糖 1 1  
    レスト心電図 0 1  
    運動狭心症      
    斜面 1 2  
    主要な船舶 0 2  
    タール 0 0  
  6. OKをクリックします。

結果を解釈する

Minitabでは、結果のランダムフォレスト分類木を使用して、予測値のセットに関して心臓病事象のクラス確率を推定します。研究者たちは、指定された設定を使用して心臓病診断事象の確率は、最初のセットで約0.63、2つ目のセットで0.52であることを発見しました。

Random Forests® 分類: 心臓病 対 年齢, レスト血圧, コレステロール, 最大心拍数, オールドピーク, セックス, 胸痛タイプ, ...

方法 モデル検証 アウトオブバッグデータを使用した検証 ブートストラップサンプルの数 300 サンプルサイズ 303のトレーニングデータサイズと同じ ノード分岐に対して選択された予測変数の数 予測変数の合計数の平方根 = 3 最小内部ノードのサイズ 8 使用中の行 303
二項応答情報 変数 クラス 計数 % 心臓病 1 (事象) 165 54.46 0 138 45.54 すべて 303 100.00

Random Forests® 分類予測

心臓病の予測

設定 年齢 = 35, レスト血圧 = 140, コレステロール = 233, 最大心拍数 = 150, オールドピーク = 2.3, セックス = 0, 胸痛タイプ = 2, 断食血糖 = 1, レスト心電図 = 0, 運動狭心症 = *, 斜面 = 1, 主要な船舶 = 0, タール = 0
予測 観測値 クラス 確率(クラス = 1) 確率(クラス = 0) 1 1 0.626667 0.373333

心臓病の予測

設定 年齢 = 35, レスト血圧 = 140, コレステロール = 233, 最大心拍数 = 165, オールドピーク = 2.3, セックス = 1, 胸痛タイプ = 1, 断食血糖 = 1, レスト心電図 = 1, 運動狭心症 = *, 斜面 = 2, 主要な船舶 = 2, タール = 0
予測 観測値 クラス 確率(クラス = 1) 確率(クラス = 0) 2 1 0.516667 0.483333