の予測の例 CART® 分類

ある研究チームが、心臓病に影響を与える要因に関する詳細な情報を収集し、公開しています。変数には、年齢、性別、コレステロール値、最大心拍数などがあります。この例は、心臓病に関する詳細情報を提供する公開データセットに基づいています。元のデータはarchive.ics.uci.eduからのものです。

木の生成の例では、研究者は、患者が心臓病に罹っているかどうかを示す重要な予測変数を識別する分類木を生成しました。研究者は、この木で予測を行いたいと考えています。

  1. CART® 分類の例を完了します。
  2. 分類木の結果の下部にある予測ボタンをクリックします。
  3. ドロップダウンリストから個別値を入力を選択します。
  4. 次の値を入力します。 この例では、各予測変数に2つの値を使用します。元のデータの範囲内にある値を選択することが重要です。この例では、各予測変数に 2つの値を使用するため、3番目の列は空のままです。
    年齢 35 35  
    レスト血圧 140 140  
    コレステロール 233 233  
    最大心拍数 150 165  
    オールドピーク 2.3 2.3  
    セックス 男性 女性  
    胸痛タイプ 2 1  
    断食血糖  
    レスト心電図 0 1  
    運動狭心症      
    斜面 1 3  
    主要な船舶 0 2  
    タール 正常 正常l  
  5. OKをクリックします。

結果を解釈する

Minitabでは、結果の分類木を使用して、2セットの予測値に関してクラス確率を推定します。
  • 予測変数の最初のセットの設定は、ターミナルノード1の設定と同じです。クラスの予測は「いいえ」です。「いいえ」の確率は0.91で、「はい」の確率は 0.09です。
  • 予測変数の2番目のセットの設定は、ターミナルノード4の設定と同じです。クラスの予測は「はい」です。「はい」の確率は約0.74で、「いいえ」の確率は約0.26 です。

7ノード CART® 分類:心臓病 対 年齢, レスト血圧, コレステロール, 最大心拍数, オールドピーク, セックス, 断食血糖, 運動狭心症, レスト心電図, 斜面, タール, 胸痛タイプ, 主要な船舶

方法 事前確率 すべてのクラスで同じ ノード分岐 ジニ 最適木 最小誤分類コスト モデル検証 10分割交差検証 使用中の行 303

CART® 分類の予測

心臓病の予測

設定 年齢 = 35, レスト血圧 = 140, コレステロール = 233, 最大心拍数 = 150, オールドピーク = 2.3, セックス = 男性, 胸痛タイプ = 2, 断食血糖 = 本当だ, レスト心電図 = 0, 運動狭心症 = "", 斜面 = 1, 主要な船舶 = 0, タール = 通常
予測 確率(クラス 観測値 ターミナルノードID クラス 確率(クラス = はい) = いいえ) 1 1 いいえ 0.09 0.91

心臓病の予測

設定 年齢 = 35, レスト血圧 = 140, コレステロール = 233, 最大心拍数 = 165, オールドピーク = 2.3, セックス = 男性, 胸痛タイプ = 1, 断食血糖 = 本当だ, レスト心電図 = 1, 運動狭心症 = "", 斜面 = 3, 主要な船舶 = 2, タール = 通常
予測 確率(クラス = 観測値 ターミナルノードID クラス 確率(クラス = はい) いいえ) 2 4 はい 0.740741 0.259259