연구원 팀은 심장병에 영향을 미치는 요인에 관하여 상세한 정보를 수집하고 게시합니다. 변수는 나이, 성별, 콜레스테롤 수치, 최대 심장 박동 등을 포함합니다. 이 예제는 심장병에 대한 자세한 정보를 제공하는 공개 데이터 세트를 기반으로 합니다. 원래 데이터는 archive.ics.uci.edu에서 볼 수 있습니다.

트리 생성 예에서 연구원은 환자가 심장병이 있는지 여부를 표시하기 위해 중요한 예측 변수를 식별하는 분류 트리를 만들었습니다. 연구원은 이 트리로 예측을 하고 싶어합니다.

  1. CART® 분류 예제.
  2. 분류 트리 결과의 맨 아래에 있는 예측 단추를 클릭합니다.
  3. 드롭다운 목록에서 개별 값 입력을 선택합니다.
  4. 다음 값을 입력합니다. 이 예에서는 각 예측 변수에 대해 2개의 값을 사용합니다. 원래 데이터의 범위 내에 있는 값을 선택하는 것이 중요합니다. 이 예에서는 각 예측 변수에 대해 2개의 값을 사용하므로 세 번째 열은 비어 있습니다.
    연령 35 35  
    나머지 혈압 140 140  
    콜레스테롤 233 233  
    최대 심박수 150 165  
    올드 피크 2.3 2.3  
    섹스 남성 여성  
    흉통 유형 2 1  
    단식 혈당  
    레스트 심전도 0 1  
    운동 협 심 증      
    경사 1 3  
    주요 선박 0 2  
    정상 정상l  
  5. 확인.

결과 해석

Minitab은 결과의 분류 트리를 사용하여 예측 값의 2 세트에 대한 클래스 확률을 추정합니다.
  • 첫 번째 예측 값 세트의 경우 설정은 터미널 노드 1의 설정과 동일합니다. 클래스 예측은 아니요입니다. 아니요의 확률은 0.91이고 예의 확률은 0.09입니다.
  • 두 번째 예측 값 세트의 경우 설정은 터미널 노드 4의 설정과 동일합니다. 클래스 예측은 예입니다. 예의 확률은 약 0.74이고 아니요의 확률은 약 0.26입니다.

7 노드 CART® 분류: 심장 병 대 연령, 나머지 혈압, 콜레스테롤, 최대 심박수, 올드 피크, 섹스, 단식 혈당, 운동 협 심 증, 레스트 심전도, 경사, 탈, 흉통 유형, 주요 선박

방법 사전 확률 모든 등급에 대해 같음 노드 분할 지니 최적 트리 최소 오분류 비용 모형 검증 10-접기 교차 검증 사용된 행 303

CART® 분류 예측

심장 병에 대한 예측

설정 연령 = 35, 나머지 혈압 = 140, 콜레스테롤 = 233, 최대 심박수 = 150, 올드 피크 = 2.3, 섹스 = 남성, 흉통 유형 = 2, 단식 혈당 = 사실, 레스트 심전도 = 0, 운동 협 심 증 = "", 경사 = 1, 주요 선박 = 0, 탈 = 정상적인
예측 관측 단말 노드 ID 등급 확률(등급 = 예) 확률(등급 = 아니요) 1 1 아니요 0.09 0.91

심장 병에 대한 예측

설정 연령 = 35, 나머지 혈압 = 140, 콜레스테롤 = 233, 최대 심박수 = 165, 올드 피크 = 2.3, 섹스 = 여성, 흉통 유형 = 1, 단식 혈당 = 사실, 레스트 심전도 = 1, 운동 협 심 증 = "", 경사 = 3, 주요 선박 = 2, 탈 = 정상적인
예측 관측 단말 노드 ID 등급 확률(등급 = 예) 확률(등급 = 아니요) 2 4 예 0.740741 0.259259