Random Forests® 분류가 있는 예측의 예

참고

이 명령은 예측 분석 모듈에서 사용할 수 있습니다. 모듈을 활성화하는 방법에 대한 자세한 내용은 여기를 클릭하십시오.

연구원 팀은 심장병에 영향을 미치는 요인에 관하여 상세한 정보를 수집하고 게시합니다. 변수는 나이, 성별, 콜레스테롤 수치, 최대 심장 박동 등을 포함합니다. 이 예제는 심장병에 대한 자세한 정보를 제공하는 공개 데이터 집합을 기반으로 합니다. 원래 데이터는 archive.ics.uci.edu에서 볼 수 있습니다.

연구원은 Random Forests 분류 트리 모형을 사용하여 새로운 관측치에 대한 반응 등급 확률을 예측할 수 있습니다.

  1. Random Forests® 분류 예제을 완료합니다.
  2. 결과의 맨 아래에 있는 예측 단추를 클릭합니다.
  3. 드롭다운 리스트에서 개별 값 입력을 선택합니다.
  4. 다음 값을 입력합니다. 이 예제에서는 각 예측 변수에 대해 2개 값을 사용하지만 최대 3개의 값을 사용할 수 있습니다.
    연령 35 35  
    나머지 혈압 140 140  
    콜레스테롤 233 233  
    최대 심박수 150 165  
    올드 피크 2.3 2.3  
    섹스 남성 여성  
    흉통 유형 2 1  
    단식 혈당  
    레스트 심전도 0 1  
    운동 협 심 증      
    경사 1 3  
    주요 선박 0 2  
    정규 정규l  
  5. 확인을 클릭합니다.

결과 해석

Minitab은 결과의 Random Forests 분류 트리를 사용하여 예측 변수 값 세트에 대한 심장병 사건의 등급 확률을 추정합니다. 연구원은 지정된 설정을 사용하여 심장병 진단 사건이 발생할 확률이 첫 번째 세트의 경우 약 0.83이고 두 번째 세트의 경우 0.62라는 것을 발견했습니다.

Random Forests® 분류: 심장 병 대 연령, 나머지 혈압, 콜레스테롤, 최대 심박수, 올드 피크, 섹스, 흉통 유형, ...

방법 모형 검증 OOB 데이터로 검증 부트스트랩 표본 수 300 표본 크기 학습 데이터 크기 303과 동일 노드 분할을 위해 선택된 예측 변수 수 총 예측 변수 수의 제곱근 = 3 최소 내부 노드 크기 2 사용된 행 303
이항 반응 정보 변수 등급 카운트 % 심장 병 예 (사건) 139 45.87 아니요 164 54.13 모두 303 100.00
예측... Random Forests® 분류 예측

심장 병에 대한 예측

설정 연령 = 35, 나머지 혈압 = 140, 콜레스테롤 = 233, 최대 심박수 = 150, 올드 피크 = 2.3, 섹스 = 남성, 흉통 유형 = 2, 단식 혈당 = 사실, 레스트 심전도 = 0, 운동 협 심 증 = "", 경사 = 1, 주요 선박 = 0, 탈 = 정상적인
예측 관측 등급 확률(등급 = 예) 확률(등급 = 아니요) 1 아니요 0.17 0.83

심장 병에 대한 예측

설정 연령 = 35, 나머지 혈압 = 140, 콜레스테롤 = 233, 최대 심박수 = 165, 올드 피크 = 2.3, 섹스 = 여성, 흉통 유형 = 1, 단식 혈당 = 사실, 레스트 심전도 = 1, 운동 협 심 증 = "", 경사 = 3, 주요 선박 = 2, 탈 = 정상적인
예측 관측 등급 확률(등급 = 예) 확률(등급 = 아니요) 2 아니요 0.383333 0.616667