Random Forests® 분류에 대한 데이터 입력

예측 분석 모듈 > Random Forests® 분류
참고

이 명령은 예측 분석 모듈에서 사용할 수 있습니다. 모듈을 활성화하는 방법에 대한 자세한 내용은 여기를 클릭하십시오.

데이터를 가장 잘 설명하는 옵션을 선택합니다.

이항 반응

범주형 반응 데이터에 합격 및 불합격과 같은 두 가지 범주가 있는 경우 다음 단계를 완료합니다.

  1. 드롭다운 리스트에서 이항 반응을 선택합니다.
  2. 반응에서 이항 반응이 포함된 열을 입력합니다. 값은 숫자 또는 텍스트일 수 있습니다.
  3. 반응 사건에서 분석이 설명할 사건을 선택합니다. 기본적으로 두 번째 반응 수준이 반응 사건으로 선택됩니다. 반응 사건을 변경해도 모형에는 영향을 미치지 않지만 결과를 더 의미 있게 만들 수 있습니다.
  4. 계량형 예측 변수에 반응의 변화를 설명하거나 예측할 수 있는 계량형 변수를 입력합니다. 계량형 예측 변수는 숫자 값을 사용해야 합니다.
  5. 범주형 예측 변수에 반응의 변화를 설명하거나 예측할 수 있는 범주형 변수를 입력합니다. 범주형 예측 변수는 텍스트 또는 숫자 값을 사용할 수 있습니다.
이 워크시트에서 구입은 반응이며 소비자가 새 상표의 시리얼을 구입했는지 여부를 나타냅니다. 반응 사건은 입니다. 소득어린이는 계량형 예측 변수입니다. 상점광고 시청은 범주형 예측 변수입니다.

워크시트의 첫 번째 행은 소비자가 새로운 시리얼 브랜드를 구입했다는 것을 보여줍니다. 이 소비자의 경우 소득이 $37000이고, 상점 A에서 쇼핑하고, 1명의 어린이가 있으며 시리얼 광고를 보았습니다.

C1-T C2 C3-T C4 C5-T
구입 소득 상점 어린이 ViewAd
$37,000 A 1
아니요 $47,000 A 3 아니요
$34,000 A 0 아니요
$58,000 B 0 아니요

다항 반응

범주형 반응 변수에 세단, 트럭 및 SUV와 같은 3개 이상의 범주가 있는 경우 다음 단계를 완료합니다.

  1. 드롭다운 리스트에서 다항 반응을 선택합니다.
  2. 반응에 범주형 반응이 포함된 열을 입력합니다. 값은 숫자 또는 텍스트일 수 있습니다.
  3. 계량형 예측 변수에 반응의 변화를 설명하거나 예측할 수 있는 계량형 변수를 입력합니다. 계량형 예측 변수는 숫자 값을 사용해야 합니다.
  4. 범주형 예측 변수에 반응의 변화를 설명하거나 예측할 수 있는 범주형 변수를 입력합니다. 범주형 예측 변수는 텍스트 또는 숫자 값을 사용할 수 있습니다.
이 워크시트에서 목표값은 대출 신청자가 낮은, 중간 또는 높은 위험인지 여부를 나타내는 다항 반응입니다. 수입NumCards는 계량형 예측 변수입니다. 결혼은 범주형 예측 변수입니다.

워크시트의 첫 번째 행은 저위험 신청자의 경우 소득이 2399이고, 3개의 신용카드를 가지고 있으며, 독신임을 보여줍니다.

C1-T C2 C3 C4-T
목표값 소득 NumCards 결혼
낮음 2399 3 단일
중간 2915 5 단일
중간 3100 0 결혼
높음 1500 8 결혼