Random Forests® 분류 개요

참고

이 명령은 예측 분석 모듈에서 사용할 수 있습니다. 모듈을 활성화하는 방법에 대한 자세한 내용은 여기를 클릭하십시오.

많은 계량형 및 범주형 예측 변수를 사용하여 범주형 반응에 대한 고성능 예측 모형을 만드는 데 Random Forests® 분류을 사용합니다. Random Forests® 분류에서는 많은 CART® 트리의 정보를 결합하여 데이터 마이닝 기술을 상당히 발전시킵니다.

Random Forests® 분류는 제조 품질 관리, 신약 발견, 사기 탐지, 신용 평가 및 이탈 예측을 비롯한 광범위한 애플리케이션에 대한 통찰력을 제공합니다. 결과를 사용하여 중요한 변수를 식별하고, 바람직한 특성을 가진 데이터에서 그룹을 식별하고, 새 관측치에 대한 반응 값을 예측합니다. 예를 들어, 시장 연구원은 Random Forests® 분류을 사용하여 특정 이니셔티브에 대한 반응률이 높은 고객을 식별하고 이러한 반응률을 예측할 수 있습니다.

CART® 분류는 좋은 데이터 탐색 분석 도구이며 이해하기 쉬운 모형을 제공하여 중요한 예측 변수를 신속하게 식별할 수 있습니다. 그러나 CART® 분류을 사용한 초기 탐색 후 필요한 후속 단계로 TreeNet® 분류 또는 Random Forests® 분류을 고려하십시오.

Random Forests® 분류 출력에는 상대 변수 중요도 차트, ROC 곡선, 향상도 및 이익 차트가 포함됩니다. 이러한 그림을 사용하면 모형의 변수가 반응 등급을 매우 정확하게 예측하는지 여부를 평가하고 예측 정확도에 가장 중요한 예측 변수를 식별하는 데 도움이 됩니다. 이 정보는 최적의 생산 결과를 가능하게 하는 설정을 제어하려는 경우 유용합니다.

이 방법은 버클리 University of California의 Leo Breiman과 Adele Cutler에 의해 개발되었습니다.

이 분석을 찾을 수 있는 위치

Random Forests® 분류을 수행하려면 예측 분석 모듈 > Random Forests® 분류을 선택합니다.

대립 분석을 사용할 시기

범주형 반응 변수가 있는 모수 회귀 모형을 사용하려면 이항 로지스틱 모형 적합를 사용합니다.