모형 검증

Random Forests® 분류은(는) 모든 분석에 대해 OOB 검증을 사용합니다. OOB 검증 외에 검정 집합으로 검증을 선택하면 표는 검정 집합 또는 검정 및 학습 집합의 데이터의 백분율을 식별하는 열을 표시합니다.

부트스트랩 표본 개수

부트스트랩 표본 수는 분석의 트리 수를 나타냅니다. OOB 검증을 사용하면 표본 크기는 분석의 행 수와 동일합니다. 검정 집합에서 검증을 사용하면 기본 표본 크기가 학습 데이터 크기와 동일합니다. 학습 데이터 크기보다 작은 표본 크기를 사용하도록 선택하면 표에 해당 크기가 표시됩니다.

노드 분할에 대해 선택된 예측 변수 수

이 행은 노드 분할이 각 노드의 모든 예측 변수 또는 예측 변수의 임의 하위 세트를 고려하는지 여부를 나타냅니다. 노드 분할이 임의의 하위 세트를 사용하는 경우 이 행은 고려해야 할 예측 변수 수에 대한 선택을 나타냅니다.

처음에 모든 예측 변수를 사용하는 경우 후속 모형에서 예측 변수의 하위 세트를 사용하여 모형의 성능을 비교할지 여부를 고려합니다.

최소 내부 노드 크기

최소 내부 노드 크기는 노드가 가질 수 있고 더 많은 노드로 분할될 수 있는 최소 사례 수를 나타냅니다. 모형 성능이 부족한 경우 이 값을 늘려 성능에 미치는 영향을 볼지 여부를 고려합니다.

결측값 페널티

기본적으로 분석에 누락된 값 페널티가 없으며 이 행이 없습니다. 결측값 페널티는 결측값 비율에 따라 예측 변수에 불이익을 주게 됩니다. 페널티가 높은 변수는 노드의 분할 역할을 할 가능성이 적습니다.

높은 수준 범주 페널티

기본적으로 분석에 높은 수준의 범주 페널티가 없으며 이 행은 존재하지 않습니다. 높은 수준 범주 페널티는 각 노드의 노드 크기에 대한 범주 수준 수에 따라 변수에 불이익을 주게 됩니다. 따라서 노드에서 수준이 많은 경쟁업체는 해당 노드의 분할 역할을 할 가능성이 적습니다.

사용된 행

분석에 사용된 반응 관측치 수입니다.

사용되지 않는 행

누락된 반응 관측치 수입니다.