TreeNet® 회귀 분석를 통한 모형 적합주요 예측 변수 검색에 대한 하이퍼파라미터 최적화

참고

이 명령은 예측 분석 모듈에서 사용할 수 있습니다. 모듈을 활성화하는 방법에 대한 자세한 내용은 여기를 클릭하십시오.

결과를 사용하여 하이퍼파라미터에 대해 모형이 다른 설정으로 얼마나 잘 수행되는지 비교합니다. 하이퍼파라미터 튜닝을(를) 클릭하여 하이퍼파라미터의 추가 값을 평가합니다.

최적의 트리 수

최적의 트리 수는 일반적으로 각 단계에서 다릅니다. 최적의 수가 분석의 최대 트리 수에 가까울 때 최대 수와 멀리 떨어진 최적의 트리 수를 가진 모형보다 트리 수를 늘리면 모형이 개선될 가능성이 높습니다. 개선될 것으로 보이는 대체 모형을 더 탐색할지 여부를 고려할 수 있습니다.

R-제곱(%)

R2는 모형에서 설명하는 반응의 변동 비율입니다. 특이치가 MAD보다 R2에 더 큰 영향을 미칩니다.

제곱 오차 손실 함수 또는 Huber 손실 함수를 사용하는 경우 표에 각 모형에 대한 R2 값이 포함됩니다. 다음 결과는 R2 값이 가장 높은 모형에 대한 것입니다.

MAD

평균 절대 편차(MAD)는 예측값과 실제값 간 차이의 절대값 평균입니다. MAD가 작을수록 모형이 데이터를 잘 적합합니다. MAD는 데이터와 같은 단위로 정확도를 표시하여 오차의 양을 개념화하는 데 사용됩니다. 특이치는 R2보다 MAD에 미치는 영향이 적습니다.

절대 편차 손실 함수를 사용하는 경우 표에 각 모형에 대한 MAD 값이 포함됩니다. 표을 따르는 전체 결과는 MAD 값이 가장 적은 모형에 대한 것입니다.

학습률

낮은 학습률은 모형에 있는 각 새 트리의 가중치가 더 높은 학습률보다 적으며 때로는 모형에 대해 더 많은 트리를 생성합니다. 학습률이 낮은 모형은 학습 데이터 집합에 과다 적합될 확률이 낮습니다. 학습률이 낮은 모형은 일반적으로 더 많은 트리를 사용하여 최적의 트리 수를 찾습니다.

하위 표본 부분

하위 표본 부분은 분석이 각 트리를 빌드하는 데 사용하는 데이터 비율입니다.

트리당 최대 단말 노드 수

TreeNet® 회귀 분석에서는 수많은 작은 CART® 트리를 강력한 모형으로 결합합니다. 이러한 작은 CART® 트리에 대해 단말 노드의 최대 수 또는 최대 트리 깊이를 지정할 수 있습니다. 단말 노드가 더 많은 트리는 보다 복잡한 교호작용을 모델링할 수 있습니다. 일반적으로 값이 12를 초과하면 모형에 큰 이점 없이 분석이 느려질 수 있습니다.

최대 트리 깊이

TreeNet® 회귀 분석에서는 수많은 작은 CART® 트리를 강력한 모형으로 결합합니다. 이러한 작은 CART® 트리에 대해 단말 노드의 최대 수 또는 최대 트리 깊이를 지정할 수 있습니다. 더 깊은 트리는 더 복잡한 교호작용을 모델링할 수 있습니다. 4에서 6까지의 값은 많은 데이터 집합에 적합합니다.