Minitab 통계 소프트웨어의 예측 분석 모델 유형

예측 분석의 모델은 제조 품질 관리, 약물 발견, 사기 탐지, 신용 점수 및 이탈 예측을 포함한 광범위한 애플리케이션에 대한 통찰력을 제공합니다. 결과를 사용하여 중요한 변수를 식별하고, 바람직한 특성을 가진 데이터에서 그룹을 식별하고, 새 관측치에 대한 반응 값을 예측합니다. 예를 들어 시장 조사자는 예측 분석 모델을 사용하여 특정 이니셔티브에 대해 응답률이 더 높은 고객을 식별하고 이러한 응답률을 예측할 수 있습니다.

많은 응용 분야에서 모델 구성의 중요한 단계는 다양한 유형의 모델을 고려하는 것입니다. 분석가는 특정 시간에 애플리케이션에 가장 적합한 유형을 찾고, 해당 모델의 최적 버전을 찾고, 모델을 사용하여 가능한 가장 정확한 예측을 생성합니다. Minitab Statistical Software에서는 다양한 모형을 고려할 수 있도록 계량형 반응 변수 또는 이항 반응 변수가 있는 경우 단일 분석에서 여러 모형 유형을 비교할 수 있는 기능을 제공합니다.

범주가 2개 이상인 범주형 반응 변수가 있는 경우 모형을 하나씩 생성하십시오.

다중 회귀 모델

다중 회귀 모델에서는 평균 반응이 예측 변수의 모수 함수라고 가정합니다. 이 모형은 최소 제곱 기준을 사용하여 데이터 집합에 대한 모수를 추정합니다. 모수 회귀 모형이 반응과 예측 변수 간의 관계를 적합시키는 경우 모형은 새 관측치를 사용하여 반응 값을 정확하게 예측합니다. 예를 들어, 물리학의 Hooke의 법칙에 따르면 스프링을 확장하는 힘은 확장 거리와 선형 관계가 있으므로 회귀 모델은 관계에 매우 적합합니다.

다중 회귀 모델은 예측 변수에 대한 최적 설정의 식별을 단순화합니다. 유효 적합치는 또한 적합 모수 및 표준 오차가 예측 반응 값에 대한 신뢰 구간 추정과 같은 통계적 추론에 유용하다는 것을 의미합니다.

다중 회귀 모델은 유연하며 데이터의 실제 관계 형태에 맞는 경우가 많습니다. 그럼에도 불구하고 다중 회귀 모델이 데이터 세트에 잘 맞지 않거나 데이터의 특성으로 인해 다중 회귀 모델을 구성하지 못하는 경우가 있습니다. 다음 예는 다중 회귀 모델의 적합성이 좋지 않은 경우의 일반적인 예입니다.
  • 반응과 예측 변수 간의 관계는 다중 회귀 모형이 적합할 수 있는 모형을 따르지 않습니다.
  • 데이터에 잘 맞는 다중 회귀 모형을 찾기에 충분한 모수를 추정하기에 충분한 관측치가 없습니다.
  • 예측 변수는 확률 변수입니다.
  • 예측 변수에는 결측값이 많이 포함되어 있습니다.

이러한 경우 트리 기반 모델은 고려해야 할 좋은 대안 모델입니다.

예측 분석 모듈에서 Minitab 통계 소프트웨어는 최상의 모형 발견 명령을 사용하여 여러 회귀 모형을 계량형 및 이항 반응 변수에 피팅합니다. Minitab 통계 소프트웨어의 다른 다중 회귀 모형 목록을 보려면 에서 확인하십시오 Minitab에 포함되어 있는 회귀 분석 및 상관 분석.

트리 기반 모델

CART,®TreeNet®및 Random Forests® 는 3 트리 기반 방법입니다. 트리 기반 모델 중에서 CART® 는 단일 의사 결정 트리를 사용하기 때문에 CART® 를 가장 쉽게 이해할 수 있습니다. 단일 의사결정트리는 전체 데이터 세트에서 첫 번째 상위 노드로 시작됩니다. 그런 다음 트리는 노드 분할 기준을 사용하여 데이터를 2개의 동종 자식 노드로 분할합니다. 이 단계는 분할되지 않은 모든 노드가 터미널 노드가 되기 위한 기준을 충족할 때까지 반복적으로 반복됩니다. 그런 다음 별도의 테스트 세트를 사용한 교차 검증 또는 검증을 사용하여 트리를 트리밍하여 CART® 모델 인 최적의 트리를 얻습니다. 단일 의사 결정 트리는 이해하기 쉽고 다양한 특성을 가진 데이터 집합에 맞출 수 있습니다.

단일 의사 결정 트리는 다른 2개의 트리 기반 방법보다 덜 강력하고 덜 강력할 수 있습니다. 예를 들어, 데이터 집합의 예측 변수 값이 조금만 변경되어도 매우 다른 CART® 모델이 생성될 수 있습니다. TreeNet® 및 Random Forests® 메서드는 개별 트리 집합을 사용하여 단일 의사 결정 트리의 모델보다 더 강력하고 정확한 모델을 만듭니다.

Minitab 통계 소프트웨어는 트리 기반 모형을 계량형 반응 변수, 이항 반응 변수 및 명목 반응 변수에 적합시킵니다. Minitab 통계 소프트웨어에서 각 모형의 예를 보려면 모형 유형을 선택하십시오.

MARS® 회귀 분석 모델

MARS® 회귀 분석 먼저 가능한 한 데이터에 맞는 광범위한 기저 함수 집합을 구성합니다. 광범위한 모형을 형성한 후 분석은 기저 함수의 최적 부분 집합을 검색하여 과적합 위험을 줄입니다. 축소된 모델은 데이터의 다양한 비선형 종속성에 계속 적용할 수 있습니다. 결과 모델은 이러한 기저 함수의 공간에서 다중 선형 회귀 모델입니다. 단계적으로 데이터의 여러 영역에 대해 서로 다른 피팅을 검색하는 특성은 트리 기반 모델에 연결됩니다 MARS® 회귀 분석 . 트리 기반 특성 MARS® 회귀 분석 으로 인해 다음과 같은 몇 가지 이점을 제공합니다.
  • 모델 형태의 자동 감지
  • 결측값 자동 처리
  • 가장 관련성이 높은 예측 변수의 자동 선택
방정식을 사용하면 여러 회귀 모델에 연결됩니다 MARS® 회귀 분석 . 다중 회귀 특성 MARS® 회귀 분석 으로 인해 이 모델 유형의 몇 가지 장점도 제공합니다.
  • 회귀 방정식을 사용하면 변수의 효과를 쉽게 이해할 수 있습니다.
  • 계량형 함수는 예측 변수의 작은 변화가 예측의 작은 변화를 초래한다는 것을 의미합니다.
  • 작은 모형의 경우에도 예측 변수의 값이 다르면 다른 예측이 생성됩니다.
유연한 모델은 MARS® 회귀 분석 정확한 예측을 제공하고 다른 유형의 모델의 적합성을 개선하는 모델 형식에 대한 통찰력을 제공할 수 있습니다. Minitab 통계 소프트웨어는 MARS® 회귀 모형을 계량형 반응 변수에 적합시킵니다. Minitab 통계 소프트웨어에서 의 MARS® 회귀 분석 예를 보려면 로 이동하십시오 MARS® 회귀 분석 예제.