적합 회귀 모형에 대해 표시할 그래프 선택

통계분석 > 회귀 분석 > 회귀 분석 > 적합 회귀 모형 > 그래프

Pareto 차트

Minitab은 효과에 대한 Pareto 차트를 제공하여 계수 및 ANOVA 표의 결과를 시각화합니다. 모형의 항의 경우 그래프를 사용하면 효과의 상대적 크기를 비교하여 각 효과의 통계적 유의성을 평가할 수 있습니다. Minitab에서는 모형이 오차에 대해 1 이상의 자유도를 남길 때 Pareto 차트를 그립니다.

통계적인 유의성에 대한 분계점은 유의 수준(α 또는 알파로 표시됨)에 따라 다릅니다. 단계적 선택 방법을 사용하지 않을 경우 유의 수준은 1 - 분석에 대한 신뢰 수준입니다. 신뢰 수준을 변경하는 방법에 대한 자세한 내용은 적합 회귀 모형에 대한 옵션 선택에서 확인하십시오. 후진 선택 또는 단계적 선택을 사용하는 경우, 유의 수준은 Minitab이 모형에서 항을 제거하는 유의 수준입니다(제거할 변수에 대한 알파라고 함). 전진 선택을 사용하는 경우, 유의 수준은 Minitab이 모형에 항을 추가하는 유의 수준입니다(입력할 변수에 대한 알파라고 함). 단계적 방법의 선택 항목에 대한 자세한 내용은 적합 회귀 모형에 대한 단계적 회귀 분석 수행에서 확인하십시오.

잔차 그림

사용할 잔차
잔차 그림에 표시할 잔차 유형을 지정합니다. 자세한 내용은 Minitab에서 계산되는 잔차의 유형에서 확인하십시오.
  • 정규 잔차: 정규 원시 잔차를 표시합니다.
  • 표준화 잔차: 표준화 잔차를 표시합니다.
  • 외적 스튜던트화 잔차: 외적 스튜던트화 잔차를 표시합니다.
잔차 그림
잔차 그림을 사용하여 모형이 분석의 가정을 충족하는지 조사합니다. 자세한 내용은 Minitab의 잔차 그림에서 확인하십시오.
  • 개별 그림: 표시할 잔차 그림을 선택합니다.
    잔차 히스토그램
    잔차 히스토그램을 표시합니다.
    잔차의 정규 확률도
    잔차의 정규 확률도를 표시합니다.
    잔차 대 적합치
    잔차 대 적합치 그림을 표시합니다.
    잔차 대 순서
    잔차 대 데이터 순서를 표시합니다. 각 데이터 점의 행 번호가 x 축에 표시됩니다.
  • 네 개 모두: 네 개의 잔차 그림을 모두 한 그래프에 표시합니다.
잔차 대 변수
잔차에 대해 표시할 하나 이상의 변수를 입력합니다. 다음과 같은 유형의 변수를 표시할 수 있습니다.
  • 이미 현재 모형에 있는 변수(잔차에서 곡면성을 찾으려는 경우)
  • 현재 모형에 없는 중요 변수(반응과 관련이 있는지 확인하려는 경우)

결정계수 대 모형 선택 단계

단계적 절차로 검증을 사용한 전진 선택 을 사용하는 경우 Minitab은 학습 데이터 세트에 대한 결정계수 통계 그림과 모형 선택 절차의 각 단계에 대한 검정 결정계수 통계 또는 k-폴드 단계적 결정계수 통계를 제공합니다. 검정 결정계수 통계 또는 k-폴드 단계적 검정계수 통계의 표시는 검정 데이터 세트를 사용하는지 또는 k-폴드 교차 검증을 사용하는지에 따라 달라집니다.

해석

그림을 사용하여 각 단계에서 서로 다른 결정계수 통계의 값을 비교합니다. 일반적으로 결정계수 통계가 모두 큰 경우 모형이 잘 수행됩니다. Minitab은 검정 검정계수 통계 또는 k-폴드 단계적 검정계수 통계를 최대화하는 단계의 모형 회귀 통계를 표시합니다. 그림은 더 간단한 모형이 좋은 후보가 될 수 있을 만큼 충분히 잘 적합하는지 여부를 보여줍니다.

모형이 과도 적합인 경우 항이 모형에 들어옴에 따라 검정 결정계수 통계 또는 k-폴드 단계적 검정계수 통계가 감소하기 시작합니다. 이 감소는 모든 데이터에 대한 해당 교육 결정계수 통계 또는 결정계수 통계가 계속 증가하는 동안 발생합니다. 과도 적합 모형은 모집단에서 중요하지 않은 효과에 대한 항을 추가할 때 발생합니다. 과도 적합 모형은 모집단에 대한 예측을 만드는 데 유용하지 않을 수 있습니다. 모형이 과도 적합인 경우 이전 단계의 모형을 고려할 수 있습니다.

다음 그림은 검정 결정계수를 예로 들 수 있습니다. 처음에 결정계수 통계는 모두 70%에 가깝습니다. 처음 몇 단계의 경우 항이 모형에 들어오면 결정계수 통계가 모두 증가하는 경향이 있습니다. 6단계에서 검정 결정계수 통계는 약 88%입니다. 검정 결정계수 통계의 최대값은 14단계에 있으며 값이 90%에 가깝습니다. 적합치의 개선이 모형에 더 많은 항을 추가하는 것에서 추가 복잡성을 정당화하는지 여부를 고려할 수 있습니다.

14단계 후 결정계수가 계속 증가하지만 검정 결정계수는 증가하지 않습니다. 14단계 이후 검정 결정계수가 감소하면 모형이 과도 적합임을 나타냅니다.