포아송 모형 적합에 대한 주요 결과 해석

포아송 회귀 분석 모형을 해석하려면 다음 단계를 수행하십시오. 주요 결과는 p-값, 계수, 모형 요약 통계량 및 잔차 그림 등입니다.

1단계: 반응과 항 사이의 연관성이 통계적으로 유의한지 확인

반응과 모형의 각 항 간의 연관성이 통계적으로 유의한지 여부를 확인하려면 항에 대한 p-값을 유의 수준과 비교하여 귀무 가설을 평가합니다. 귀무 가설은 항과 반응 간에 연관성이 없다는 것입니다. 일반적으로 0.05의 유의 수준(α 또는 알파로 표시함)이 적절합니다. 0.05의 유의 수준은 실제로 연관성이 없는데 연관성이 존재한다는 결론을 내릴 위험이 5%라는 것을 나타냅니다.
p-값 ≤ α: 연관성이 통계적으로 유의합니다.
p-값이 유의 수준보다 작거나 같으면 반응 변수와 항 간에 통계적으로 유의한 연관성이 있다는 결론을 내릴 수 있습니다.
p-값 > α: 연관성이 통계적으로 유의하지 않습니다.
p-값이 유의 수준보다 크면 반응 변수와 항 간에 통계적으로 유의한 연관성이 있다는 결론을 내릴 수 없습니다. 항 없이 모형을 다시 적합시킬 수도 있습니다.
반응과 통계적으로 유의한 연관성이 없는 예측 변수가 여러 개 있는 경우 한 번에 하나씩 항을 줄여 모형을 축소할 수 있습니다. 모형에서 항을 제거하는 방법은 모형 축소에서 확인하십시오.
모형 항이 통계적으로 유의한 경우 해석은 항의 유형에 따라 다릅니다. 해석은 다음과 같습니다.
  • 계량형 예측 변수가 유의하면 예측 변수에 대한 계수가 0이 아니라는 결론을 내릴 수 있습니다.
  • 범주형 예측 변수가 유의하면 모든 수준의 평균 사건 수가 동일하지는 않다는 결론을 내릴 수 있습니다.
  • 교호작용 항이 유의하면 예측 변수와 사건 수 간의 관계가 항의 다른 예측 변수에 따라 다르다는 결론을 내릴 수 있습니다.
  • 다항식 항이 유의하면 예측 변수와 사건 수 간의 관계가 예측 변수의 크기에 따라 다르다는 결론을 내릴 수 있습니다.
이탈도 표 출처 DF 수정 분산 수정 평균 카이-제곱 P-값 회귀 3 56.670 18.8900 56.67 0.000 세척 후 시간 1 4.744 4.7444 4.74 0.029 온도 1 38.800 38.8000 38.80 0.000 나사 크기 1 13.126 13.1256 13.13 0.000 오차 32 31.607 0.9877 총계 35 88.277
계수 항 계수 SE 계수 VIF 상수 4.3982 0.0628 세척 후 시간 0.01798 0.00826 1.00 온도 -0.001974 0.000318 1.00 나사 크기 소 -0.1546 0.0427 1.00
주요 결과: p-값, 계수

이 결과에서는 예측 변수 3개가 모두 0.05 유의 수준에서 통계적으로 유의합니다. 이런 변수의 변동이 반응 변수의 변동과 연관이 있다는 결론을 내릴 수 있습니다.

예측 변수가 변화하면 사건 발생 확률이 더 높아지는지 또는 더 낮아지는지 확인하려면 계수를 사용하십시오. 예측 변수에 대해 추정된 계수는 모형의 다른 예측 변수가 상수로 고정된 상태에서 예측 변수의 각 단위가 바뀔 때의 연결 함수의 변화를 나타냅니다. 계수와 사건 수 간의 관계는 연결 함수, 모형에 포함된 범주형 예측 변수에 대한 기준 수준 등 분석의 여러 측면에 따라 달라집니다. 일반적으로 계수가 양수이면 사건이 발생할 확률이 높고, 계수가 음수이면 사건이 발생할 확률이 낮습니다. 추정된 계수가 0에 가까우면 예측 변수의 영향이 작거나 존재하지 않는다는 것을 나타냅니다.

범주형 예측 변수에 대해 추정된 계수는 예측 변수의 기준 수준에 따라 다르게 해석됩니다. 계수가 양수이면 요인의 기준 수준보다 예측 변수의 해당 수준에서 사건이 발생할 확률이 높다는 것을 나타냅니다. 계수가 음수이면 기준 수준보다 예측 변수의 해당 수준에서 사건이 발생할 확률이 낮다는 것을 나타냅니다.

세척 후 시간 계수가 양수이며, 더 긴 시간이 더 높은 반응 값과 연관이 있음을 의미합니다. 온도 계수는 음수이며, 더 높은 온도과 더 낮은 반응 값과 연관이 있음을 의미합니다.

나사 크기는 계수가 하나인 범주형 변수이며, 따라서 변수에 2개 수준이 있고 변수가 0, 1 코드화를 사용함을 의미합니다. 작은 나사에 대한 계수는 음수이므로, 작은 나사는 기준 수준보다 낮은 반응 값과 연관이 있습니다.

교호작용 항이 통계적으로 유의하면 예측 변수와 반응 간의 관계가 다른 예측 변수의 수준에 따라 다릅니다. 이 경우에는 교호작용 효과를 고려하지 않고 주 효과를 해석하면 안 됩니다. 모형의 주 효과 및 교호작용 효과와 곡면성에 대해 더 자세히 알아보려면 요인 그림반응 최적화 도구를 참조하십시오.

2단계: 모형이 데이터에 적합한지 여부 확인

적합도 검정은 예측된 사건 수와 관측된 사건 수가 포아송 분포에 의해 예측되지 않는 방법으로 차이가 나는지 확인하기 위해 사용합니다. 적합도 검정의 p-값이 선택한 유의 수준보다 낮은 경우 포아송 분포가 양호한 적합도를 제공한다는 귀무 가설을 거부할 수 있습니다. 다음 리스트에는 편차의 일반적인 이유가 나와 있습니다.
  • 잘못된 연결 함수
  • 모형에 있는 변수에 대한 고차 항 제외됨
  • 모형에 없는 예측 변수 제외됨
  • 과대산포

편차가 통계적으로 유의한 경우 다른 연결 함수를 사용하거나 모형의 항을 변경할 수 있습니다.

적합도 검정 검정 DF 추정치 평균 카이-제곱 P-값 이탈도 32 31.60722 0.98773 31.61 0.486 Pearson 32 31.26713 0.97710 31.27 0.503
주요 결과: 이탈도 검정, Pearson 검정

이 결과에서 적합도 검정의 p-값은 모두 일반적인 유의 수준인 0.05보다 높습니다. 예측된 사건 수가 관측된 사건 수와 다르다는 결론을 내릴 충분한 증거가 없습니다.

3단계: 모형이 데이터를 얼마나 잘 적합시키는지 확인

여러 모형을 비교하려면 AIC를 사용하십시오. AIC가 작을수록 모형이 데이터를 잘 적합시킵니다. 그러나 예측 변수 집합에 대한 AIC가 가장 작은 모형이 반드시 데이터를 잘 적합시키는 것은 아닙니다. 모형이 데이터를 얼마나 잘 적합시키는지 평가하려면 적합도 검정과 잔차 그림도 사용하십시오.

모형 요약 이탈도 이탈도 R-Sq R-Sq(수정) AIC 64.20% 60.80% 253.29
계수 항 계수 SE 계수 VIF 상수 4.3982 0.0628 세척 후 시간 0.01798 0.00826 1.00 온도 -0.001974 0.000318 1.00 나사 크기 소 -0.1546 0.0427 1.00
주요 결과: AIC

첫 번째 결과 집합에서 AIC는 약 253입니다. 이 모형에는 온도와 나사 크기 간 교호작용이 포함되지 않습니다. 개별 AIC 모형은 값이 표본 크기에 따라 달라지기 때문에 모형의 적합 여부를 나타내지 않습니다.

모형 요약 이탈도 이탈도 R-Sq R-Sq(수정) AIC 85.99% 81.46% 236.05
계수 항 계수 SE 계수 VIF 상수 4.5760 0.0736 세척 후 시간 0.01798 0.00826 1.00 온도 -0.003285 0.000441 1.92 나사 크기 소 -0.5444 0.0990 5.37 온도*나사 크기 소 0.002804 0.000640 6.64

두 번째 결과 집합에서 AIC는 약 236입니다. 이 모형에는 온도와 나사 크기 간 교호작용이 포함됩니다. AIC가 작을수록 교호작용이 있는 모형의 성능이 더 우수합니다.

이 사이트를 사용하면 분석 및 사용자 개인 컨텐츠에 대한 쿠키 사용에 동의하는 것입니다.  당사의 개인정보 보호정책을 확인하십시오