포아송 모형 적합에 대한 주요 결과 해석

포아송 회귀 분석 모형을 해석하려면 다음 단계를 수행하십시오. 주요 결과는 p-값, 계수, 모형 요약 통계량 및 잔차 그림 등입니다.

1단계: 반응과 항 간의 연관성이 통계적으로 유의한지 여부 확인

반응과 모형의 각 항 간의 연관성이 통계적으로 유의한지 여부를 확인하려면 항에 대한 p-값을 유의 수준과 비교하여 귀무 가설을 평가합니다. 귀무 가설은 항과 반응 간에 연관성이 없다는 것입니다. 일반적으로 0.05의 유의 수준(α 또는 알파로 표시됨)이 적절합니다. 0.05의 유의 수준은 실제로 연관성이 없는데 연관성이 존재한다는 결론을 내릴 위험이 5%라는 것을 나타냅니다.
p-값 ≤ α: 연관성이 통계적으로 유의함
p-값이 유의 수준보다 작거나 같으면 반응 변수와 항 간에 통계적으로 유의한 연관성이 있다는 결론을 내릴 수 있습니다.
p-값 > α: 연관성이 통계적으로 유의하지 않음
p-값이 유의 수준보다 크면 반응 변수와 항 간에 통계적으로 유의한 연관성이 있다는 결론을 내릴 수 없습니다. 항 없이 모형을 다시 적합시킬 수도 있습니다.
반응과 통계적으로 유의한 연관성이 없는 예측 변수가 여러 개 있는 경우 한 번에 하나씩 항을 줄여 모형을 축소할 수 있습니다. 모형에서 항을 제거하는 방법은 모형 축소에서 확인하십시오.
모형 항이 통계적으로 유의하면 해석은 항의 유형에 따라 다릅니다. 해석은 다음과 같습니다.
  • 계량형 예측 변수가 유의하면 예측 변수에 대한 계수가 0이 아니라는 결론을 내릴 수 있습니다.
  • 범주형 예측 변수가 유의하면 모든 수준의 평균 사건 수가 동일하지는 않다는 결론을 내릴 수 있습니다.
  • 교호작용 항이 유의하면 예측 변수와 사건 수 간의 관계가 항의 다른 예측 변수에 따라 다르다는 결론을 내릴 수 있습니다.
  • 다항식 항이 유의하면 예측 변수와 사건 수 간의 관계가 예측 변수의 크기에 따라 다르다는 결론을 내릴 수 있습니다.

분산 분석



Wald 검정
출처DF카이-제곱P-값
회귀356.290.000
  세척 후 시간14.740.029
  온도138.460.000
  나사 크기113.090.000

계수

계수SE 계수Z-값P-값VIF
상수4.39820.062870.020.000 
세척 후 시간0.017980.008262.180.0291.00
온도-0.0019740.000318-6.200.0001.00
나사 크기         
  소-0.15460.0427-3.620.0001.00
주요 결과: p-값, 계수

이 결과에서는 예측 변수 3개가 모두 0.05 유의 수준에서 통계적으로 유의합니다. 이러한 변수의 변화가 반응 변수의 변화와 연관되어 있다는 결론을 내릴 수 있습니다.

예측 변수가 변화함에 따라 사건이 발생할 확률이 증가하는지 또는 감소하는지 여부를 확인하려면 계수를 사용합니다. 예측 변수에 대해 추정된 계수는 모형의 다른 예측 변수가 상수로 고정된 상태에서 예측 변수의 각 단위가 바뀔 때의 연결 함수의 변화를 나타냅니다. 계수와 사건 수 간의 관계는 연결 함수, 모형에 포함된 범주형 예측 변수에 대한 기준 수준 등 분석의 여러 측면에 따라 달라집니다. 일반적으로 계수가 양이면 사건이 발생할 가능성이 더 높고 계수가 음이면 사건이 발생할 가능성이 낮습니다. 추정된 계수가 0에 가까우면 예측 변수의 영향이 작거나 존재하지 않는다는 것을 나타냅니다.

범주형 예측 변수에 대해 추정된 계수는 예측 변수의 기준 수준에 따라 다르게 해석됩니다. 계수가 양수이면 요인의 기준 수준보다 예측 변수의 해당 수준에서 사건이 발생할 가능성이 높다는 것을 나타냅니다. 계수가 음수이면 기준 수준보다 예측 변수의 해당 수준에서 사건이 발생할 가능성이 낮다는 것을 나타냅니다.

세척 후 시간 계수가 양수이며, 더 긴 시간이 더 높은 반응 값과 연관이 있음을 의미합니다. 온도 계수는 음수이며, 더 높은 온도과 더 낮은 반응 값과 연관이 있음을 의미합니다.

나사 크기는 계수가 하나인 범주형 변수이며, 따라서 변수에 2개 수준이 있고 변수가 0, 1 코드화를 사용함을 의미합니다. 작은 나사에 대한 계수는 음수이므로, 작은 나사는 기준 수준보다 낮은 반응 값과 연관이 있습니다.

교호작용 항이 통계적으로 유의하면 예측 변수와 반응 간의 관계가 다른 예측 변수의 수준별로 다릅니다. 이 경우에는 교호작용 효과를 고려하지 않고 주효과를 해석해서는 안 됩니다. 모형의 주효과, 교호작용 효과, 곡면성에 대한 자세한 내용은 요인 그림반응 최적화 도구에서 확인하십시오.

2단계: 모형이 데이터에 적합하지 않는지 여부 확인

적합도 검정은 예측된 사건 수와 관측된 사건 수가 포아송 분포에 의해 예측되지 않는 방법으로 차이가 나는지 확인하기 위해 사용합니다. 적합도 검정의 p-값이 선택한 유의 수준보다 낮은 경우 포아송 분포가 양호한 적합도를 제공한다는 귀무 가설을 거부할 수 있습니다. 다음 리스트에는 편차의 일반적인 이유가 나와 있습니다.
  • 잘못된 연결 함수
  • 모형에 있는 변수에 대한 고차 항 제외됨
  • 모형에 없는 예측 변수 제외됨
  • 과대산포

편차가 통계적으로 유의한 경우 다른 연결 함수를 사용하거나 모형의 항을 변경할 수 있습니다.

적합도 검정

검정DF추정치평균카이-제곱P-값
이탈도3231.607220.9877331.610.486
Pearson3231.267130.9771031.270.503
주요 결과: 이탈도 검정, Pearson 검정

이 결과에서 적합도 검정의 p-값은 모두 일반적인 유의 수준인 0.05보다 높습니다. 예측된 사건 수가 관측된 사건 수와 다르다는 결론을 내릴 충분한 증거가 없습니다.

3단계: 모형이 데이터를 얼마나 잘 적합시키는지 확인

여러 모형을 비교하려면 AIC, AICc 및 BIC를 사용합니다. 각 통계량에 대해 작은 값을 사용하는 것이 바람직합니다. 그러나 예측 변수 집합에 대한 값이 가장 작은 모형이 반드시 데이터를 잘 적합시키는 것은 아닙니다. 모형이 데이터를 얼마나 잘 적합시키는지 평가하려면 적합도 검정과 잔차 그림도 사용하십시오.

모형 요약

이탈도 R-Sq이탈도 R-Sq(수정)AICAICcBIC
64.20%60.80%253.29254.58259.62

계수

계수SE 계수Z-값P-값VIF
상수4.39820.062870.020.000 
세척 후 시간0.017980.008262.180.0291.00
온도-0.0019740.000318-6.200.0001.00
나사 크기         
  소-0.15460.0427-3.620.0001.00
주요 결과: AIC

첫 번째 결과 집합에서 AIC는 약 253입니다. AICc는 약 255입니다. BIC는 약 260입니다. 이 모형에는 온도와 나사 크기 간 교호작용이 포함되지 않습니다. 개별 모형의 정보 기준은 값이 표본 크기에 종속되므로 모형이 데이터를 얼마나 잘 적합시키는지 나타내지 않습니다.

모형 요약

이탈도 R-Sq이탈도 R-Sq(수정)AICAICcBIC
85.99%81.46%236.05238.05243.97

계수

계수SE 계수Z-값P-값VIF
상수4.57600.073662.150.000 
세척 후 시간0.017980.008262.180.0291.00
온도-0.0032850.000441-7.460.0001.92
나사 크기         
  소-0.54440.0990-5.500.0005.37
온도*나사 크기         
  소0.0028040.0006404.380.0006.64

두 번째 결과 집합에서 AIC는 약 236입니다. AICc는 약 238입니다. BIC는 약 244입니다. 이 모형에는 온도와 나사 크기 간 교호작용이 포함됩니다. 값이 작을수록 교호작용이 있는 모형의 성능이 더 우수합니다.