회귀 계수는 예측 변수와 반응 변수 간의 관계 크기와 방향을 설명합니다. 계수는 회귀 방정식에서 항의 값에 곱하는 숫자입니다.
예측 변수가 변화함에 따라 사건이 발생할 확률이 증가하는지 또는 감소하는지 여부를 확인하려면 계수를 사용합니다. 예측 변수에 대해 추정된 계수는 모형의 다른 예측 변수가 상수로 고정된 상태에서 예측 변수의 각 단위가 바뀔 때의 연결 함수의 변화를 나타냅니다. 계수와 확률 간의 관계는 연결 함수, 반응에 대한 기준 사건, 모형에 있는 범주형 예측 변수에 대한 기준 수준 등 분석의 여러 측면에 종속됩니다. 일반적으로 계수가 양이면 사건이 발생할 가능성이 더 높고 계수가 음이면 사건이 발생할 가능성이 낮습니다. 추정된 계수가 0에 가까우면 예측 변수의 효과가 작다는 것을 나타냅니다.
로짓 연결 함수는 추정된 계수에 대해 가장 자연스러운 해석을 제공하므로 Minitab의 기본 연결 함수입니다. 해석에서는 기준 사건의 승산이 P(사건)/P(비사건)이라는 사실을 이용하며 기타 예측 변수가 일정하다고 가정합니다. 로그 승산이 클수록 기준 사건의 가능성이 더 높습니다. 따라서 계수가 양이면 사건이 발생할 가능성이 더 높고 계수가 음이면 사건이 발생할 가능성이 낮습니다. 예측 변수의 여러 유형은 다음과 같이 해석됩니다.
계량형 예측 변수의 계수는 예측 변수가 한 단위 증가할 때마다 기준 사건에 대한 승산의 자연 로그에 있어 추정되는 변화입니다. 예를 들어, 시간(초)에 대한 계수가 1.4이면 시간이 1초 증가할 때마다 승산의 자연 로그가 1.4배 증가합니다.
추정된 계수는 승산비 또는 두 승산 간의 비율을 계산하는 데도 사용될 수 있습니다. 승산비를 계산하려면 예측 변수에 대한 계수를 거듭제곱합니다. 그 결과는 예측 변수가 x+1인 경우를 예측 변수가 x인 경우와 비교한 승산비입니다. 예를 들어, 질량(킬로그램)에 대한 승산비가 0.95이면 1킬로그램이 증가할 때마다 사건 확률이 약 5% 감소합니다.
계수의 표준 오차는 동일한 모집단에서 반복해서 표본을 추출하는 경우 얻을 수 있는 계수 추정치 간의 변동성을 추정합니다. 이 계산에서는 반복해서 표본을 추출해도 추정할 표본 크기와 계수가 변경되지 않는다고 가정합니다.
계수 표준 오차를 사용하여 계수 추정치의 정확도를 측정할 수 있습니다. 표준 오차가 작을수록 추정치가 더 정확합니다.
분산 팽창 인수(VIF)는 다중 공선성으로 인해 계수가 팽창된 양을 나타냅니다.
회귀 분석에 존재하는 다중 공선성의 정도를 설명하려면 VIF를 사용하십시오. 다중 공선성은 회귀 계수의 분산을 증가시켜 각 예측 변수가 반응에 미치는 개별적인 영향을 평가하기 어렵게 만들기 때문에 문제가 됩니다.
VIF | 다중 공선성 |
---|---|
VIF = 1 | 없음 |
1 < VIF < 5 | 중간 |
VIF > 5 | 높음 |
다중 공선성 및 다중 공선성의 영향을 완화시키는 방법에 대한 자세한 내용은 회귀 분석의 다중 공선성을 참조하십시오.
이항 로지스틱 회귀 분석의 경우 Minitab에서는 두 가지 유형의 회귀 방정식을 표시합니다. 첫 번째 방정식은 사건의 확률을 변환된 반응과 관련시킵니다. 첫 번째 방정식의 형식은 연결 함수에 따라 다릅니다. 두 번째 방정식은 예측 변수를 변환된 반응과 관련시킵니다.
반응과 예측 변수 간의 관계를 조사하려면 방정식을 사용하십시오.
예를 들어, 한 모형에서 약의 복용량을 사용하여 환자에게 특정 유형의 박테리아가 존재하는 사건을 예측합니다. 첫 번째 방정식은 로짓 연결 함수로 인한 확률과 변환된 반응 간의 관계를 보여줍니다. 두 번째 방정식은 복용량과 변환된 반응의 관계를 보여줍니다. 복용량에 대한 계수가 양수이기 때문에 복용량이 높을수록 박테리아가 존재할 가능성이 낮습니다.
P(박테리아 없음) | = | exp(Y')/(1 + exp(Y')) |
---|
Y' | = | -5.25 + 3.63 투여량(mg) |
---|
승산비 | 95% CI | |
---|---|---|
투여량(mg) | 37.5511 | (2.9647, 475.6190) |
승산비는 두 사건의 승산을 비교합니다. 사건의 승산은 사건이 발생할 확률을 사건이 발생하지 않을 확률로 나눈 것입니다. 모형에서 로짓 연결 함수를 사용하는 경우 Minitab에서는 승산비를 계산합니다.
예측 변수의 효과를 이해하려면 승산비를 사용합니다. 승산비가 1보다 크면 예측 변수가 증가함에 따라 사건 발생 확률이 증가한다는 것을 나타냅니다. 승산비가 1보다 작으면 예측 변수가 증가함에 따라 사건 발생 확률이 감소한다는 것을 나타냅니다.
이 결과에서 모형은 한 약품의 투여량 수준을 사용하여 성인의 박테리아 존재 여부를 예측합니다. 각 약에는 0.5mg의 투여량이 포함되어 있으며, 따라서 연구자들은 0.5mg의 단위 변화를 사용합니다. 승산비는 약 6입니다. 성인이 약 하나를 추가로 복용할 때마다 환자에게 박테리아가 없을 확률은 약 6배 증가합니다.
변경 단위 | 승산비 | 95% CI | |
---|---|---|---|
투여량(mg) | 0.5 | 6.1279 | (1.7218, 21.8087) |