순서형 로지스틱 회귀 분석에 대한 로지스틱 회귀 분석 표

로지스틱 회귀 분석 표의 모든 통계량에 대한 정의 및 해석 방법을 확인해 보십시오.

계수

순서형 로지스틱 회귀 분석에서는 모형의 각 항에 대한 계수를 추정합니다. 모형의 항에 대한 계수는 각 결과 범주에 대해 동일합니다.

순서형 로지스틱 회귀 분석에서는 하나를 제외한 모든 결과 범주에 대한 상수 계수도 추정합니다. 상수 계수는 변수에 대한 계수와 함께 이항 회귀 방정식의 집합을 구성합니다. 첫 번째 방정식은 첫 사건이 발생할 확률을 추정합니다. 두 번째 방정식은 첫 번째 또는 두 번째 사건이 발생할 확률을 추정합니다. 세 번째 방정식은 첫 번째, 두 번째 또는 세 번째 이벤트가 발생할 확률을 추정하며, 이런 식으로 계속됩니다. Minitab에서는 이런 상수 계수를 Const (1), Const (2), Const (3) 등으로 표시합니다.

해석

계수는 예측 변수가 바뀔 때 결과의 확률이 어떻게 변하는지 조사하기 위해 사용합니다. 예측 변수에 대한 추정 계수는 예측 변수의 각 단위가 바뀔 때의 연결 함수의 변화를 나타냅니다. 결과의 계수와 결과의 관계는 연결 함수, 반응 범주의 순서, 그리고 모형에 있는 범주형 예측 변수에 대한 기준 수준을 포함한 분석의 다양한 측면에 따라 다릅니다. 일반적으로 계수가 양이면 예측 변수가 증가할수록 첫 번째 사건과 첫 번째 사건에 더 가까운 사건의 발생 확률이 더 높습니다. 계수가 음이면 예측 변수가 증가할수록 마지막 사건과 마지막 사건에 더 가까운 사건의 발생 확률이 더 높습니다. 추정 계수가 0에 가까우면 예측 변수의 영향이 작음을 의미합니다.

예를 들어 환자 만족도 설문조사 분석에서 환자가 병원에 오기 위해 이동한 거리와 환자가 다시 병원에 올 확률의 관계를 조사합니다. 첫 사건은 반응 정보 표에서 첫 번째 사건입니다. 이 경우에 첫 번째 사건은 "많음"이고 마지막 사건은 "없음"입니다. 음의 거리 계수는 거리가 증가할수록 환자가 "없음"이라고 답할 확률이 더 높음을 나타냅니다.

반응 정보

변수카운트
재방문 예약많음19
  조금43
  없음11
  총계73

로지스틱 회귀 분석 표







95% CI
예측 변수계수SE 계수ZP승산비하한상한
상수(1)-0.5058980.938791-0.540.590     
상수(2)2.277880.9859242.310.021     
거리-0.04705510.0797374-0.590.5550.950.821.12

범주형 예측 변수의 경우, 기준 수준에서 로지스틱 회귀 분석 표에 있는 예측 변수의 수준까지의 변화를 측정합니다. 일반적으로 계수가 양수인 경우 로지스틱 회귀 분석 표의 예측 변수 수준에서 첫 번째 사건이 발생할 확률이 요인의 기준 수준에서 발생할 확률보다 더 높음을 나타냅니다. 계수가 음수인 경우 로지스틱 회귀 분석 표에 있는 요인 수준에서 마지막 사건이 발생할 확률이 요인의 기준 수준에서 발생할 확률보다 더 높음을 나타냅니다.

예를 들어 환자 만족도 설문조사 분석에서 환자의 고용 상태와 환자가 다시 병원에 올 확률의 관계를 조사합니다. 이 경우 첫 번째 사건은 "많음"이고 마지막 사건은 "없음"입니다. 고용 상태는 "미취업자" 또는 "취업자"일 수 있습니다. 로지스틱 회귀 분석 표에 없는 예측 변수의 기준 수준은 "취업자"입니다. 계수가 음수이며 수준이 "미취업"인 경우 미취업자인 환자가 취업자인 환자보다 "없음"이라고 답할 확률이 더 높음을 나타냅니다.

반응 정보

변수카운트
재방문 예약많음19
  조금43
  없음11
  총계73

로지스틱 회귀 분석 표







95% CI
예측 변수계수SE 계수ZP승산비하한상한
상수(1)-0.7075120.352815-2.010.045     
상수(2)2.123160.4446724.770.000     
고용 상태             
  미취업자-0.6314680.471078-1.340.1800.530.211.34

참고

상수 계수를 예측 변수에 대한 항과 함께 사용하여 확률을 추정할 수 있습니다. Minitab은 사용자가 분석을 수행할 때 이런 관측치에 대한 확률을 워크시트에 저장할 수 있습니다. 자세한 내용은 순서형 로지스틱 회귀 분석에 대한 통계량 저장에서 확인하십시오.

SE 계수

계수의 표준 오차는 동일한 모집단에서 반복해서 표본을 추출하는 경우 얻을 수 있는 계수 추정치 간의 변동성을 추정합니다. 이 계산에서는 반복해서 표본을 추출해도 추정할 표본 크기와 계수가 변경되지 않는다고 가정합니다.

해석

계수 표준 오차를 사용하여 계수 추정치의 정확도를 측정할 수 있습니다. 표준 오차가 작을수록 추정치가 더 정확합니다.

Z-값

Z-값은 계수와 계수의 표준 오차 간의 비율을 측정하는 검정 통계량입니다.

해석

Minitab에서는 항과 모형의 통계적 유의성에 대한 결정을 내릴 때 사용하는 p-값을 계산하기 위해 Z-값을 사용합니다. 이 검정은 표본 계수의 분포가 정규 분포를 따를 정도로 표본 크기가 충분히 클 때 정확합니다.

0에서 충분히 떨어져 있는 Z-값은 계수 추정치가 0과 통계적으로 다를만큼 충분히 크고 정확함을 나타냅니다. 반대로, 0과 가까운 Z-값은 항이 반응에 영향을 미친다고 확신하기에는 계수가 너무 작거나 너무 부정확함을 나타냅니다. .

p-값

p-값은 귀무 가설에 반하는 증거를 측정하는 확률입니다. p-값이 작을수록 귀무 가설에 반하는 더 강력한 증거가 됩니다.

해석

반응과 모형의 각 항 간의 연관성이 통계적으로 유의한지 여부를 확인하려면 항에 대한 p-값을 유의 수준과 비교하여 귀무 가설을 평가합니다. 귀무 가설은 항의 계수가 0으로, 항과 반응 간에 연관성이 없다는 것을 나타냅니다. 일반적으로 0.05의 유의 수준(α 또는 알파로 표시함)이 적절합니다. 0.05의 유의 수준은 실제로 연관성이 없는데 연관성이 존재한다는 결론을 내릴 위험이 5%라는 것을 나타냅니다.
p-값 ≤ α: 연관성이 통계적으로 유의합니다.
p-값이 유의 수준보다 작거나 같으면 반응 변수와 항 간에 통계적으로 유의한 연관성이 있다는 결론을 내릴 수 있습니다.
p-값 > α: 연관성이 통계적으로 유의하지 않습니다.
p-값이 유의 수준보다 크면 반응 변수와 항 간에 통계적으로 유의한 연관성이 있다는 결론을 내릴 수 없습니다. 항 없이 모형을 다시 적합시킬 수도 있습니다.
반응과 통계적으로 유의한 연관성이 없는 예측 변수가 여러 개 있는 경우 한 번에 하나씩 항을 줄여 모형을 축소할 수 있습니다. 모형에서 항을 제거하는 방법은 모형 축소에서 확인하십시오.
모형 항이 통계적으로 유의한 경우 해석은 항의 유형에 따라 다릅니다. 해석은 다음과 같습니다.
  • 계량형 예측 변수가 유의하면 반응 수준 확률이 예측 변수에 따라 달라진다는 결론을 내릴 수 있습니다.
  • 범주형 예측 변수가 유의하면 반응 수준이 해당 요인 수준에서 발생할 확률이 요인의 기준 수준에서 발생할 확률과 다르다는 결론을 내릴 수 있습니다.
  • 교호작용 항이 유의하면 예측 변수와 반응 수준 확률의 관계가 항의 다른 예측 변수에 따라 다르다는 결론을 내릴 수 있습니다.
  • 다항식 항이 유의하면 예측 변수와 반응 수준 확률의 관계가 예측 변수의 크기에 따라 다르다는 결론을 내릴 수 있습니다.

승산비

승산비는 두 사건의 승산을 비교합니다. 사건의 승산은 사건이 발생할 확률을 사건이 발생하지 않을 확률로 나눈 것입니다. 모형에서 로짓 연결 함수를 사용하는 경우 Minitab에서는 승산비를 계산합니다.

해석

예측 변수의 효과를 이해하려면 승산비를 사용합니다. 승산비에 대한 해석은 예측 변수가 범주형인지 아니면 계량형인 지에 따라 달라집니다.

계량형 예측 변수에 대한 승산비

승산비가 1보다 크면 예측 변수가 증가할수록 첫 번째 사건과 첫 번째 사건에 더 가까운 사건의 발생 확률이 높아짐을 나타냅니다. 승산비가 1보다 작으면 예측 변수가 증가할수록 마지막 사건과 마지막 사건에 더 가까운 사건의 발생 확률이 높아짐을 의미합니다.

예를 들어 환자 만족도 설문조사 분석에서 환자가 병원에 오기 위해 이동한 거리와 환자가 다시 병원에 올 확률의 관계를 조사합니다. 첫 번째 사건은 반응 정보 표에서 첫 번째 사건입니다. 이 경우에 첫 번째 사건은 "많음"이고 마지막 사건은 "없음"입니다. 거리에 대한 승산비 0.95는 거리가 증가할수록 환자가 "많음"이라고 답할 확률이 더 높음을 나타냅니다. 환자 이동 거리가 1마일씩 늘어날 때마다 환자가 "조금" 또는 "없음" 대신 "많음"이라고 답할 확률이 약 5%씩 감소합니다.

반응 정보

변수카운트
재방문 예약많음19
  조금43
  없음11
  총계73

로지스틱 회귀 분석 표







95% CI
예측 변수계수SE 계수ZP승산비하한상한
상수(1)-0.5058980.938791-0.540.590     
상수(2)2.277880.9859242.310.021     
거리-0.04705510.0797374-0.590.5550.950.821.12

범주형 예측 변수에 대한 승산비

범주형 예측 변수의 경우, 승산비는 예측 변수의 서로 다른 2개 수준에서 사건이 발생할 확률을 비교합니다. 승산비가 1보다 크면 로지스틱 회귀 분석 표의 예측 변수 수준에서 첫 번째 사건과 첫 번째 사건에 더 가까운 사건이 발생할 확률이 예측 변수의 기준 수준에서 발생할 확률보다 더 높음을 나타냅니다. 승산비가 1보다 작으면 로지스틱 회귀 분석 표의 예측 변수 수준에서 마지막 사건과 마지막 사건에 더 가까운 사건이 발생할 확률이 예측 변수의 기준 수준에서 발생할 확률보다 더 높음을 나타냅니다.

예를 들어 환자 만족도 설문조사 분석에서 환자의 고용 상태와 환자가 다시 병원에 올 확률의 관계를 조사합니다. 이 경우 첫 번째 사건은 "많음"이고 마지막 사건은 "없음"입니다. 고용 상태는 "미취업자" 또는 "취업자"일 수 있습니다. 로지스틱 회귀 분석 표에 없는 예측 변수의 기준 수준은 "취업자"입니다. 승산비가 1보다 작으므로 환자가 취업자일 경우 미취업자보다 병원에 다시 올 가능성이 "많다"고 답할 확률이 더 큽니다. 환자가 미취업자인 경우 "조금" 또는 "없음" 대신 "많음"이라고 답할 확률은 환자가 취업자인 경우에 "많음"이라고 답할 확률의 53%입니다. 또한 미취업 환자가 "없음" 대신 "많음" 또는 "조금"이라고 답할 확률도 53%입니다.

반응 정보

변수카운트
재방문 예약많음19
  조금43
  없음11
  총계73

로지스틱 회귀 분석 표







95% CI
예측 변수계수SE 계수ZP승산비하한상한
상수(1)-0.7075120.352815-2.010.045     
상수(2)2.123160.4446724.770.000     
고용 상태             
  미취업자-0.6314680.471078-1.340.1800.530.211.34

참고

승산비에는 범주 순서가 사용되므로, 승산비는 순서를 벗어난 범주에 대해 확률이 어떻게 변하는지 설명하지 않습니다. 예를 들어 환자가 "많음" 또는 "없음"이라고 답하는 확률의 변화를 설명하지 않습니다. 임의 순서의 범주를 모형화하려면 명목형 로지스틱 회귀 분석을 사용합니다.

승산비에 대한 신뢰 구간(95% CI)

이 신뢰 구간(CI)은 승산비의 실제 값이 포함될 가능성이 높은 값의 범위입니다. 신뢰 구간 계산에는 정규 분포가 사용됩니다. 신뢰 구간은 표본 승산비의 분포가 정규 분포를 따를 정도로 표본 크기가 충분히 큰 경우에 정확합니다.

표본이 랜덤이기 때문에 모집단의 두 표본에서 동일한 신뢰 구간이 생성될 가능성은 없습니다. 그러나 여러 개의 랜덤 표본을 추출하면 일정한 백분율의 신뢰 구간에는 알 수 없는 모집단 모수가 포함됩니다. 모수를 포함하는 이러한 신뢰 구간의 백분율이 해당 구간의 신뢰 수준입니다.

신뢰 구간은 다음 두 부분으로 구성됩니다.
점 추정치
점 추정치는 표본 데이터에서 계산되는 모수의 추정치입니다.
오차 한계
오차 한계는 신뢰 구간의 너비를 정의하며 사건 확률의 범위, 표본 크기 및 신뢰 수준에 영향을 받습니다.

해석

신뢰 구간은 승산비의 추정치를 평가하는 데 사용합니다.

예를 들어 95% 신뢰 수준에서는 모집단에 대한 승산비의 값이 신뢰 구간에 포함된다고 95% 확신할 수 있습니다. 신뢰 구간은 결과의 실제 유의성을 평가하는 데 도움이 됩니다. 해당 상황에 실제적으로 유의한 값이 신뢰 구간에 포함되는지 여부를 확인하려면 전문 지식을 이용하십시오. 신뢰 구간이 너무 넓어서 유의하지 않은 경우에는 표본 크기를 늘려보십시오.

자유도가 1보다 큰 항에 대한 검정

이 검정은 범주형 예측 변수에 대한 모든 계수를 동시에 고려하는 전체 검정입니다. 수준이 2개가 넘는 범주형 예측 변수에 사용하는 검정입니다.

해석

이 검정은 계수가 2개 이상인 범주형 예측 변수가 반응 사건과 통계적으로 유의한 관계가 있는지 확인하기 위해 사용합니다. 범주형 예측 변수의 수준이 3개 이상이면 개별 수준에 대한 계수의 p-값이 각기 다릅니다. 전체 검정은 예측 변수가 통계적으로 유의한지 여부에 대한 답을 하나만 제시합니다.

반응 사건과 범주형 예측 변수의 연관성이 통계적으로 유의한지 확인하려면 검정에 대한 p-값을 유의 수준과 비교하여 귀무 가설을 평가합니다. 귀무 가설은 예측 변수와 반응 사건 간에 연관성이 없다는 것입니다. 일반적으로 0.05의 유의 수준(α 또는 알파로 표시함)이 적절합니다. 0.05의 유의 수준은 실제로 연관성이 없는데 연관성이 존재한다는 결론을 내릴 위험이 5%라는 것을 나타냅니다.
p-값 ≤ α: 연관성이 통계적으로 유의합니다.
p-값이 유의 수준보다 작거나 같으면 반응 변수와 예측 변수 간에 통계적으로 유의한 연관성이 있다는 결론을 내릴 수 있습니다.
p-값 > α: 연관성이 통계적으로 유의하지 않습니다.
p-값이 유의 수준보다 크면 반응 변수와 예측 변수 간에 통계적으로 유의한 연관성이 있다는 결론을 내릴 수 없습니다.

로그 우도

Minitab에서는 로그 우도 함수를 극대화하여 추정된 계수의 최적 값을 구합니다.

해석

로그 우도는 동일한 데이터를 사용하여 계수를 추정하는 두 모형을 비교하는 데 사용합니다. 값은 음수이므로 값이 0에 가까울수록 모형이 데이터에 더 적합합니다.

모형에 항을 추가하면 로그 우도가 감소할 수 없습니다. 예를 들어 항이 5개인 모형의 로그 우도는 같은 항을 사용하여 만들 수 있는 4항 모형의 우도보다 높습니다. 따라서 로그 우도는 같은 크기의 모형을 비교할 때 유용합니다. 개별 항에 대한 결정을 내리기 위해서는 일반적으로 다른 로짓의 항에 대한 p-값을 살펴봅니다.

모든 기울기가 0인지 검정

이 검정은 모형의 예측 변수에 대한 계수를 모두 고려하는 전체 검정입니다.

해석

이 검정은 모형의 예측 변수 중 하나 이상이 반응 사건과 통계적으로 유의한 연관성이 있는지 확인하기 위해 사용합니다. 일반적으로 G 통계량 또는 자유도(DF)는 해석하지 않습니다. DF는 모형의 예측 변수에 대한 계수의 수와 같습니다.

반응 사건과 예측 변수의 연관성이 통계적으로 유의한지 확인하려면 검정에 대한 p-값을 유의 수준과 비교하여 귀무 가설을 평가합니다. 귀무 가설은 모형의 예측 변수에 대한 계수가 모두 0이라는 가설이며, 이는 반응 사건과 예측 변수 사이에 연관성이 존재하지 않음을 의미합니다. 일반적으로 0.05의 유의 수준(α 또는 알파로 표시함)이 적절합니다. 0.05의 유의 수준은 실제로 연관성이 없는 데 연관성이 존재한다는 결론을 내릴 위험이 5%라는 것을 나타냅니다.
p-값 ≤ α: 연관성이 통계적으로 유의합니다.
p-값이 유의 수준보다 작거나 같으면 반응 변수와 하나 이상의 예측 변수 간에 통계적으로 유의한 연관성이 있다는 결론을 내릴 수 있습니다.
p-값 > α: 연관성이 통계적으로 유의하지 않습니다.
p-값이 유의 수준보다 크면 반응 변수와 항 간에 통계적으로 유의한 연관성이 있다는 결론을 내릴 수 없습니다.