순서형 로지스틱 회귀 분석에 대한 주요 결과 해석

순서형 로지스틱 회귀 분석 모형을 해석하려면 다음 단계를 수행하십시오. 주요 결과는 p-값, 계수, 로그 우도 및 연관성 측도 등입니다.

1단계: 반응과 항 사이의 연관성이 통계적으로 유의한지 확인

반응과 모형의 각 항 간의 연관성이 통계적으로 유의한지 여부를 확인하려면 항에 대한 p-값을 유의 수준과 비교하여 귀무 가설을 평가합니다. 귀무 가설은 항과 반응 간에 연관성이 없다는 것입니다. 일반적으로 0.05의 유의 수준(α 또는 알파로 표시함)이 적절합니다. 0.05의 유의 수준은 실제로 연관성이 없는데 연관성이 존재한다는 결론을 내릴 위험이 5%라는 것을 나타냅니다.
p-값 ≤ α: 연관성이 통계적으로 유의합니다.
p-값이 유의 수준보다 작거나 같으면 반응 변수와 항 간에 통계적으로 유의한 연관성이 있다는 결론을 내릴 수 있습니다.
p-값 > α: 연관성이 통계적으로 유의하지 않습니다.
p-값이 유의 수준보다 크면 반응 변수와 항 간에 통계적으로 유의한 연관성이 있다는 결론을 내릴 수 없습니다. 항 없이 모형을 다시 적합시킬 수도 있습니다.
반응과 통계적으로 유의한 연관성이 없는 예측 변수가 여러 개 있는 경우 한 번에 하나씩 항을 줄여 모형을 축소할 수 있습니다. 모형에서 항을 제거하는 방법은 모형 축소에서 확인하십시오.

수준이 3개 이상인 범주형 요인의 경우, 계수에 대한 가설은 요인의 해당 수준이 요인의 기준 수준과 다른지 여부에 대한 것입니다. 요인의 통계적 유의성을 평가하려면 자유도가 1을 초과하는 항에 검증을 사용합니다. 이 검정을 표시하는 방법에 대한 자세한 내용은 순서형 로지스틱 회귀 분석에 대해 표시할 결과 선택에서 확인하십시오.

반응 정보 변수 값 카운트 재방문 예약 많음 19 조금 43 없음 11 총계 73
로지스틱 회귀 분석 표 95% CI 예측 변수 계수 SE 계수 Z P 승산비 하한 상한 상수(1) -0.505898 0.938791 -0.54 0.590 상수(2) 2.27788 0.985924 2.31 0.021 거리 -0.0470551 0.0797374 -0.59 0.555 0.95 0.82 1.12
주요 결과: p-값, 계수

환자 만족도 설문조사 분석에서 환자가 병원에 오기 위해 이동한 거리와 환자가 다시 병원에 올 확률의 관계를 조사합니다. 이 결과에서는 거리가 0.05 유의 수준에서 통계적으로 유의합니다. 거리 변동이 서로 다른 사건이 발생할 확률의 변동과 연관성이 있다는 결론을 내릴 수 있습니다.

계수를 구하여 예측 변수의 변동이 사건의 발생 확률을 높이거나 낮추는지 확인할 수 있습니다. 계수와 확률의 관계는 연결 함수 등 분석의 여러 측면에 좌우됩니다. 계수가 양이면 예측 변수가 증가할수록 첫 번째 사건과 첫 번째 사건에 더 가까운 사건의 발생 확률이 더 높습니다. 계수가 음이면 예측 변수가 증가할수록 마지막 사건과 마지막 사건에 더 가까운 사건의 발생 확률이 더 높습니다. 자세한 내용은 계수에서 확인하십시오.

거리의 계수는 약 -0.05이므로 더 먼 거리가 "없음" 응답의 확률 증가 및 "많음" 응답의 확률 감소와 연관성이 있음을 시사합니다.

2단계: 모형이 데이터를 얼마나 잘 적합시키는지 확인

모형에 데이터에 얼마나 적합한지 확인하려면 로그 우도와 연관성 측도를 조사합니다. 로그 우도 값이 클수록 데이터에 더 적합함을 나타냅니다. 로그 우도 값은 음수이므로 값이 0에 가까울수록 값이 더 큽니다. 로그 우도는 표본 데이터에 따라 달라지므로 로그 우도를 사용하여 서로 다른 데이터 집합의 모형을 비교할 수 없습니다.

모형에 항을 추가하면 로그 우도가 감소할 수 없습니다. 예를 들어 항이 5개인 모형의 로그 우도는 같은 항을 사용하여 만들 수 있는 어떤 4항 모형의 우도보다도 높습니다. 따라서 로그 우도는 같은 크기의 모형을 비교할 때 유용합니다. 개별 항에 대한 결정을 내리려면 일반적으로 다른 로짓의 항에 대한 p-값을 살펴봅니다.

Somers의 D, Goodman-Kruskal 감마 및 Kendall의 타우-a 값이 클수록 모형의 예측 능력이 우수함을 나타냅니다. Somers의 D와 Goodman-Kruskal 감마는 -1과 1 사이일 수 있습니다. Kendall의 타우-a는 -2/3와 2/3 사이일 수 있습니다. 값이 최대값에 가까우면 모형의 예측 능력이 우수함을 나타냅니다. 값이 0에 가까우면 모형과 반응값 간에 예측 관계가 없음을 나타냅니다. 실제로는 모형과 반응값이 서로 연관이 없으면 성능이 더 나쁘기 때문에 음수 값은 드뭅니다.

순서형 로지스틱 회귀 분석: 재방문 예약 대 거리

연결 함수:로짓

반응 정보 변수 값 카운트 재방문 예약 많음 19 조금 43 없음 11 총계 73
로지스틱 회귀 분석 표 95% CI 예측 변수 계수 SE 계수 Z P 승산비 하한 상한 상수(1) -0.505898 0.938791 -0.54 0.590 상수(2) 2.27788 0.985924 2.31 0.021 거리 -0.0470551 0.0797374 -0.59 0.555 0.95 0.82 1.12

로그 우도 = -68.987

모든 기울기가 0인 검정 DF G P-값 1 0.328 0.567
적합도 검정 방법 카이-제곱 DF P Pearson 97.419 101 0.582 이탈도 100.516 101 0.495
연관성 측도: (반응 변수와 예측 확률 사이) 쌍 번호 백분율 요약 측도 일치 832 55.5 Somers의 D 0.13 불일치 637 42.5 Goodman-Kruskal 감마 0.13 같은 값 30 2.0 Kendall의 타우-a 0.07 총계 1499 100.0
주요 결과: 로그 우도, Somers의 D, Goodman-Kruskal 감마, Kendall의 타우-a

예를 들어 한 병원의 관리자가 환자 만족도에 영향을 미치는 요인을 연구합니다. 첫 번째 결과 집합에서 환자가 병원까지 오기 위해 이동하는 거리는 환자가 다시 병원에 오겠다고 말할 확률을 예측합니다. 로그 우도는 −68.987입니다. Somers의 D와 Goodman-Kruskal 감마는 0.13입니다. Kendall의 타우-a는 0.07입니다. 이들 값은 0에 가까우므로 거리와 반응 간의 관계가 약하다는 것을 의미합니다. 모든 기울기가 0이라는 검정에 대한 p-값은 0.05보다 크므로 관리자는 다른 모형을 사용해 봅니다.

두 번째 결과 집합에서는 거리와 거리 제곱이 모두 예측 변수입니다. 모형의 항 수가 서로 다르므로 로그 우도를 사용하여 모형을 비교할 수 없습니다. 두 번째 모형에 대한 연관성 측도가 더 높으므로 두 번째 모형이 첫 번째 모형보다 성능이 더 우수함을 나타냅니다.

순서형 로지스틱 회귀 분석: 재방문 예약 대 거리

* 경고 * 알고리즘이 20회 반복 후에도 수렴하지 않았습니다. * 경고 * 로그 우도 또는 모수 추정치 기준에 대하여 수렴에 도달하지 않았습니다. * 경고 * 결과를 신뢰할 수 없을 수도 있습니다. * 경고 * 최대 반복 횟수를 늘려 보십시오.

연결 함수:로짓

반응 정보 변수 값 카운트 재방문 예약 없음 2 많음 3 조금 4 총계 9
로지스틱 회귀 분석 표 95% CI 예측 변수 계수 SE 계수 Z P 승산비 하한 상한 상수(1) -8.37842 44.7209 -0.19 0.851 상수(2) -6.68100 44.7154 -0.15 0.881 거리 3.06326 13.2432 0.23 0.817 21.40 0.00 4.00884E+12 거리*거리 -0.285089 0.962191 -0.30 0.767 0.75 0.11 4.96

로그 우도 = -292.087

모든 기울기가 0인 검정 DF G P-값 2 0.000 1.000
적합도 검정 방법 카이-제곱 DF P Pearson 79.970 100 0.930 이탈도 541.172 100 0.000
연관성 측도: (반응 변수와 예측 확률 사이) 쌍 번호 백분율 요약 측도 일치 274 79.2 Somers의 D 0.77 불일치 6 1.7 Goodman-Kruskal 감마 0.96 같은 값 66 19.1 Kendall의 타우-a 0.10 총계 346 100.0
이 사이트를 사용하면 분석 및 사용자 개인 컨텐츠에 대한 쿠키 사용에 동의하는 것입니다.  당사의 개인정보 보호정책을 확인하십시오