순서형 로지스틱 회귀 분석에 대한 주요 결과 해석

순서형 로지스틱 회귀 분석 모형을 해석하려면 다음 단계를 수행하십시오. 주요 결과는 p-값, 계수, 로그 우도 및 연관성 측도 등입니다.

이 항목의 내용

1단계: 반응과 항 사이의 연관성이 통계적으로 유의한지 확인
2단계: 모형이 데이터를 얼마나 잘 적합시키는지 확인

1단계: 반응과 항 사이의 연관성이 통계적으로 유의한지 확인

반응과 모형의 각 항 간의 연관성이 통계적으로 유의한지 여부를 확인하려면 항에 대한 p-값을 유의 수준과 비교하여 귀무 가설을 평가합니다. 귀무 가설은 항과 반응 간에 연관성이 없다는 것입니다. 일반적으로 0.05의 유의 수준(α 또는 알파로 표시됨)이 적절합니다. 0.05의 유의 수준은 실제로 연관성이 없는데 연관성이 존재한다는 결론을 내릴 위험이 5%라는 것을 나타냅니다.

p-값 ≤ α: 연관성이 통계적으로 유의함: p-값이 유의 수준보다 작거나 같으면 반응 변수와 항 간에 통계적으로 유의한 연관성이 있다는 결론을 내릴 수 있습니다.
p-값 > α: 연관성이 통계적으로 유의하지 않음: p-값이 유의 수준보다 크면 반응 변수와 항 간에 통계적으로 유의한 연관성이 있다는 결론을 내릴 수 없습니다. 항 없이 모형을 다시 적합시킬 수도 있습니다.; 반응과 통계적으로 유의한 연관성이 없는 예측 변수가 여러 개 있는 경우 한 번에 하나씩 항을 줄여 모형을 축소할 수 있습니다. 모형에서 항을 제거하는 방법은 모형 축소에서 확인하십시오.

수준이 3개 이상인 범주형 요인의 경우, 계수에 대한 가설은 요인의 해당 수준이 요인의 기준 수준과 다른 지에 대한 것입니다. 요인의 통계적 유의성을 평가하려면 자유도가 1을 초과하는 항에 검증을 사용합니다. 이 검정을 표시하는 방법에 대한 자세한 내용은 순서형 로지스틱 회귀 분석에 대해 표시할 결과 선택에서 확인하십시오.

반응 정보

변수	값	카운트
재방문 예약	많음	19
	조금	43
	없음	11
	총계	73

로지스틱 회귀 분석 표

						95% CI
예측 변수	계수	SE 계수	Z	P	승산비	하한	상한
상수(1)	-0.505898	0.938791	-0.54	0.590
상수(2)	2.27788	0.985924	2.31	0.021
거리	-0.0470551	0.0797374	-0.59	0.555	0.95	0.82	1.12

주요 결과: p-값, 계수

환자 만족도 설문조사 분석에서 환자가 병원에 오기 위해 이동한 거리와 환자가 다시 병원에 올 확률의 관계를 조사합니다. 이러한 결과에서 거리는 0.05의 유의 수준에서 통계적으로 유의하지 않습니다. 거리의 변화가 다른 이벤트가 발생하는 확률의 변화와 관련이 있다고 단정할 수 없습니다.

계수를 구하여 예측 변수의 변동이 사건의 발생 확률을 높이거나 낮추는지 확인할 수 있습니다. 계수와 확률의 관계는 연결 함수 등 분석의 여러 측면에 좌우됩니다. 계수가 양이면 예측 변수가 증가할수록 첫 번째 사건과 첫 번째 사건에 더 가까운 사건의 발생 확률이 더 높습니다. 계수가 음이면 예측 변수가 증가할수록 마지막 사건과 마지막 사건에 더 가까운 사건의 발생 확률이 더 높습니다. 자세한 내용은 계수에서 확인하십시오.

거리의 계수는 약 -0.05이므로 더 먼 거리가 "없음" 응답의 확률 증가 및 "많음" 응답의 확률 감소와 연관성이 있음을 시사합니다.

2단계: 모형이 데이터를 얼마나 잘 적합시키는지 확인

모형에 데이터에 얼마나 적합한지 확인하려면 로그 우도와 연관성 측도를 조사합니다. 로그 우도 값이 클수록 데이터에 더 적합함을 나타냅니다. 로그 우도 값은 음수이므로 값이 0에 가까울수록 값이 더 큽니다. 로그 우도는 표본 데이터에 따라 달라지므로 로그 우도를 사용하여 서로 다른 데이터 집합의 모형을 비교할 수 없습니다.

모형에 항을 추가하면 로그 우도가 감소할 수 없습니다. 예를 들어 항이 5개인 모형의 로그 우도는 같은 항을 사용하여 만들 수 있는 어떤 4항 모형의 우도보다도 높습니다. 따라서 로그 우도는 같은 크기의 모형을 비교할 때 유용합니다. 개별 항에 대한 결정을 내리려면 일반적으로 다른 로짓의 항에 대한 p-값을 살펴봅니다.

Somers의 D, Goodman-Kruskal 감마 및 Kendall의 타우-a 값이 클수록 모형의 예측 능력이 우수함을 나타냅니다. Somers의 D와 Goodman-Kruskal 감마는 -1과 1 사이일 수 있습니다. Kendall의 타우-a는 -2/3와 2/3 사이일 수 있습니다. 값이 최대값에 가까우면 모형의 예측 능력이 우수함을 나타냅니다. 값이 0에 가까우면 모형과 반응값 간에 예측 관계가 없음을 나타냅니다. 실제로는 모형과 반응값이 서로 연관이 없으면 성능이 더 나쁘기 때문에 음수 값은 드뭅니다.

연결 함수:로짓

반응 정보

변수	값	카운트
재방문 예약	많음	19
	조금	43
	없음	11
	총계	73

로지스틱 회귀 분석 표

						95% CI
예측 변수	계수	SE 계수	Z	P	승산비	하한	상한
상수(1)	-0.505898	0.938791	-0.54	0.590
상수(2)	2.27788	0.985924	2.31	0.021
거리	-0.0470551	0.0797374	-0.59	0.555	0.95	0.82	1.12

로그 우도 = -68.987

모든 기울기가 0인 검정

DF	G	P-값
1	0.328	0.567

적합도 검정

방법	카이-제곱	DF	P
Pearson	97.419	101	0.582
이탈도	100.516	101	0.495

연관성 측도:

(반응 변수와 예측 확률 사이)

쌍	번호	백분율	요약 측도	값
일치	832	55.5	Somers의 D	0.13
불일치	637	42.5	Goodman-Kruskal 감마	0.13
같은 값	30	2.0	Kendall의 타우-a	0.07
총계	1499	100.0

주요 결과: 로그 우도, Somers의 D, Goodman-Kruskal 감마, Kendall의 타우-a

예를 들어 한 병원의 관리자가 환자 만족도에 영향을 미치는 요인을 연구합니다. 첫 번째 결과 집합에서 환자가 병원까지 오기 위해 이동하는 거리는 환자가 다시 병원에 오겠다고 말할 확률을 예측합니다. 로그 우도는 −68.987입니다. Somers의 D와 Goodman-Kruskal 감마는 0.13입니다. Kendall의 타우-a는 0.07입니다. 이들 값은 0에 가까우므로 거리와 반응 간의 관계가 약하다는 것을 의미합니다. 모든 기울기가 0이라는 검정에 대한 p-값은 0.05보다 크므로 관리자는 다른 모형을 사용해 봅니다.

두 번째 결과 집합에서는 거리와 거리 제곱이 모두 예측 변수입니다. 모형의 항 수가 서로 다르므로 로그 우도를 사용하여 모형을 비교할 수 없습니다. 두 번째 모형에 대한 연관성 측도가 더 높으므로 두 번째 모형이 첫 번째 모형보다 성능이 더 우수함을 나타냅니다.

순서형 로지스틱 회귀 분석: 재방문 예약 대 거리

연결 함수:로짓

반응 정보

변수	값	카운트
재방문 예약	많음	19
	조금	43
	없음	11
	총계	73

로지스틱 회귀 분석 표

						95% CI
예측 변수	계수	SE 계수	Z	P	승산비	하한	상한
상수(1)	6.38671	3.06110	2.09	0.037
상수(2)	9.31883	3.15929	2.95	0.003
거리	-1.25608	0.523879	-2.40	0.017	0.28	0.10	0.80
거리*거리	0.0495427	0.0214636	2.31	0.021	1.05	1.01	1.10

로그 우도 = -66.118

모든 기울기가 0인 검정

DF	G	P-값
2	6.066	0.048

적합도 검정

방법	카이-제곱	DF	P
Pearson	114.903	100	0.146
이탈도	94.779	100	0.629

연관성 측도:

(반응 변수와 예측 확률 사이)

쌍	번호	백분율	요약 측도	값
일치	938	62.6	Somers의 D	0.29
불일치	505	33.7	Goodman-Kruskal 감마	0.30
같은 값	56	3.7	Kendall의 타우-a	0.16
총계	1499	100.0