이항 로지스틱 모형 적합 방법

원하는 방법 또는 공식을 선택하십시오.

요인/공변량 패턴

데이터 집합의 단일 요인/공변량 값 집합에 대해 설명합니다. Minitab에서는 각 요인/공변량 패턴에 대한 사건 확률, 잔차 및 기타 진단 측도를 계산합니다.

예를 들어 데이터 집합에 성별 및 인종 요인과 나이 공변량이 포함되어 있는 경우, 이런 예측 변수의 조합에는 피실험자 수만큼 많은 공분산 패턴이 포함될 수 있습니다. 데이터 집합에 각각 2개 수준에서 코드화된 인종과 성별 요인만 포함되어 있는 경우, 가능한 요인/공변량 패턴은 4개뿐입니다. 데이터를 빈도나 성공, 시행 또는 실패 횟수로 입력할 경우 각 행에 요인/공변량 패턴이 하나씩 포함됩니다.

이항 로지스틱 모형 적합에 대한 내부 가중치

일반화 선형 모형의 경우 가중치 행렬은 가중치를 지정하지 않는 경우 ID 행렬이 아닙니다. 내부 가중치는 더 많은 데이터를 사용하여 관측치 분석에 더 많은 영향을 주는 것으로 생각할 수 있습니다. 예를 들어 이항 로지스틱 회귀에 적합하면 시행 횟수가 많을 때 내부 가중치가 더 큰 경향이 있습니다.

수식

다음 수식은 특정 링크 함수에 대한 내부 가중치를 제공합니다.
로짓
노밋
곰핏

표기법

용어설명
mithe number of trials for the i번째 row
the predicted probability for the design point in a binary logistic model
yithe number of events for the i번째 row
the inverse cumulative distribution function of the standard normal distribution for the predicted probability in a binary logistic model

Minitab이 이항 로지스틱 모형 적합의 회귀 분석에서 높은 상관 관계가 있는 예측 변수를 제거하는 방법

rij를 Xi 및 Xj 행렬과 관련된 현재 제거된 행렬의 원소로 설정합니다.

변수는 한 번에 하나씩 추가되거나 제거됩니다. Xk는 현재 rkk ≥ 1(기본값이 0.0001인 공차)인 모형에 포함되지 않은 독립 변수인 경우 추가할 수 있으며, 또한 현재 모형에 포함된 각 변수 Xj에 대해,

회귀 방정식에서 높은 상관 관계가 있는 예측 변수를 제거하기 위해 Minitab에서는 다음 단계를 수행합니다.
  1. Minitab에서는 상관 행렬 R에 대해 SWEEP 방법을 수행하고 X1 … Xp를 랜덤 변수인 것처럼 처리합니다.
  2. 연속형 예측 변수의 경우, Minitab에서는 원소 rkk를 공차와 비교합니다. rkk ≥ 공차이며 여기서 k = 1 ~ p입니다.
  3. 현재 모형에 있는 각 변수 Xj 에 대해 Minitab에서는 (rjj – rjk * (rkj / rkk)) * 공차 ≤ 1임을 확인합니다.
    참고

    여기서 rkk, rjk, rjj는 k 단계 SWEEP 연산 후 Xj 및 Xk 변수에 해당하는 대각 및 비대각 원소입니다.

  4. 그렇지 않은 경우, 예측 변수는 검정을 통과하지 못하며 모형에서 제거됩니다.
    참고

    기본 공차 값은 8.8e–12입니다.

참고

TOLERANCE 하위 명령을 GZLM 세션 명령과 함께 사용하여 Minitab에서 다른 예측 변수와 높은 상관 관계가 있는 예측 변수를 모형에 유지하도록 할 수 있습니다. 그러나 공차를 낮추는 것은 위험하며 숫자가 부정확해질 수 있습니다.