이항 로지스틱 회귀 분석에서는 이항 반응/빈도 형식 및 사건/시행 형식 등 두 가지 형식으로 데이터를 입력할 수 있습니다. 분석을 위한 데이터 형식은 일반적으로 데이터를 수집한 방법과 일치합니다.
일반적으로 한 번에 여러 시행을 수집하기 때문에 사건/시행 형식으로 데이터를 수집하고 분석합니다. 예를 들어, 한 엔지니어가 집적 회로 200개의 배치를 생산합니다. 배치의 모든 회로는 동일한 공정 설정을 사용해야 합니다. 이 200개의 회로는 200회의 시행입니다. 엔지니어가 동일한 설정의 다른 배치에서 수집하는 데이터는 별도의 행에 포함됩니다.
사건/시행 형식에서 반응 변수는 두 개의 열을 사용합니다. 한 열에는 성공 또는 관심의 대상이 되는 사건의 횟수가 포함됩니다. 다른 열에는 시행 횟수가 포함됩니다.
C1 | C2 | C3 | C4 |
---|---|---|---|
성공 | 시행 | 온도 | 원자재 |
180 | 200 | 1500 | 공급업체 B |
200 | 200 | 1400 | 공급업체 A |
196 | 200 | 1500 | 공급업체 A |
197 | 200 | 1400 | 공급업체 B |
190 | 200 | 1400 | 공급업체 A |
193 | 200 | 1400 | 공급업체 B |
198 | 200 | 1500 | 공급업체 A |
185 | 200 | 1500 | 공급업체 B |
워크시트의 데이터가 사건/시행 형식이지만 행당 시행 횟수가 작으면 통계량의 신뢰도와 해석이 달라집니다. 예를 들어, 모든 행에 1번의 시행이 있으면 행당 사건 발생 횟수가 0 또는 1입니다 이러한 데이터의 분석은 데이터가 이항 반응/빈도 형식이고 빈도 열이 없는 것과 같습니다.
일반적으로 결과가 발생함에 따라 각 시행의 결과를 별도로 기록할 수 있기 때문에 이항 반응/빈도 형식으로 데이터를 수집하고 분석합니다. 예를 들어, 한 마케팅 컨설턴트는 소비자가 슈퍼마켓에서 나올 때 소비자가 새 상표의 시리얼을 구입했는 지에 대한 설문 조사를 실시합니다. 각 소비자가 응답하면 컨설턴트가 개별 정보를 기록합니다.
이항 반응/빈도 형식에서 반응 변수는 하나의 열을 사용합니다. 반응 열에는 두 개의 값만 있으며, 그 중 하나는 사건을 나타내고 다른 하나는 비사건을 나타냅니다.
C1 | C2 | C3 |
---|---|---|
구입 | 수입 | 자녀 |
있음 | 37 | 있음 |
없음 | 47 | 있음 |
있음 | 34 | 없음 |
있음 | 58 | 없음 |
이항 반응/빈도 형식의 데이터에 대해 빈도 열을 포함할 수 있습니다. 잔차 대 순서 그림을 명확하게 해석하려면 연속 관측치만 결합하십시오. 비연속 관측치를 결합하면 잔차 대 순서 그림에 패턴이 표시되거나 숨겨질 수 있습니다.
C1 | C2 | C3 | C4 |
---|---|---|---|
구입 | 수입 | 자녀 | 빈도 |
있음 | 40 | 있음 | 2 |
없음 | 40 | 없음 | 12 |
있음 | 45 | 있음 | 1 |
없음 | 45 | 없음 | 6 |