이항 로지스틱 회귀 분석에서는 이항 반응/빈도 형식 및 사건/시행 형식 등 두 가지 형식으로 데이터를 입력할 수 있습니다. 분석을 위한 데이터 형식은 일반적으로 데이터를 수집한 방법과 일치합니다.

사건/시행 형식의 데이터를 사용해야 하는 이유

일반적으로 한 번에 여러 시행을 수집하기 때문에 사건/시행 형식으로 데이터를 수집하고 분석합니다. 예를 들어, 한 엔지니어가 집적 회로 200개의 배치를 생산합니다. 배치의 모든 회로는 동일한 공정 설정을 사용해야 합니다. 이 200개의 회로는 200회의 시행입니다. 엔지니어가 동일한 설정의 다른 배치에서 수집하는 데이터는 별도의 행에 포함됩니다.

사건/시행 형식의 예

사건/시행 형식에서 반응 변수는 두 개의 열을 사용합니다. 한 열에는 성공 또는 관심의 대상이 되는 사건의 횟수가 포함됩니다. 다른 열에는 시행 횟수가 포함됩니다.

이 워크시트의 성공에는 사건 발생 횟수가 포함되며 전기 기능 검사를 통과한 회로 수를 나타냅니다. 시행에는 시행 횟수가 포함되며 해당 예측 변수의 조합에 대해 생산된 칩의 총 개수가 포함됩니다. 온도는 계량형 예측 변수입니다. 원자재는 범주형 예측 변수입니다. 워크시트의 첫 번째 행은 1500도의 온도에서 공급업체 B의 원자재를 사용하여 만든 칩 200개의 배치가 표시됩니다. 이러한 회로 중 180개가 전기 기능 검사를 통과했습니다.
C1 C2 C3 C4
성공 시행 온도 원자재
180 200 1500 공급업체 B
200 200 1400 공급업체 A
196 200 1500 공급업체 A
197 200 1400 공급업체 B
190 200 1400 공급업체 A
193 200 1400 공급업체 B
198 200 1500 공급업체 A
185 200 1500 공급업체 B

참고

워크시트의 데이터가 사건/시행 형식이지만 행당 시행 횟수가 작으면 통계량의 신뢰도와 해석이 달라집니다. 예를 들어, 모든 행에 1번의 시행이 있으면 행당 사건 발생 횟수가 0 또는 1입니다 이러한 데이터의 분석은 데이터가 이항 반응/빈도 형식이고 빈도 열이 없는 것과 같습니다.

이항 반응/빈도 형식의 데이터를 사용해야 하는 이유

일반적으로 결과가 발생함에 따라 각 시행의 결과를 별도로 기록할 수 있기 때문에 이항 반응/빈도 형식으로 데이터를 수집하고 분석합니다. 예를 들어, 한 마케팅 컨설턴트는 소비자가 슈퍼마켓에서 나올 때 소비자가 새 상표의 시리얼을 구입했는 지에 대한 설문 조사를 실시합니다. 각 소비자가 응답하면 컨설턴트가 개별 정보를 기록합니다.

이항 반응/빈도 형식 데이터의 예

이항 반응/빈도 형식에서 반응 변수는 하나의 열을 사용합니다. 반응 열에는 두 개의 값만 있으며, 그 중 하나는 사건을 나타내고 다른 하나는 비사건을 나타냅니다.

이 워크시트에서 구입은 반응이며 소비자가 새 상표의 시리얼을 구입했는지 여부를 나타냅니다. 반응 사건은 입니다. 수입은 계량형 예측 변수이고 자녀는 범주형 예측 변수입니다. 워크시트의 첫 번째 행은 첫 컨설턴트가 질문한 첫 번째 소비자의 경우 자녀가 있고, 수입이 $37,000이며, 새 상표의 시리얼을 구입했다는 것을 보여줍니다.
C1 C2 C3
구입 수입 자녀
있음 37 있음
없음 47 있음
있음 34 없음
있음 58 없음

이항 반응/빈도 형식의 데이터에 대해 빈도 열을 포함할 수 있습니다. 잔차 대 순서 그림을 명확하게 해석하려면 연속 관측치만 결합하십시오. 비연속 관측치를 결합하면 잔차 대 순서 그림에 패턴이 표시되거나 숨겨질 수 있습니다.

이 워크시트에서 반응 및 예측 변수는 이전 예와 같지만 데이터에 빈도 변수도 포함됩니다. 빈도에는 각 행의 반응 및 예측 변수 값의 조합에 해당하는 소비자 카운트가 포함됩니다. 워크시트의 첫 번째 행은 자녀가 있고 수입이 $40,000인 소비자 2명이 새 상표의 시리얼을 구입했다는 것을 보여줍니다. 이들이 설문 조사에 응한 처음 두 명의 소비자가 아니면 워크시트의 데이터 순서가 수집 순서와 다릅니다. 잔차 대 순서 그림의 패턴이 숨겨지거나 재배열된 데이터에 대해 무의미할 수 있습니다.
C1 C2 C3 C4
구입 수입 자녀 빈도
있음 40 있음 2
없음 40 없음 12
있음 45 있음 1
없음 45 없음 6