유효한 결과를 얻으려면 데이터를 수집하고 분석을 수행하거나 결과를 해석할 때 다음 지침을 따르십시오.
- 예측 변수는 계량형 또는 범주형일 수 있습니다
-
계량형 변수는 측정 및 정렬이 가능하며 임의의 두 변수 사이에 무한한 수의 값을 가질 수 있습니다. 예를 들어, 타이어 표본의 지름은 계량형 변수입니다.
범주형 변수에는 유한하고 셀 수 있는 수의 범주 또는 고유 그룹이 포함됩니다. 범주형 데이터에는 논리적 순서가 없을 수도 있습니다. 예를 들어, 범주형 예측 변수에는 성별, 재료 유형, 결제 방법이 포함됩니다.
이산형 변수가 있는 경우 이 변수를 계량형 예측 변수로 간주할 것인지, 범주형 예측 변수로 간주할 것인지 결정할 수 있습니다. 이산형 변수는 측정 및 정렬이 가능하지만 셀 수 있는 수의 값을 가질 수 있습니다. 예를 들어, 한 가구에 거주하는 사람의 수는 이산형 변수입니다. 이산형 변수를 계량형으로 간주할 것인지, 범주형으로 간주할 것인 지는 수준 개수 및 분석 목적에 따라 결정됩니다.
범주형 예측 변수가 있으면 이 분석을 수행하기 전에 범주형 예측 변수를 지시 변수로 변환하십시오. 범주형 예측 변수를 변환하려면 지시 변수 만들기을 사용하십시오.
- 반응 변수가 계량형이어야 합니다
-
반응 변수가 범주형이면 모형이 분석의 가정을 충족하거나 데이터를 정확히 설명하거나 유용한 예측을 할 가능성이 적습니다.
데이터에 비선형 함수가 요구되지 않는 경우, 다음과 같은 분석을 대신 고려할 수 있습니다.
- 반응 변수에 두 개의 범주가 있으면(예: 통과 및 실패) 이항 로지스틱 모형 적합을 사용하십시오.
- 반응 변수에 자연스러운 순서를 갖는 세 개 이상의 범주가 있으면(예: 적극 반대, 반대, 중립, 찬성, 적극 찬성) 순서형 로지스틱 회귀 분석을 사용하십시오.
- 반응 변수에 자연스러운 순서를 갖지 않는 세 개 이상의 범주가 있으면(예: 긁힘, 패임, 찢어짐) 명목형 로지스틱 회귀 분석을 사용하십시오.
- 반응 변수가 발생 횟수를 카운트하면(예: 결점 수) 포아송 모형 적합을 사용하십시오.
- 기대 함수는 반응 변수와 예측 변수 간의 관계를 정확하게 설명해야 합니다.
- 반응 곡선의 형상이나 시스템의 물리적 및 화학적 속성의 움직임에 대한 사전 지식을 바탕으로 기대 함수를 선택할 수 있습니다. 잠재적인 비선형 형상으로는 오목, 볼록, 지수 성장 또는 감소, S자형 및 점근 곡선이 있습니다. 사전 지식 및 잔차 그림의 요구 사항을 모두 충족하는 함수를 지정해야 합니다.
- 허용 가능한 시작 값을 지정해야 합니다
- 반복 알고리즘에서 모수 추정치를 체계적으로 조정하여 오차의 제곱합(SSE)을 줄임으로써 모수를 추정합니다. 일부 기대 함수와 데이터 집합의 경우 시작 값이 결과에 유의한 영향을 미칠 수 있습니다.
- 최적의 경험을 사용한 데이터 수집
-
유효한 결과를 얻으려면 다음 지침을 따르십시오.
- 데이터가 관심 있는 모집단을 나타내는지 확인합니다.
- 필요한 정밀도를 제공하기에 충분한 데이터를 수집합니다.
- 최대한 정확하게 변수를 측정합니다.
- 데이터를 수집된 순서대로 기록합니다.
- 모형이 데이터를 잘 적합해야 합니다
-
모형이 데이터를 적합시키지 않으면 잘못된 결과를 얻을 수 있습니다. 결과에서 잔차 그림 및 모형 요약 통계량을 사용하여 모형이 데이터를 얼마나 잘 적합시키는지 확인하십시오.