판별 분석에 대한 데이터 입력

통계분석 > 다변량 > 판별 분석

이 항목의 내용

데이터 입력
판별 함수
교차 검증 사용
저장

데이터 입력

그룹에 각 관측치가 속하는 그룹을 나타내는 열을 입력합니다. 열은 숫자, 텍스트 또는 날짜/시간이며 최대 20개의 그룹을 포함할 수 있습니다.
참고
텍스트 그룹이 처리되는 순서를 기본값인 문자순에서 다른 순서로 변경하려면 사용자가 직접 순서를 정의하면 됩니다. 자세한 내용을 확인하려면 Minitab 결과에서 텍스트 값 표시 순서 변경으로 이동하십시오.
예측 변수에 그룹의 차이를 확인하기 위해 사용될 숫자 측정 변수가 포함된 열을 입력합니다.

이 워크시트에서 학습 과정은 그룹화 열로, 학교 관리자가 각 학생을 배치한 현재의 반을 나타냅니다. 시험 점수 및 동기은 각 학생의 반을 결정하기 위해 사용되는 예측 변수입니다.

C1	C2	C3
진로	시험 점수	동기
3	1021	44
2	1152	56
1	1224	61
3	1077	46
2	1149	55
2	1192	49

판별 함수

분석에 사용할 판별 함수를 선택합니다.

선형: 그룹의 공분산 행렬이 같다고 가정할 수 있는 경우 선형 판별 분석을 수행합니다. 자세한 내용은 선형 판별 분석의 정의에서 확인하십시오.
2차: 그룹의 공분산 행렬이 같다고 가정할 수 없는 경우 2차 판별 분석을 수행합니다. 자세한 내용은 2차 판별 분석의 정의에서 확인하십시오.

참고

각 판별 함수를 사용하여 분석을 두 번 실행한 다음 결과를 비교하여 데이터에 적합한 함수를 결정할 수 있습니다. 판별 함수를 평가하는 일반적인 방법은 올바른 분류의 비율을 비교하는 것입니다. 다른 방법은 알려진 그룹이 있는 일부 관측치에서 해당 그룹이 알 수 없는 그룹인 것처럼 간주한 다음 판별 함수가 알려진 그룹을 얼마나 잘 예측하는지 확인하는 것입니다.

교차 검증 사용

잘못 분류된 관측치의 낙관적인 명백한 오류율을 상쇄하려면 이 옵션을 선택합니다. 명백한 오류율은 잘못 분류된 관측치의 백분율입니다. 분류되는 데이터가 분류 함수를 구성하는 데 사용된 데이터와 동일하기 때문에 이 값은 낙관적이 되는 경향이 있습니다.

교차 검증의 경우 Minitab에서는 각 관측치를 한 번에 하나씩 제외하고 나머지 관측치로 판별 함수를 계산합니다. 그런 다음 Minitab에서는 제외된 관측치에 대한 그룹을 예측합니다. 올바른 그룹의 비율이 높으면 예측을 신뢰할 수 있습니다.

교차 검증을 사용하는 경우 Minitab에서는 추가 요약 표를 표시하고 잘못 분류된 관측치 요약 표의 교차 검증 정보를 추가합니다.

참고

보다 현실적인 오류율을 계산하는 다른 방법은 데이터를 두 개의 부분으로 분리하는 것입니다. 즉, 한 부분은 판별 함수를 만드는 데 사용하고 다른 부분은 검증 집합으로 사용합니다. 검증 집합에 대한 소속 그룹을 예측하고 이러한 데이터 중 잘못 분류된 데이터의 백분율로 오류율을 계산합니다.

저장

분석의 결과를 워크시트에 저장하여 다른 분석, 그래프 및 매크로에 사용할 수 있습니다. Minitab에서는 선택된 결과를 사용자가 입력한 열에 저장합니다. 적합치 및 교차 검증된 적합치에 대한 저장 열의 이름은 숫자로 끝나며 이 숫자는 결과를 여러 번 저장함에 따라 증가합니다.

선형 판별 함수: 선형 판별 함수의 계수를 저장할 열을 입력합니다. 각 그룹에 대해 하나의 열을 입력합니다. Minitab에서는 각 함수에 대해 하나의 열, 각 계수에 대해 하나의 행을 입력합니다. 상수는 각 열의 첫 번째 행에 저장됩니다.
적합치: 적합치를 저장하려면 이 옵션을 선택합니다. 관측치에 대한 적합치는 해당 관측치가 분류되는 그룹입니다. Minitab에서는 그룹 식별자를 데이터의 각 관측치에 대해 한 행씩 FITS1 열에 저장합니다.
교차 검증의 적합치: 교차 검증을 사용하여 판별을 수행하는 경우 적합치를 저장하려면 이 옵션을 선택합니다. 관측치에 대한 적합치는 해당 관측치가 분류되는 그룹입니다. Minitab에서는 교차 검증에 대한 그룹 식별자를 데이터의 각 관측치에 대해 한 행씩 XFIT1 열에 저장합니다.