판별 분석에 대한 모든 통계량 및 그래프 해석

판별 분석과 함께 제공되는 모든 통계 및 그래프에 대한 정의 및 해석 방법을 확인해 보십시오.

참 그룹

관측치가 분류되어 속한 실제 그룹입니다. 참 그룹은 워크시트의 그룹화 열 값에 의해 결정됩니다.

해석

관측치의 각 그룹으로 분류를 평가하려면 관측치가 포함된 그룹을 참 그룹과 비교하십시오.

분류 요약


참 그룹
그룹에 넣기123
15950
21533
30257
전체 N606060
N 정분류 595357
비율0.9830.8830.950

이 분류 요약 표의 2열은 53개의 관측치가 그룹 2에 올바르게 할당되었다는 것을 보여줍니다. 그러나 그룹 2의 관측치 5개를 그룹 1에 대신 넣었으며 그룹 2의 관측치 2개를 그룹 3에 넣었습니다. 따라서 그룹 2의 관측치 7개가 다른 그룹으로 잘못 할당되었습니다.

잘못 분류된 관측치 요약

관측치참 그룹예측 그룹그룹거리 제곱확률
4**1213.5240.438
      23.0280.562
      325.5790.000
65**2112.7640.677
      24.2440.323
      329.4190.000
71**2113.3570.592
      24.1010.408
      327.0970.000
78**2112.3270.775
      24.8010.225
      329.6950.000
79**2111.5280.891
      25.7320.109
      332.5240.000
100**2115.0160.878
      28.9620.122
      338.2130.000
107**23139.02260.000
      27.36040.032
      30.52490.968
116**23131.8980.000
      27.9130.285
      36.0700.715
123**32130.1640.000
      25.6620.823
      38.7380.177
124**32126.3280.000
      24.0540.918
      38.8870.082
125**32128.5420.000
      23.0590.521
      33.2300.479

잘못 분류된 관측치 요약 표의 1행은 관측치 4가 그룹 2에 속하는 것으로 예측되었지만 실제로는 그룹 1에 속합니다.

그룹에 넣기

판별 분석을 기반으로 하나의 관측치가 속하는 것으로 예측되는 그룹입니다.

해석

관측치의 각 그룹으로 분류를 평가하려면 관측치가 포함된 그룹을 참 그룹과 비교하십시오. 예를 들어, 다음 분류 요약 표의 2행은 총 1 + 53 + 3 = 57개의 관측치를 그룹 2에 넣었다는 것을 보여줍니다. 이 57개의 관측치 중에서 53개의 관측치가 그룹 2에 올바르게 할당되었습니다. 그러나 그룹 2에 넣은 관측치 중 1개는 실제로 그룹 1에서 가져온 것이고 그룹 2에 넣은 관측치 중 3개는 실제로 그룹 3에서 가져온 것입니다. 따라서 그룹 2에 속하는 것으로 예측된 관측치 중 4개는 실제로 다른 그룹에서 가져온 것입니다.

분류 요약


참 그룹
그룹에 넣기123
15950
21533
30257
전체 N606060
N 정분류 595357
비율0.9830.8830.950

전체 N

각 참 그룹의 총 관측치 수입니다.

N 정분류

각 참 그룹에 올바르게 배치된 관측치 수입니다. Minitab에서는 각 참 그룹에 대해 N 정분류를 표시하고 모든 그룹에 대해 전체 N 정분류를 표시합니다.

해석

N 정분류 값을 사용하여 데이터 집합에서 이미 할당된 그룹에 속하는 것으로 예측되는 관측치의 수를 확인합니다. 예를 들어, 그룹 1에 대해 N 정분류 값이 52이고 전체 N 값이 60이라고 가정합니다. 이는 워크시트의 그룹화 열에 있는 값을 기반으로 60개의 값이 그룹 1에 속하는 것으로 식별된다는 것을 나타냅니다. 이 60개의 관측치 중에서 52개가 분석에 사용된 판별 함수를 기반으로 그룹 1에 속하는 것으로 예측됩니다. 따라서 각 참 그룹에 올바르게 배치된 관측치 수는 52개입니다.

비율

각 참 그룹에 올바르게 배치된 관측치의 비율입니다.

해석

각 그룹에 올바르게 배치된 관측치의 비율을 사용하면 관측치가 얼마나 잘 분류되는지 평가할 수 있습니다. 예를 들어, 분류 요약 표의 비율은 다음과 같은 사항을 나타냅니다.

  • 그룹 1에 있는 관측치의 98.3%가 올바르게 배치되었습니다.
  • 그룹 2에 있는 관측치의 88.3%가 올바르게 배치되었습니다.
  • 그룹 3에 있는 관측치의 95%가 올바르게 배치되었습니다.

따라서 관측치를 그룹 2로 분류하는 데 가장 문제가 많습니다.

분류 요약


참 그룹
그룹에 넣기123
15950
21533
30257
전체 N606060
N 정분류 595357
비율0.9830.8830.950

N

데이터 집합에 있는 비결측값 수입니다. N은 모든 그룹의 총 관측치 수와 같습니다.

정분류 비율

모든 그룹에 대해 올바르게 분류된 비율입니다. 이 값은 올바르게 배치된 관측치 수(N 정분류)를 총 관측치 수(N)로 나눈 값입니다.

그룹 간 거리 제곱

한 그룹 중심(평균)에서 다른 그룹 중심(평균)까지의 거리 제곱입니다. 어느 그룹의 중심(평균)에 대한 관측 개체의 거리 제곱(Mahalanobis 거리라고도 함)이 최소인 경우 관측 개체는 해당 그룹으로 분류됩니다.

참고

2차 함수를 사용하는 경우 Minitab에서는 일반화 거리 제곱 표를 표시합니다. 각 함수의 거리 제곱 계산 방식에 대한 자세한 내용은 판별 분석에 대한 거리 및 판별 함수에서 확인하십시오.

해석

거리 값은 그 자체로는 별로 유용하지 않지만 거리를 비교하여 그룹의 서로 다른 정도를 알아볼 수 있습니다. 예를 들어, 다음 결과는 그룹 1과 그룹 3 간의 거리가 가장 크다는 것을 나타냅니다(48.0911). 그룹 1과 그룹 2 간의 차이는 12.9853이고 그룹 2와 그룹 3 간의 차이는 11.3197입니다.

그룹 간 거리 제곱

123
10.000012.985348.0911
212.98530.000011.3197
348.091111.31970.0000

그룹에 대한 선형 판별 함수

그룹에 대한 선형 판별 함수는 각 그룹과 연관된 선형 방정식을 나타냅니다. 각 그룹의 선형 판별 점수는 다중 회귀 분석의 회귀 계수에 해당합니다.

해석

선형 판별 함수를 사용하면 예측 변수가 그룹 간에 어떻게 구별되는지 확인할 수 있습니다. 예를 들어, 세 그룹이 있는 경우 Minitab은 다음과 같은 그룹을 판별하는 함수를 추정합니다.
  • 그룹 1과 그룹 2 및 3
  • 그룹 2와 그룹 1 및 3
  • 그룹 3와 그룹 1 및 2

가장 큰 선형 판별 함수나 회귀 계수를 가진 그룹이 관측 개체의 분류에 가장 큰 기여를 합니다. 예를 들어, 다음 결과에서 그룹 1의 선형 판별 함수가 가장 크며(17.4), 이는 그룹 1에 대한 시험 점수가 그룹 2나 그룹 3의 시험 점수보다 소속 그룹의 분류에 더 기여한다는 것을 나타냅니다. 그룹 3의 심리 검사에 대한 선형 판별 함수가 가장 크고, 이는 그룹 3의 심리 검사 점수가 그룹 1 또는 그룹 2의 심리 검사 점수보다 소속 그룹의 분류에 더 기여한다는 것을 나타냅니다.

그룹에 대한 선형 판별 함수

123
상수-9707.5-9269.0-8921.1
시험 점수17.417.016.7
동기-3.2-3.7-4.3

합동 평균

합동 평균은 각 참 그룹 평균의 가중 평균입니다. 합동 평균을 표시하려면 옵션을 클릭하고 위의 내용 이외에 평균, 표준 편차 및 공분산 요약을 선택해야 합니다.

해석

합동 평균을 사용하면 데이터 내 모든 관측치의 중심을 설명할 수 있습니다. 예를 들어, 다음 결과에서 모든 그룹에 대한 전체 시험 점수의 평균은 1102.1입니다.

그룹 평균



그룹 평균
변수합동 평균123
시험 점수1102.11127.41100.61078.3
동기47.05653.60047.41740.150

그룹 평균

각 참 그룹에 있는 값의 합을 각 참 그룹의 비결측값 수로 나눈 값입니다. 그룹 평균을 표시하려면 분석을 수행할 때 옵션을 클릭하고 위의 내용 이외에 평균, 표준 편차 및 공분산 요약을 선택해야 합니다.

해석

그룹 평균을 사용하면 데이터의 중심을 나타내는 하나의 값으로 각 참 그룹을 설명할 수 있습니다. 예를 들어, 다음 결과에서 그룹 1의 평균 시험 점수가 가장 높고(1127.4) 그룹 3의 평균 시험 점수가 가장 낮습니다(1078.3). 그룹 2의 평균 시험 점수는 중간입니다(1100.6).

그룹 평균



그룹 평균
변수합동 평균123
시험 점수1102.11127.41100.61078.3
동기47.05653.60047.41740.150

합동 표준 편차

합동 표준 편차는 각 참 그룹의 표준 편차의 가중 평균입니다. 합동 표준 편차를 표시하려면 분석을 수행할 때 옵션을 클릭하고 위의 내용 이외에 평균, 표준 편차 및 공분산 요약을 선택해야 합니다.

해석

합동 표준 편차를 사용하면 개별 데이터 점이 참 그룹 평균을 중심으로 퍼져 있는 정도를 확인할 수 있습니다. 예를 들어, 다음 결과에서 모든 그룹에 대한 시험 점수의 합동 표준 편차는 8.109입니다.

그룹 표준 편차



그룹에 대한 표준 편차
변수합동 표준 편차123
시험 점수8.1098.3089.2666.511
동기2.9942.4093.2433.251

그룹의 표준 편차

산포, 즉 데이터가 평균을 중심으로 퍼져 있는 정도를 나타내는 가장 일반적인 측도입니다. 그룹의 표준 편차는 각 참 그룹의 표준 편차입니다. 그룹의 표준 편차를 표시하려면 분석을 수행할 때 옵션을 클릭하고 위의 내용 이외에 평균, 표준 편차 및 공분산 요약을 선택해야 합니다.

해석

그룹의 표준 편차를 사용하면 각 참 그룹에서 데이터가 평균을 중심으로 퍼져 있는 정도를 확인할 수 있습니다. 예를 들어, 다음 결과에서 그룹 2에 대한 시험 점수의 표준 편차가 가장 높습니다(9.266). 이것은 그룹 2에 대한 시험 점수의 변동성이 세 그룹 중에서 가장 크다는 것을 나타냅니다. 그룹 3의 표준 편차가 가장 낮고(6.511) 세 그룹 중에서 시험 점수의 변동성이 가장 작습니다.

그룹 표준 편차



그룹에 대한 표준 편차
변수합동 표준 편차123
시험 점수8.1098.3089.2666.511
동기2.9942.4093.2433.251

합동 공분산 행렬

모든 그룹에 있는 모든 관측 개체 간의 관계에 대한 가중 행렬. 합동 공분산 행렬은 개별 그룹의 공분산 행렬 요소별 평균으로 계산됩니다.

합동 공분산 행렬을 표시하려면 분석을 수행할 때 옵션을 클릭하고 위의 내용 이외에 평균, 표준 편차 및 공분산 요약을 선택해야 합니다.

공분산 행렬

각 변수 쌍 사이의 관계를 나타내는 비표준화된 행렬. 공분산은 공분산을 두 변수의 표준 편차들을 곱한 값으로 나누어 계산되는 상관 계수와 비슷합니다.

각 그룹에 대한 공분산 행렬을 표시하려면 분석을 수행할 때 옵션을 클릭하고 위의 내용 이외에 평균, 표준 편차 및 공분산 요약을 선택해야 합니다.

관측치

각 관측치의 관측치 번호. 관측치 번호는 Minitab 워크시트에서 분류된 관측 개체 행에 해당합니다. Minitab에서는 관측치가 잘못 분류된 경우(즉, 실제 그룹이 예측 그룹과 다른 경우) 관측치 번호 뒤에 ** 기호가 표시됩니다.

데이터 집합의 모든 관측치에 대한 예측 그룹과 참 그룹을 확인하려면 분석을 수행할 때 옵션을 클릭하고 위의 내용 이외에 전체 분류 요약을 선택해야 합니다.

예측 그룹

각 관측치에 대한 예측 그룹은 Minitab에서 예측 거리 제곱을 기반으로 관측치에 할당하는 소속 그룹입니다. 데이터 집합의 각 관측치에 대한 예측 그룹과 참 그룹을 확인하려면 분석을 수행할 때 옵션을 클릭한 다음 위의 내용 이외에 전체 분류 요약을 선택해야 합니다.

해석

관측치가 올바르게 분류되었는지 여부를 확인하려면 각 관측치에 대한 예측 그룹과 참 그룹을 비교합니다. 예측 그룹이 참 그룹과 다르면 관측치가 잘못 분류된 것입니다.

교차 검증 그룹

교차 검증(X-val)을 사용하여 예측된 그룹은 Minitab에서 교차 검증을 사용한 예측 거리 제곱을 기반으로 관측치에 할당하는 소속 그룹입니다. 각 관측치에 대해 교차 검증을 사용하여 예측된 그룹을 확인하려면 분석을 수행할 때 주 대화 상자에서 교차 검증 사용을 선택한 다음 옵션을 클릭하고 위의 내용 이외에 전체 분류 요약을 선택해야 합니다.

해석

관측치가 올바르게 분류되었는지 여부를 확인하려면 교차 검증을 사용하여 예측된 그룹과 각 관측치에 대한 참 그룹을 비교하십시오. 교차 검증을 사용하여 예측된 그룹이 참 그룹과 다르면 관측치가 잘못 분류된 것입니다.

중요

교차 검증을 사용하여 예측된 그룹은 판별 규칙을 생성하기 위해 관측치를 제외한 다음 해당 특정 관측치에 대해 규칙이 얼마나 잘 작동하는지 확인합니다. 교차 검증을 사용하지 않으면 규칙을 생성하기 위해 해당 관측치를 사용하여 판별 규칙을 치우치게 만듭니다.

거리 제곱

각 그룹의 각 관측치에 대한 예측 거리 제곱 값입니다. 거리 제곱 값은 관측치가 각 그룹 평균으로부터 떨어져 있는 정도를 나타냅니다. 데이터의 각 관측치에 대한 거리 제곱을 확인하려면 분석을 수행할 때 옵션을 클릭하고 위의 내용 이외에 전체 분류 요약을 선택해야 합니다.

참고

분석을 수행할 때 교차 검증을 사용하는 경우 Minitab에서는 교차 검증을 사용하거나(X-val) 교차 검증을 사용하지 않고(Pred) 각 관측치에 대한 예측 거리 제곱을 계산합니다. 제곱 거리 계산 방식에 대한 자세한 내용은 판별 분석에 대한 거리 및 판별 함수에서 확인하십시오.