카이-제곱 연관성 검정에 대한 모든 통계량 해석

연관성에 대한 카이-제곱 검정과 함께 제공되는 모든 통계량에 대한 정의 및 해석 방법을 확인해 보십시오.

관측 카운트 및 기대 카운트

관측 카운트는 표본에서 한 범주에 속하는 관측치의 실제 수입니다.

기대 카운트는 변수가 서로 독립적인 경우 하나의 셀에서 평균적으로 기대되는 빈도입니다. Minitab에서는 기대 카운트를 행과 열 합계의 곱을 총 관측치 수로 나눈 값으로 계산합니다.

해석

출력표의 각 셀에 대해 관측값과 기대값을 비교할 수 있습니다. 이 결과에서 관측된 셀 카운트는 각 셀의 첫 번째 숫자이고, 기대 카운트는 각 셀의 두 번째 숫자입니다.

두 변수가 연관되어 있으면 한 변수에 대한 관측치 분포가 두 번째 변수의 범주에 따라 달라집니다. 두 변수가 독립적이면 한 변수에 대한 관측치 분포가 두 번째 변수의 모든 범주에서 비슷합니다. 이 예에서 표의 1열, 2행의 관측 카운트는 76이고 기대 카운트는 60.78입니다. 변수가 서로 종속된 경우 관측 카운트가 기대보다 훨씬 더 큰 것으로 보입니다.

행: 기계 ID   열: 워크시트 열

1번째 교대조2번째 교대조3번째 교대조모두
         
1484748143
  56.0846.9739.96 
  -1.07880.00501.2726 
         
2764732155
  60.7850.9143.31 
  1.9516-0.5476-1.7184 
         
3364034110
  43.1436.1330.74 
  -1.08670.64430.5889 
         
모두160134114408
셀 내용
      카운트
      기대 카운트
      표준화 잔차

모든 행 및 열 카운트

Minitab에서는 행과 열에 대한 주변 카운트를 표시합니다.
행 카운트
각 표 행에 걸친 카운트의 합.
열 카운트
각 표 열 아래 카운트의 합.
합계
모든 셀에 대한 카운트의 합. 모든 행 카운트의 합은 모든 열 카운트의 합과 같습니다.

해석

카운트가 범주 간에 어떻게 분산되는지 확인하려면 주변 카운트를 사용하십시오.

이 결과에서 1행에 대한 합계는 143, 2행에 대한 합계는 155, 3행에 대한 합계는 110입니다. 모든 행의 합은 408입니다. 1열에 대한 합계는 160, 2열에 대한 합계는 134, 3열에 대한 합계는 114입니다. 모든 열의 합은 408입니다.

행: 기계 ID   열: 워크시트 열

1번째 교대조2번째 교대조3번째 교대조모두
         
1484748143
  56.0846.9739.96 
  -1.07880.00501.2726 
         
2764732155
  60.7850.9143.31 
  1.9516-0.5476-1.7184 
         
3364034110
  43.1436.1330.74 
  -1.08670.64430.5889 
         
모두160134114408
셀 내용
      카운트
      기대 카운트
      표준화 잔차

카이-제곱에 대한 기여

Minitab에서는 전체 카이-제곱 통계량 중에서 각 셀의 범주로 인한 비율을 양적으로 나타내는, 각 셀의 카이-제곱 통계량에 대한 기여도를 표시합니다.

Minitab에서는 각 셀의 카이-제곱 통계량에 대한 기여도를 해당 셀의 관측값과 기대값의 차이 제곱을 해당 셀의 기대값으로 나누어서 계산합니다. 카이-제곱 통계량은 이 값들의 모든 셀에 대한 합입니다.

해석

이 결과에서 각 셀의 카이-제곱 합은 Pearson 카이-제곱 통계량 11.788입니다. 기계 2의 첫 번째와 세 번째 교대조의 기여도가 가장 큽니다. 기계 1과 2의 두 번째 교대조의 기여도가 가장 작습니다.

행: 기계 ID   열: 워크시트 열

1번째 교대조2번째 교대조3번째 교대조모두
         
1484748143
  56.0846.9739.96 
  1.16370.00001.6195 
         
2764732155
  60.7850.9143.31 
  3.80880.29982.9530 
         
3364034110
  43.1436.1330.74 
  1.18090.41510.3468 
         
모두160134114408
셀 내용
      카운트
      기대 카운트
      카이-제곱에 대한 기여도

카이-제곱 검정

카이-제곱DFP-값
Pearson11.78840.019
우도 비11.81640.019

Pearson 카이-제곱 및 우도 비 카이-제곱 검정

Minitab에서는 Pearson 카이-제곱 검정과 우도 비 카이-제곱 검정을 수행합니다. 각 카이-제곱 검정은 변수가 서로 연관(종속)되어 있는지 확인하기 위해 사용할 수 있습니다.
Pearson 카이-제곱 검정

Pearson 카이-제곱 통계량(χ2)은 관측된 빈도와 기대 빈도 사이의 차이 제곱을 포함합니다.

우도 비 카이-제곱 검정

우도 비 카이-제곱 통계량(G2)은 기대 빈도에 대한 관측 빈도의 비율을 기반으로 합니다.

해석

변수가 서로 연관되어 있는지 여부를 검정하려면 카이-제곱 통계량을 사용하십시오.

이 결과에서는 두 카이-제곱 통계량이 모두 매우 유사합니다. 카이-제곱 통계량의 유의성을 평가하려면 p-값을 사용하십시오.

카이-제곱 검정

카이-제곱DFP-값
Pearson11.78840.019
우도 비11.81640.019

기대 카운트가 작은 경우 잘못된 결과를 얻을 수도 있습니다. 자세한 내용은 카이-제곱 연관성 검정에 대한 데이터 고려 사항에서 확인하십시오.

DF

자유도(DF)는 한 통계량에 대한 독립적인 정보의 수입니다. 표의 자유도는 (행 수 – 1) x (열 수 – 1)입니다.

해석

Minitab에서는 검정 통계량과 연관된 p-값을 계산하기 위해 자유도를 사용합니다.

이 결과에서 자유도(DF)는 4입니다.

카이-제곱 검정

카이-제곱DFP-값
Pearson11.78840.019
우도 비11.81640.019

p-값

p-값은 귀무 가설에 반하는 증거를 측정하는 확률입니다. p-값이 작을수록 귀무 가설에 반하는 더 강력한 증거가 됩니다.

두 범주형 변수 간에 연관성이 존재하지 않는다는 귀무 가설을 기각할 수 있는지, 기각할 수 없는지 확인하려면 p-값을 사용합니다.

Minitab에서는 카이-제곱 통계량을 사용하여 p-값을 결정합니다.

참고

Minitab에서는 기대 카운트가 1보다 작을 경우 결과가 유효하지 않을 수 있기 때문에 p-값을 표시하지 않습니다.

해석

변수가 서로 독립적인지 여부를 확인하려면 p-값을 유의 수준과 비교하십시오. 일반적으로 0.05의 유의 수준(α 또는 알파로 표시함)이 적절합니다. 0.05의 유의 수준은 변수 간에 실제로 연관성이 없는데 연관성이 존재한다는 결론을 내릴 위험이 5%라는 것을 나타냅니다.
p-값 ≤ α: 변수 간에 통계적으로 유의한 연관성이 있습니다(H0 기각)
p-값이 유의 수준보다 작거나 같으면 귀무 가설을 기각하고 변수 간에 통계적으로 유의한 연관성이 있다는 결론을 내립니다.
p-값 > α: 변수가 서로 연관되어 있다는 결론을 내릴 수 없습니다(H0 기각 실패)
p-값이 유의 수준보다 크면 변수가 서로 연관되어 있다는 결론을 내릴 수 있는 충분한 증거가 없기 때문에 귀무 가설을 기각할 수 없습니다.

이 결과에서 p-값은 0.019입니다. p-값이 α보다 작기 때문에 귀무 가설을 기각합니다. 변수가 서로 연관되어 있다는 결론을 내릴 수 있습니다.

카이-제곱 검정

카이-제곱DFP-값
Pearson11.78840.019
우도 비11.81640.019

원시 잔차

원시 잔차는 관측 카운트와 기대 카운트 간의 차이입니다.
관측 카운트
관측 카운트는 표본에서 한 범주에 속하는 관측치의 실제 수입니다.
기대 카운트

기대 카운트는 변수가 서로 독립적인 경우 하나의 셀에서 평균적으로 기대되는 빈도입니다. Minitab에서는 기대 카운트를 행과 열 합계의 곱을 총 관측치 수로 나눈 값으로 계산합니다.

해석

출력표의 각 관측값과 기대값을 비교할 수 있습니다.

이 결과에서 셀 카운트는 각 셀의 첫 번째 숫자이고, 기대 카운트는 각 셀의 두 번째 숫자이며, 원시 잔차는 각 셀의 세 번째 숫자입니다. 기계 2, 첫 번째 교대조의 원시 잔차가 가장 크며, 이는 첫 번째 교대조가 작업하는 동안 기계 2에서 기대 결점 수와 실제 결점 수 간의 차이가 가장 크다는 것을 의미합니다.

행: 기계 ID   열: 워크시트 열

1번째 교대조2번째 교대조3번째 교대조모두
         
1484748143
  56.0846.9739.96 
  -8.0780.0348.044 
         
2764732155
  60.7850.9143.31 
  15.216-3.907-11.309 
         
3364034110
  43.1436.1330.74 
  -7.1373.8733.265 
         
모두160134114408
셀 내용
      카운트
      기대 카운트
      잔차
관측 카운트와 기대 카운트를 비교하는 더 좋은 방법은 표준화 잔차를 이용하는 것입니다.

표준화 잔차

표준화 잔차는 원시 잔차(또는 관측 카운트와 기대 카운트 간의 차이)를 기대 카운트의 제곱근으로 나눈 값입니다.

해석

출력표의 표준화 잔차를 비교하여 어느 변수 범주가 표본 크기에 비해 기대 카운트와 실제 카운트 간의 차이가 가장 크고 서로 종속된 것으로 보이는지 확인할 수 있습니다. 예를 들어, 출력표의 표준화 잔차를 평가하여 불량품을 생산하는 기계와 교대조 간의 연관성을 확인할 수 있습니다.

이 결과에서 셀 카운트는 각 셀의 첫 번째 숫자이고, 기대 카운트는 각 셀의 두 번째 숫자이며, 표준화 잔차는 각 셀의 세 번째 숫자입니다. 양의 표준화 잔차는 기대된 것보다 불량 손잡이가 많다는 것을 나타냅니다. 음의 표준화 잔차는 기대된 것보다 불량 손잡이가 적다는 것을 나타냅니다.

행: 기계 ID   열: 워크시트 열

1번째 교대조2번째 교대조3번째 교대조모두
         
1484748143
  56.0846.9739.96 
  -1.07880.00501.2726 
         
2764732155
  60.7850.9143.31 
  1.9516-0.5476-1.7184 
         
3364034110
  43.1436.1330.74 
  -1.08670.64430.5889 
         
모두160134114408
셀 내용
      카운트
      기대 카운트
      표준화 잔차

수정 잔차

수정 잔차는 원시 잔차(또는 관측 카운트와 기대 카운트 간의 차이)를 표준 오차의 추정치로 나눈 값입니다. 표본 크기로 인한 변동을 설명하려면 수정된 잔차를 사용하십시오.

해석

출력표의 수정 잔차를 비교하여 어느 범주가 표본 크기에 비해 기대 카운트와 실제 카운트 간의 차이가 가장 큰지 확인할 수 있습니다. 예를 들어, 어느 기계 또는 교대조의 기대 불량품 수와 실제 불량품 수 간의 차이가 가장 큰지 확인할 수 있습니다.

이 결과에서 셀 카운트는 각 셀의 첫 번째 숫자이고, 기대 카운트는 각 셀의 두 번째 숫자이며, 수정 잔차는 각 셀의 세 번째 숫자입니다. 양의 수정 잔차는 표본 크기에 대해 조정된, 기대된 것보다 불량 손잡이가 많다는 것을 나타냅니다. 음의 수정 잔차는 표본 크기에 대해 조정된, 기대된 것보다 불량 손잡이가 적다는 것을 나타냅니다.

행: 기계 ID   열: 워크시트 열

1번째 교대조2번째 교대조3번째 교대조모두
         
1484748143
  56.0846.9739.96 
  -1.71690.00761.8602 
         
2764732155
  60.7850.9143.31 
  3.1788-0.8485-2.5707 
         
3364034110
  43.1436.1330.74 
  -1.63090.91990.8117 
         
모두160134114408
셀 내용
      카운트
      기대 카운트
      수정 잔차