포아송 평균은 각 범주의 합에 해당 범주에서 관측된 값의 수를 곱한 다음 총 관측치 수로 나눈 값입니다.
표본에 있는 비결측값의 개수입니다.
전체 카운트 | N | N* |
---|---|---|
149 | 141 | 8 |
표본에 있는 결측값의 개수입니다. 결측값 개수는 결측값 기호 *가 있는 셀을 가리킵니다.
전체 카운트 | N | N* |
---|---|---|
149 | 141 | 8 |
데이터가 평균이 데이터로부터 계산된 포아송 평균과 같은 포아송 분포를 따른다는 가정에서 각 범주의 확률. Minitab에서는 포아송 확률을 사용하여 기대값을 계산합니다.
관측값은 표본에서 한 범주에 속하는 관측치의 실제 수입니다.
기대값은 포아송 확률이 참일 경우 기대되는 관측치의 수입니다. Minitab에서는 각 범주의 포아송 확률에 총 표본 크기를 곱하여 기대 계수를 계산합니다.
특정 범주에 대한 기대 카운트(기대 빈도라고도 함)가 5보다 작으면 검정의 결과가 유효하지 않을 수도 있습니다. 한 범주에 대한 기대 카운트가 너무 작으면 해당 범주를 인접 범주와 결합하여 최소 기대 카운트를 얻지 못할 수도 있습니다.
예를 들어, 한 재무 부서는 송장의 지불 기한이 경과한 일 수를 15일 이하, 16–30일, 31–45일, 46–60일, 60일 이상 등 다섯 개의 범주로 분류합니다. 60일 이상 범주의 기대 카운트가 낮기 때문에 이 재무 부서는 이 범주를 46–60일 범주와 결합하여 45일 이상의 결합 범주로 만듭니다.
출력표나 막대 차트를 사용하여 관측값과 기대값을 비교할 수 있습니다. 관측값과 기대값 간의 차이가 크면 데이터가 포아송 분포를 따르지 않는다는 것을 나타냅니다.
빈도(관측) |
---|
N | 평균 |
---|---|
300 | 0.536667 |
결점 | 포아송 확률 | 관측 개수 | 기대 카운트 | 카이-제곱에 대한 기여도 |
---|---|---|---|---|
0 | 0.584694 | 213 | 175.408 | 8.056 |
1 | 0.313786 | 41 | 94.136 | 29.993 |
2 | 0.084199 | 18 | 25.260 | 2.086 |
>=3 | 0.017321 | 28 | 5.196 | 100.072 |
귀무 가설 | H₀: 데이터가 포아송 분포를 따름 |
---|---|
대립 가설 | H₁: 데이터가 포아송 분포를 따르지 않음 |
DF | 카이-제곱 | P-값 |
---|---|---|
2 | 140.208 | 0.000 |
전체 카이-제곱 통계량 중에서 각 범주의 차이로 인한 비율을 양적으로 나타내려면 개별 범주 기여도를 사용합니다.
Minitab에서는 해당 범주의 관측값과 기대값 간의 차이 제곱을 해당 범주의 기대값으로 나누어 각 범주의 카이-제곱 통계량에 대한 기여도를 계산합니다. 카이-제곱 통계량은 이 값들의 모든 범주에 대한 합입니다.
범주의 관측값과 기대값 간의 차이가 클수록 전체 카이-제곱 통계량에 대한 기여도가 더 큽니다.
빈도(관측) |
---|
N | 평균 |
---|---|
300 | 0.536667 |
결점 | 포아송 확률 | 관측 개수 | 기대 카운트 | 카이-제곱에 대한 기여도 |
---|---|---|---|---|
0 | 0.584694 | 213 | 175.408 | 8.056 |
1 | 0.313786 | 41 | 94.136 | 29.993 |
2 | 0.084199 | 18 | 25.260 | 2.086 |
>=3 | 0.017321 | 28 | 5.196 | 100.072 |
귀무 가설 | H₀: 데이터가 포아송 분포를 따름 |
---|---|
대립 가설 | H₁: 데이터가 포아송 분포를 따르지 않음 |
DF | 카이-제곱 | P-값 |
---|---|---|
2 | 140.208 | 0.000 |
이 결과에서 각 범주의 카이-제곱 값을 합하면 전체 카이-제곱 통계량 140.208이 됩니다. 결점 수가 3개 이상인 범주의 기여도가 가장 큽니다. 이 결과는 결점 수가 3개 이상인 범주에서 관측 개수와 기대 개수 간의 차이가 가장 크다는 것을 보여줍니다. 결점 수가 2개인 범주에서 관측 개수와 기대 개수 간의 차이가 가장 작습니다.
자유도(DF)는 한 통계량에 대한 독립적인 정보의 수입니다. 포아송에 대한 적합도 검정의 자유도는 범주의 수 – 2입니다.
Minitab에서는 검정 통계량을 계산하기 위해 자유도를 사용합니다. 연구에 범주가 많을수록 자유도가 높습니다.
카이-제곱 통계량은 표본 데이터의 분포와 기대된 포아송 분포 간의 차이를 측정하는 검정 통계량입니다.
카이-제곱 통계량을 사용하여 귀무 가설의 기각 여부를 확인할 수 있습니다. 그러나 p-값이 해석하기 더 쉽기 때문에 더 자주 사용됩니다. p-값은 데이터가 포아송 분포를 따르는 경우 최소한 표본에서 계산된 값만큼 극단적인 검정 통계량(예: 카이-제곱 통계량)을 얻을 확률입니다.
귀무 가설의 기각 여부를 확인하려면 카이-제곱 통계량을 임계값과 비교하십시오. 카이-제곱 통계량이 임계값보다 크면 귀무 가설을 기각합니다. 그렇지 않으면 귀무 가설을 기각할 수 없습니다. Minitab에서 임계값을 계산하거나 대부분의 통계 서적에 있는 카이-제곱 분포 표에서 임계값을 찾을 수 있습니다. 자세한 내용을 확인하려면 역 누적분포함수(ICDF) 사용으로 이동하여 "ICDF를 사용하여 임계값 계산"을 클릭하십시오.
Minitab에서는 카이-제곱 통계량을 사용하여 p-값을 계산합니다.
p-값은 귀무 가설에 반하는 증거를 측정하는 확률입니다. p-값이 작을수록 귀무 가설에 반하는 더 강력한 증거가 됩니다.
데이터가 포아송 분포를 따르지 않는지 여부를 확인하려면 p-값을 사용하십시오.
이 막대 차트는 각 범주의 전체 카이-제곱 통계량에 대한 기여도를 표시합니다. 기여도 기준으로 기여도가 가장 큰 범주에서 기여도가 가장 작은 범주의 순으로 정렬하는 차트를 선택할 수 있습니다.
범주의 관측값과 기대값 간의 차이가 클수록 전체 카이-제곱 통계량에 대한 기여도가 더 큽니다.
각 범주에 대해 관측값의 수가 기대값의 수와 다른지 여부를 확인하려면 관측값과 기대값에 대한 차트를 사용합니다. 관측값과 기대값 간의 차이가 크면 데이터가 포아송 분포를 따르지 않는다는 것을 나타냅니다.