포아송에 대한 적합도 검정에 대한 모든 통계량 및 그래프 해석

포아송에 대한 적합도 검정과 함께 제공되는 모든 통계 및 그래프에 대한 정의 및 해석 방법을 확인해 보십시오.

평균

포아송 평균은 각 범주의 합에 해당 범주에서 관측된 값의 수를 곱한 다음 총 관측치 수로 나눈 값입니다.

N

표본에 있는 비결측값의 개수입니다.

이 예에서는 141개의 관측치가 기록되었습니다.
전체 카운트 N N*
149 141 8

N*

표본에 있는 결측값의 개수입니다. 결측값 개수는 결측값 기호 *가 있는 셀을 가리킵니다.

이 예에서는 데이터를 수집하는 동안 8개의 오류가 발생하여 결측치로 기록되었습니다.
전체 카운트 N N*
149 141 8

포아송 확률

데이터가 평균이 데이터로부터 계산된 포아송 평균과 같은 포아송 분포를 따른다는 가정에서 각 범주의 확률. Minitab에서는 포아송 확률을 사용하여 기대값을 계산합니다.

관측값 및 기대값

관측값은 표본에서 한 범주에 속하는 관측치의 실제 수입니다.

기대값은 포아송 확률이 참일 경우 기대되는 관측치의 수입니다. Minitab에서는 각 범주의 포아송 확률에 총 표본 크기를 곱하여 기대 계수를 계산합니다.

특정 범주에 대한 기대 카운트(기대 빈도라고도 함)가 5보다 작으면 검정의 결과가 유효하지 않을 수도 있습니다. 한 범주에 대한 기대 카운트가 너무 작으면 해당 범주를 인접 범주와 결합하여 최소 기대 카운트를 얻지 못할 수도 있습니다.

예를 들어, 한 재무 부서는 송장의 지불 기한이 경과한 일 수를 15일 이하, 16–30일, 31–45일, 46–60일, 60일 이상 등 다섯 개의 범주로 분류합니다. 60일 이상 범주의 기대 카운트가 낮기 때문에 이 재무 부서는 이 범주를 46–60일 범주와 결합하여 45일 이상의 결합 범주로 만듭니다.

해석

출력표나 막대 차트를 사용하여 관측값과 기대값을 비교할 수 있습니다. 관측값과 기대값 간의 차이가 크면 데이터가 포아송 분포를 따르지 않는다는 것을 나타냅니다.

이 결과에서는 대부분의 범주에 대해 기대 개수가 관측 개수에 아주 가까운 것으로 보이지 않습니다.

방법

빈도(관측)

기술 통계량

N평균
3000.536667

결점에 대한 관측 및 기대 카운트

결점포아송 확률관측 개수기대 카운트카이-제곱에
대한 기여도
00.584694213175.4088.056
10.3137864194.13629.993
20.0841991825.2602.086
>=30.017321285.196100.072

카이-제곱 검정

귀무 가설H₀: 데이터가 포아송 분포를 따름
대립 가설H₁: 데이터가 포아송 분포를 따르지 않음
DF카이-제곱P-값
2140.2080.000

카이-제곱에 대한 기여도

전체 카이-제곱 통계량 중에서 각 범주의 차이로 인한 비율을 양적으로 나타내려면 개별 범주 기여도를 사용합니다.

Minitab에서는 해당 범주의 관측값과 기대값 간의 차이 제곱을 해당 범주의 기대값으로 나누어 각 범주의 카이-제곱 통계량에 대한 기여도를 계산합니다. 카이-제곱 통계량은 이 값들의 모든 범주에 대한 합입니다.

해석

범주의 관측값과 기대값 간의 차이가 클수록 전체 카이-제곱 통계량에 대한 기여도가 더 큽니다.

방법

빈도(관측)

기술 통계량

N평균
3000.536667

결점에 대한 관측 및 기대 카운트

결점포아송 확률관측 개수기대 카운트카이-제곱에
대한 기여도
00.584694213175.4088.056
10.3137864194.13629.993
20.0841991825.2602.086
>=30.017321285.196100.072

카이-제곱 검정

귀무 가설H₀: 데이터가 포아송 분포를 따름
대립 가설H₁: 데이터가 포아송 분포를 따르지 않음
DF카이-제곱P-값
2140.2080.000

이 결과에서 각 범주의 카이-제곱 값을 합하면 전체 카이-제곱 통계량 140.208이 됩니다. 결점 수가 3개 이상인 범주의 기여도가 가장 큽니다. 이 결과는 결점 수가 3개 이상인 범주에서 관측 개수와 기대 개수 간의 차이가 가장 크다는 것을 보여줍니다. 결점 수가 2개인 범주에서 관측 개수와 기대 개수 간의 차이가 가장 작습니다.

귀무 가설과 대립 가설

귀무 가설과 대립 가설은 모집단에 대한 서로 배타적인 두 서술문입니다. 가설 검정은 표본 데이터를 사용하여 귀무 가설의 기각 여부를 확인합니다.
귀무 가설
귀무 가설은 모집단이 특정 분포를 따른다는 것입니다. 귀무 가설은 종종 이전 분석 또는 전문 지식을 기반으로 한 초기 주장입니다.
대립 가설
대립 가설은 모집단이 특정 분포를 따르지 않는다는 것입니다.

DF

자유도(DF)는 한 통계량에 대한 독립적인 정보의 수입니다. 포아송에 대한 적합도 검정의 자유도는 범주의 수 – 2입니다.

해석

Minitab에서는 검정 통계량을 계산하기 위해 자유도를 사용합니다. 연구에 범주가 많을수록 자유도가 높습니다.

카이-제곱

카이-제곱 통계량은 표본 데이터의 분포와 기대된 포아송 분포 간의 차이를 측정하는 검정 통계량입니다.

해석

카이-제곱 통계량을 사용하여 귀무 가설의 기각 여부를 확인할 수 있습니다. 그러나 p-값이 해석하기 더 쉽기 때문에 더 자주 사용됩니다. p-값은 데이터가 포아송 분포를 따르는 경우 최소한 표본에서 계산된 값만큼 극단적인 검정 통계량(예: 카이-제곱 통계량)을 얻을 확률입니다.

귀무 가설의 기각 여부를 확인하려면 카이-제곱 통계량을 임계값과 비교하십시오. 카이-제곱 통계량이 임계값보다 크면 귀무 가설을 기각합니다. 그렇지 않으면 귀무 가설을 기각할 수 없습니다. Minitab에서 임계값을 계산하거나 대부분의 통계 서적에 있는 카이-제곱 분포 표에서 임계값을 찾을 수 있습니다. 자세한 내용을 확인하려면 역 누적분포함수(ICDF) 사용으로 이동하여 "ICDF를 사용하여 임계값 계산"을 클릭하십시오.

Minitab에서는 카이-제곱 통계량을 사용하여 p-값을 계산합니다.

p-값

p-값은 귀무 가설에 반하는 증거를 측정하는 확률입니다. p-값이 작을수록 귀무 가설에 반하는 더 강력한 증거가 됩니다.

해석

데이터가 포아송 분포를 따르지 않는지 여부를 확인하려면 p-값을 사용하십시오.

데이터가 포아송 분포를 따르지 않는지 여부를 확인하려면 p-값을 유의 수준(α)과 비교하십시오. 일반적으로 0.05의 유의 수준(α 또는 알파로 표시함)이 적절합니다. 0.05의 유의 수준은 데이터가 포아송 분포를 따르는데 포아송 분포를 따르지 않는다는 결론을 내릴 위험이 5%라는 것을 나타냅니다.
p-값 ≤ α: 데이터가 포아송 분포를 따르지 않음(H0 기각)
p-값이 유의 수준보다 작거나 같으면 귀무 가설을 기각하고 데이터가 포아송 분포를 따르지 않는다는 결론을 내립니다.
p-값 > α: 데이터가 포아송 분포를 따르지 않는다는 결론을 내릴 수 없음(H0 기각 실패)
p-값이 유의 수준보다 크면 데이터가 포아송 분포를 따르지 않는다는 결론을 내릴 충분한 증거가 없기 때문에 귀무 가설을 기각할 수 없습니다.

범주별 카이-제곱 값 기여도에 대한 차트

이 막대 차트는 각 범주의 전체 카이-제곱 통계량에 대한 기여도를 표시합니다. 기여도 기준으로 기여도가 가장 큰 범주에서 기여도가 가장 작은 범주의 순으로 정렬하는 차트를 선택할 수 있습니다.

해석

범주의 관측값과 기대값 간의 차이가 클수록 전체 카이-제곱 통계량에 대한 기여도가 더 큽니다.

이 막대 차트는 결점 수가 3개 이상인 범주에서 기대값과 관측값 간의 차이가 가장 크다는 것을 보여줍니다.

관측값과 기대값에 대한 차트

각 범주에 대해 관측값의 수가 기대값의 수와 다른지 여부를 확인하려면 관측값과 기대값에 대한 차트를 사용합니다. 관측값과 기대값 간의 차이가 크면 데이터가 포아송 분포를 따르지 않는다는 것을 나타냅니다.

이 막대 차트는 결점 0개, 결점 1개 및 결점 4개 이상에 대한 관측값이 기대값과 다르다는 것을 보여줍니다. 따라서 막대 차트에서 p-값이 나타내는 것, 즉 데이터가 포아송 분포를 따르지 않는다는 것을 시각적으로 확인할 수 있습니다.