2-표본 평균에 대한 랜덤화 검정에 대한 랜덤화 검정 통계량 및 그래프

2-표본 평균에 대한 랜덤화 검정과 함께 제공되는 모든 랜덤화 검정 통계량 및 그래프에 대한 정의 및 해석 방법을 확인해 보십시오.

히스토그램

히스토그램은 표본 값을 여러 구간으로 나누고 각 구간 내 데이터 값의 빈도를 막대로 나타냅니다.

해석

히스토그램을 사용하여 부트스트랩 분포 형상을 조사합니다. 부트스트랩 분포는 각 재표본에서 선택한 통계에 대한 분포입니다. 부트스트랩 분포는 정규 분포로 표시되어야 합니다. 부트스트랩 분포가 정규 분포가 아닐 경우 부트스트랩 결과를 신뢰할 수 없습니다.
50개의 재표본
1000개의 재표본

보통 분포는 재표본이 더 많을 때 확인하기 쉽습니다. 예를 들어, 이러한 데이터에서 분포는 50개의 재표본에 대해 여러 가지로 해석할 수 있습니다. 재표본이 1000개인 경우 형상은 거의 정규 분포에 가깝습니다.

히스토그램은 가설 검정의 결과를 시각적으로 보여줍니다. 랜덤화 표본은 모평균이 같을 때 임의의 표본의 모양을 나타내므로 히스토그램은 0을 중심으로 표시됩니다. 단측 검정의 경우 원래 표본의 평균의 차이에 기준선이 그려집니다. 양측 검정의 경우에는 원래 표본의 평균의 차이 및 0의 반대쪽 같은 거리에 기준선이 그려집니다. p-값은 기준선에서의 값보다 더 극단적인 표본 차이의 비율입니다. 다시 말해, p-값은 귀무 가설이 참이라고 가정할 때 원본 표본만큼 극단적인 표본 차이의 비율입니다. 이러한 차이는 히스토그램에서 빨간색으로 표시됩니다.

이 히스토그램에서 부트스트랩 분포는 정규 분포처럼 나타납니다. 어떤 표본 차이도 21보다 크거나 -21보다 작지 않습니다.

개별 값 그림

개별 값 그림은 표본 내 개별 값을 표시합니다. 각 원은 하나의 관측치를 나타냅니다. 개별 값 그림은 관측치 수가 비교적 적고 각 관측치의 영향도 평가해야 하는 경우 특히 유용합니다.

참고

Minitab은 재표본을 하나만 가져온 경우 개별 값 그림만 표시합니다. Minitab은 원래 데이터와 재표본 데이터를 모두 표시합니다.

해석

개별 값 그림을 사용하여 원래 표본과 랜덤화 표본을 비교합니다. 랜덤화 표본은 모평균이 같을 때 임의의 표본의 모양을 나타냅니다. 그러므로, 랜덤화 표본의 평균을 연결하는 선은 평평한 경향이 있습니다. 원래 표본의 평균의 차이를 랜덤화 표본의 평균의 차이와 비교하십시오. 관측된 표본 간 선의 기울기가 랜덤화 표본 간의 선에 비해 급할수록 귀무 가설에 대해 예상하는 증거를 더 많이 얻을 수 있습니다.
모평균이 같음
그룹 1의 모평균이 그룹 2의 모평균보다 두 배 정도 큼

귀무 가설과 대립 가설

귀무 가설과 대립 가설은 모집단에 대한 서로 배타적인 두 서술문입니다. 가설 검정은 표본 데이터를 사용하여 귀무 가설의 기각 여부를 확인합니다.
귀무 가설
귀무 가설은 모집단 모수(평균, 표준 편차 등)가 귀무 가설에서의 값과 같다는 것입니다. 귀무 가설은 종종 이전 분석 또는 전문 지식을 기반으로 한 초기 주장입니다.
대립 가설
대립 가설은 모집단 모수가 귀무 가설에서의 값보다 작거나 크거나 다르다는 것입니다. 대립 가설은 검정 당사자가 참이라고 믿거나 참으로 증명되기를 바라는 것입니다.

이 결과에서 귀무 가설은 모집단 차이가 0이라는 것입니다. 대립 가설은 차이가 0이 아니라는 것입니다. 

평균의 차이에 대한 랜덤화 검정: 병원의 수준별 등급

병원의 수준별 등급의 랜덤화 검정 히스토그램

방법 μ₁: 병원 = A일 때 등급의 평균 µ₂: 병원 = B일 때 등급의 평균 차이: μ₁ - µ₂
관측된 표본 병원 N 평균 표준 편차 분산 최소값 중위수 최대값 A 20 80.30 8.18 66.96 62.00 79.00 98.00 B 20 59.30 12.43 154.54 35.00 58.50 89.00
관측된 평균의 차이 A의 평균 - B의 평균 = 21.000
랜덤화 검정 귀무 가설 H₀: μ₁ - µ₂ = 0 대립 가설 H₁: μ₁ - µ₂ ≠ 0 재표본 개수 평균 표준 편차 P-값 1000 -0.185 4.728 < 0.002

재표본 수

재표본 수는 Minitab이 원래 데이터 집합에서 복원으로 랜덤 표본을 가져오는 횟수입니다. 보통 많은 수의 재표본이 가장 적합한 방법입니다. 각 재표본의 표본 크기는 원래 데이터 집합의 표본 크기와 같습니다. 재표본 수는 히스토그램에 있는 관측치 수와 같습니다.

평균

평균은 재표본 수로 나눈 랜덤화 표본의 모든 평균 차이 합입니다. Minitab은 평균의 차이에 대해 관측 표본 차이와 부트스트랩 분포(평균) 차이 이렇게 두 값을 표시합니다. 이 두 값 모두 모평균 차이의 추정치이며 보통 비슷합니다. 이 두 값 사이에 차이가 클 경우 원래 표본의 표본 크기를 늘려야 합니다.

표준 편차(부트스트랩 표본)

표준 편차는 산포, 즉 데이터가 평균을 중심으로 퍼져 있는 정도를 나타내는 가장 일반적인 측도입니다. 모집단의 표준 편차를 나타내는 데는 σ(시그마) 기호를 자주 사용하는 반면, 표본의 표준 편차를 나타내는 데는 s를 사용합니다. 랜덤이 아니거나 공정에 자연스럽지 못한 변동은 종종 잡음이라고 합니다. 표준 편차는 데이터와 단위가 같기 때문에 일반적으로 분산보다 더 쉽게 해석할 수 있습니다.

부트스트랩 표본의 표준 편차(부트스트랩 표준 오차라고도 함)는 평균의 차이의 표본 추출 분포에 대한 표준 편차 추정치입니다.

해석

부트스트랩 표본에서 차이가 전체 차이의 평균을 중심으로 퍼져 있는 정도를 확인하려면 표준 편차를 사용합니다. 표준 편차 값이 클수록 차이가 더 퍼져 있다는 것을 나타냅니다. 정규 분포에 대한 일반 규칙은 대략 68%의 값이 전체 차이의 평균으로부터 1 표준 편차 거리 내에 있고, 95%의 값이 2 표준 편차 거리 내에 있고, 99.7%의 값이 3 표준 편차 거리 내에 있다는 것입니다.

부트스트랩 표본의 표준 편차를 사용하여 부트스트랩 표본의 차이가 평균의 모집단 차이를 얼마나 정확하게 추정하는지 확인할 수 있습니다. 값이 작을수록 모집단 차이의 더 정확한 추정치를 나타냅니다. 일반적으로 부트스트랩 표준 편차가 클수록 차이의 표준 오차가 커지고 모집단 차이의 추정치가 덜 정확하게 됩니다. 표본 크기가 클수록 부트스트랩 표준 오차가 더 작고 모집단 차이의 추정치가 더 정확하게 됩니다.

p-값

p-값은 귀무 가설이 참이라고 가정할 때 원본 표본만큼 극단적인 표본 차이의 비율입니다. p-값이 작을수록 귀무 가설에 반하는 더 강력한 증거가 됩니다. p-값이 α-값보다 작으면 측정 시스템의 치우침이 0과 같다는 귀무 가설을 기각할 수 있습니다.

해석

모평균의 차이가 통계적으로 유의한지 여부를 확인하려면 p-값을 사용하십시오. 모평균 간의 차이가 통계적으로 유의한지 여부를 확인하려면 p-값을 유의 수준과 비교하십시오. 일반적으로 0.05의 유의 수준(α 또는 알파로 표시됨)이 적절합니다. 0.05의 유의 수준은 실제로 차이가 없는데 차이가 존재한다는 결론을 내릴 위험이 5%라는 것을 나타냅니다.
p-값 ≤ α: 평균 간의 차이가 통계적으로 유의함(H0 기각)
p-값이 유의 수준보다 작거나 같으면 귀무 가설을 기각합니다. 모평균 간의 차이가 통계적으로 유의하다는 결론을 내릴 수 있습니다. 신뢰 구간을 계산하여 차이가 실제로 유의한지 여부를 확인하려면 2-표본 평균의 부트스트래핑을 사용하십시오. 자세한 내용을 확인하려면 통계적 유의성 및 실제적 유의성으로 이동하십시오.
p-값 > α: 평균 간의 차이가 통계적으로 유의하지 않음(H0 기각 실패)
p-값이 유의 수준보다 크면 귀무 가설을 기각할 수 없습니다. 모평균 간의 차이가 통계적으로 유의하다는 결론을 내릴 충분한 증거가 없습니다.
이 사이트를 사용하면 분석 및 사용자 개인 컨텐츠에 대한 쿠키 사용에 동의하는 것입니다.  당사의 개인정보 보호정책을 확인하십시오