히스토그램은 표본 값을 여러 구간으로 나누고 각 구간 내 데이터 값의 빈도를 막대로 나타냅니다.
히스토그램은 가설 검정의 결과를 시각적으로 보여줍니다. 랜덤화 표본은 모평균이 같을 때 임의의 표본의 모양을 나타내므로 히스토그램은 0을 중심으로 표시됩니다. 단측 검정의 경우 원래 표본의 평균의 차이에 기준선이 그려집니다. 양측 검정의 경우에는 원래 표본의 평균의 차이 및 0의 반대쪽 같은 거리에 기준선이 그려집니다. p-값은 기준선에서의 값보다 더 극단적인 표본 차이의 비율입니다. 다시 말해, p-값은 귀무 가설이 참이라고 가정할 때 원본 표본만큼 극단적인 표본 차이의 비율입니다. 이러한 차이는 히스토그램에서 빨간색으로 표시됩니다.
개별 값 그림은 표본 내 개별 값을 표시합니다. 각 원은 하나의 관측치를 나타냅니다. 개별 값 그림은 관측치 수가 비교적 적고 각 관측치의 영향도 평가해야 하는 경우 특히 유용합니다.
Minitab은 재표본을 하나만 가져온 경우 개별 값 그림만 표시합니다. Minitab은 원래 데이터와 재표본 데이터를 모두 표시합니다.
μ₁: 병원 = A일 때 등급의 모집단 평균 |
---|
µ₂: 병원 = B일 때 등급의 모집단 평균 |
차이: μ₁ - µ₂ |
병원 | N | 평균 | 표준 편차 | 분산 | 최소값 | 중위수 | 최대값 |
---|---|---|---|---|---|---|---|
A | 20 | 80.30 | 8.18 | 66.96 | 62.00 | 79.00 | 98.00 |
B | 20 | 59.30 | 12.43 | 154.54 | 35.00 | 58.50 | 89.00 |
A의 평균 - B의 평균 = 21.000 |
---|
귀무 가설 | H₀: μ₁ - µ₂ = 0 |
---|---|
대립 가설 | H₁: μ₁ - µ₂ ≠ 0 |
재표본 개수 | 평균 | 표준 편차 | P-값 |
---|---|---|---|
1000 | -0.185 | 4.728 | < 0.002 |
이 결과에서 귀무 가설은 모집단 차이가 0이라는 것입니다. 대립 가설은 차이가 0이 아니라는 것입니다.
재표본 수는 Minitab이 원래 데이터 집합에서 복원으로 랜덤 표본을 가져오는 횟수입니다. 보통 많은 수의 재표본이 가장 적합한 방법입니다. 각 재표본의 표본 크기는 원래 데이터 집합의 표본 크기와 같습니다. 재표본 수는 히스토그램에 있는 관측치 수와 같습니다.
평균은 재표본 수로 나눈 랜덤화 표본의 모든 평균 차이 합입니다. Minitab은 평균의 차이에 대해 관측 표본 차이와 부트스트랩 분포(평균) 차이 이렇게 두 값을 표시합니다. 이 두 값 모두 모평균 차이의 추정치이며 보통 비슷합니다. 이 두 값 사이에 차이가 클 경우 원래 표본의 표본 크기를 늘려야 합니다.
표준 편차는 산포, 즉 데이터가 평균을 중심으로 퍼져 있는 정도를 나타내는 가장 일반적인 측도입니다. 모집단의 표준 편차를 나타내는 데는 σ(시그마) 기호를 자주 사용하는 반면, 표본의 표준 편차를 나타내는 데는 s를 사용합니다. 랜덤이 아니거나 공정에 자연스럽지 못한 변동은 종종 잡음이라고 합니다. 표준 편차는 데이터와 단위가 같기 때문에 일반적으로 분산보다 더 쉽게 해석할 수 있습니다.
부트스트랩 표본의 표준 편차(부트스트랩 표준 오차라고도 함)는 평균의 차이의 표본 추출 분포에 대한 표준 편차 추정치입니다.
부트스트랩 표본에서 차이가 전체 차이의 평균을 중심으로 퍼져 있는 정도를 확인하려면 표준 편차를 사용합니다. 표준 편차 값이 클수록 차이가 더 퍼져 있다는 것을 나타냅니다. 정규 분포에 대한 일반 규칙은 대략 68%의 값이 전체 차이의 평균으로부터 1 표준 편차 거리 내에 있고, 95%의 값이 2 표준 편차 거리 내에 있고, 99.7%의 값이 3 표준 편차 거리 내에 있다는 것입니다.
부트스트랩 표본의 표준 편차를 사용하여 부트스트랩 표본의 차이가 평균의 모집단 차이를 얼마나 정확하게 추정하는지 확인할 수 있습니다. 값이 작을수록 모집단 차이의 더 정확한 추정치를 나타냅니다. 일반적으로 부트스트랩 표준 편차가 클수록 차이의 표준 오차가 커지고 모집단 차이의 추정치가 덜 정확하게 됩니다. 표본 크기가 클수록 부트스트랩 표준 오차가 더 작고 모집단 차이의 추정치가 더 정확하게 됩니다.
p-값은 귀무 가설이 참이라고 가정할 때 원본 표본만큼 극단적인 표본 차이의 비율입니다. p-값이 작을수록 귀무 가설에 반하는 더 강력한 증거가 됩니다. p-값이 α-값보다 작으면 측정 시스템의 치우침이 0과 같다는 귀무 가설을 기각할 수 있습니다.