1-표본 평균에 대한 랜덤화 검정에 대한 랜덤화 검정 통계량 및 그래프

1-표본 평균에 대한 랜덤화 검정과 함께 제공되는 모든 랜덤화 검정 통계량 및 그래프에 대한 정의 및 해석 방법을 확인해 보십시오.

히스토그램

히스토그램은 표본 값을 여러 구간으로 나누고 각 구간 내 데이터 값의 빈도를 막대로 나타냅니다.

해석

히스토그램을 사용하여 부트스트랩 분포 형상을 조사합니다. 부트스트랩 분포는 각 재표본 평균에 대한 분포입니다. 부트스트랩 분포는 정규 분포로 표시되어야 합니다. 부트스트랩 분포가 정규 분포가 아닐 경우 해당 결과를 신뢰할 수 없습니다.
50개의 재표본
1000개의 재표본

보통 분포는 재표본이 더 많을 때 확인하기 쉽습니다. 예를 들어, 이러한 데이터에서 분포는 50개의 재표본에 대해 여러 가지로 해석할 수 있습니다. 재표본이 1000개인 경우 형상은 거의 정규 분포에 가깝습니다.

히스토그램은 가설 검증 결과를 보여줍니다. Minitab은 재표본의 중심이 가설 평균과 동일하도록 데이터를 조정합니다. 단측 검정의 경우 원래 표본 평균에 기준선이 그려집니다. 양측 검정의 경우 원래 표본 평균에 기준선이 그려지고 동시에 귀무 가설에서의 평균의 반대쪽에 대한 거리에도 그려집니다. p-값은 기준선에서의 값보다 더 극단적인 원래 표본 비율입니다. 즉, p-값은 귀무 가설이 참이라고 가정할 때 원본 표본만큼 극단적인 표본 평균의 비율입니다. 이러한 평균은 히스토그램에서 빨간색으로 표시됩니다.

이 히스토그램에서 부트스트랩 분포는 정규 분포처럼 나타납니다. 0.2030의 p-값은 표본 평균의 20.3%가 원래 표본의 평균보다 작다는 뜻입니다.

개별 값 그림

개별 값 그림은 표본 내 개별 값을 표시합니다. 각 원은 하나의 관측치를 나타냅니다. 개별 값 그림은 관측치 수가 비교적 적고 각 관측치의 영향도 평가해야 하는 경우 특히 유용합니다.

참고

Minitab은 재표본을 하나만 가져온 경우 개별 값 그림만 표시합니다. Minitab은 원래 데이터와 재표본 데이터를 모두 표시합니다.

해석

Minitab은 재표본의 중심이 가설 평균과 동일하도록 데이터를 조정합니다. 먼저 Minitab은 가설 평균과 원래 표본 평균의 차이를 계산합니다. 그런 다음 원래 표본에 있는 각 값에 차이를 추가하거나 뺍니다. 재표본은 조정된 이 데이터에서 가져옵니다.

개별 값 그림을 사용하여 원래 데이터와 랜덤화 표본을 비교합니다. 랜덤화 표본은 모평균이 가설 값과 같은 경우(귀무 가설이 참) 랜덤 표본이 어떻게 보이는지를 표시합니다. 두 표본의 중심 간 차이가 클수록 귀무 가설에 대해 예상하는 증거를 더 많이 얻을 수 있습니다.
표본 평균이 가설 평균과 같음
표본 평균 2 표준 편차가 가설 평균보다 낮음

귀무 가설과 대립 가설

귀무 가설과 대립 가설은 모집단에 대한 서로 배타적인 두 서술문입니다. 가설 검정은 표본 데이터를 사용하여 귀무 가설의 기각 여부를 확인합니다.
귀무 가설
귀무 가설은 모집단 모수(평균, 표준 편차 등)가 귀무 가설에서의 값과 같다는 것입니다. 귀무 가설은 종종 이전 분석 또는 전문 지식을 기반으로 한 초기 주장입니다.
대립 가설
대립 가설은 모집단 모수가 귀무 가설에서의 값보다 작거나 크거나 다르다는 것입니다. 대립 가설은 검정 당사자가 참이라고 믿거나 참으로 증명되기를 바라는 것입니다.

해석

결과에서 귀무 가설과 대립 가설은 귀무 가설에서의 평균에 대해 올바른 값을 입력했는지 확인하는 데 도움이 됩니다.

관측된 표본

변수N평균표준 편차분산최소값중위수최대값
시간1611.3313.1159.702181.3007.70010.05016.000

랜덤화 검정

귀무 가설H₀: μ = 12
대립 가설H₁: μ < 12
재표본 개수평균표준 편차P-값
100011.97830.76250.199

이 결과에서 귀무 가설은 모평균이 12이라는 것입니다. 대립 가설은 평균이 12보다 작다는 것입니다.

재표본 수

재표본 수는 Minitab이 원래 데이터 집합에서 복원으로 랜덤 표본을 가져오는 횟수입니다. 보통 많은 수의 재표본이 가장 적합한 방법입니다.

Minitab은 재표본의 중심이 가설 평균과 동일하도록 데이터를 조정합니다. 먼저 Minitab은 가설 평균과 원래 표본 평균의 차이를 계산합니다. 그런 다음 원래 표본에 있는 각 값에 차이를 추가하거나 뺍니다. 재표본은 조정된 이 데이터에서 가져옵니다. 각 재표본의 표본 크기는 원래 데이터 집합의 표본 크기와 같습니다. 재표본 수는 히스토그램에 있는 관측치 수와 같습니다.

평균

평균은 재표본 수로 나눈 부트스트래핑 표본의 모든 평균에 대한 합입니다. Minitab은 재표본의 중심이 가설 평균과 동일하도록 데이터를 조정합니다.

해석

Minitab은 관측 표본 평균과 부트스트랩 분포 평균 이렇게 두 평균 값을 표시합니다. 관측 표본의 평균은 모평균의 추정치입니다. 부트스트랩 분포 평균은 보통 귀무 가설 평균에 가깝습니다. 이 두 값의 중심 간 차이가 클수록 귀무 가설에 대해 예상하는 증거를 더 많이 얻을 수 있습니다.

표준 편차(부트스트랩 표본)

표준 편차는 산포, 즉 데이터가 평균을 중심으로 퍼져 있는 정도를 나타내는 가장 일반적인 측도입니다. 모집단의 표준 편차를 나타내는 데는 σ(시그마) 기호를 자주 사용하는 반면, 표본의 표준 편차를 사용하는 데는 s를 사용합니다. 랜덤이 아니거나 공정에 자연스럽지 못한 변동은 종종 잡음이라고 합니다. 표준 편차는 데이터와 단위가 같기 때문에 일반적으로 분산보다 더 쉽게 해석할 수 있습니다.

부트스트랩 표본의 표준 편차(부트스트랩 표준 오차라고도 함)는 평균의 표본 추출 분포에 대한 표준 편차 추정치입니다. 부트스트랩 표준 오차는 표본 평균의 변동인 반면 관측된 표본의 표준 편차는 개별 관측치의 변동이기 때문에 부트스트랩 표준 오차가 더 작습니다.

해석

부트스트랩 표본에서 평균이 전체 평균을 중심으로 퍼져 있는 정도를 확인하려면 표준 편차를 사용합니다. 표준 편차 값이 클수록 평균이 더 퍼져 있다는 것을 나타냅니다. 정규 분포에 대한 일반 규칙은 대략 68%의 값이 전체 평균으로부터 1 표준 편차 거리 내에 있고, 95%의 값이 2 표준 편차 거리 내에 있고, 99.7%의 값이 3 표준 편차 거리 내에 있다는 것입니다.

부트스트랩 평균 정확도를 측정하려면 부트스트랩 표본의 표준 편차를 사용하십시오. 값이 작을수록 더 정확하다는 뜻입니다. 원래 표본에서 표준 편차가 클수록 보통 부트스트랩 표준 오차가 커지고 가설 검증이 약해지게 됩니다. 표본 크기가 더 작은 경우에도 보통 부트스트랩 표준 오차가 커지고 가설 검증이 약해지게 됩니다.

또한 공정의 전체 변동을 추정하기 위한 벤치마크를 설정하기 위해 표준 편차를 사용할 수 있습니다.
병원 1
병원 2
병원 퇴원 시간

관리자들이 두 개 병원의 응급실 부서에서 치료한 환자의 퇴원 시간을 추적하고자 합니다. 평균 퇴원 시간은 동일하지만(35분) 표준 편차는 유의하게 다릅니다. 병원 1의 표준 편차가 약 6이며, 평균적으로 환자의 퇴원 시간은 평균(대시선)에서 약 6분 정도 멀어집니다. 병원 2의 표준 편차는 약 20입니다. 평균적으로 환자의 퇴원 시간은 평균(대시선)에서 약 20분 정도 멀어집니다.

p-값

p-값은 귀무 가설이 참이라고 가정할 때 원본 표본만큼 극단적인 표본 평균의 비율입니다. p-값이 작을수록 귀무 가설에 반하는 더 강력한 증거가 됩니다. p-값이 α-값보다 작으면 측정 시스템의 치우침이 0과 같다는 귀무 가설을 기각할 수 있습니다.

해석

모평균이 귀무 가설에서의 평균과 통계적으로 다른지 여부를 확인하려면 p-값을 사용하십시오.

모평균과 귀무 가설에서의 평균 간의 차이가 통계적으로 유의한지 여부를 확인하려면 p-값을 유의 수준과 비교하십시오. 일반적으로 0.05의 유의 수준(α 또는 알파로 표시됨)이 적절합니다. 0.05의 유의 수준은 실제로 차이가 없는데 차이가 존재한다는 결론을 내릴 위험이 5%라는 것을 나타냅니다.
p-값 ≤ α: 평균 간의 차이가 통계적으로 유의함(H0 기각)
p-값이 유의 수준보다 작거나 같으면 귀무 가설을 기각합니다. 모평균과 귀무 가설에서의 평균 간의 차이가 통계적으로 유의하다는 결론을 내릴 수 있습니다. 신뢰 구간을 계산하여 차이가 실제로 유의한지 여부를 확인하려면 1-표본 함수에 대한 부트스트래핑을 사용하십시오. 자세한 내용을 확인하려면 통계적 유의성 및 실제적 유의성으로 이동하십시오.
p-값 > α: 평균 간의 차이가 통계적으로 유의하지 않음(H0 기각 실패)
p-값이 유의 수준보다 크면 귀무 가설을 기각할 수 없습니다. 모평균과 귀무 가설에서의 평균 간의 차이가 통계적으로 유의하다는 결론을 내릴 충분한 증거가 없습니다.