1-표본 Z 검정에 대한 모든 통계량 및 그래프 해석

1-표본 Z 분석과 함께 제공되는 모든 통계량 및 그래프에 대한 정의 및 해석 방법을 확인해 보십시오.

귀무 가설과 대립 가설

귀무 가설과 대립 가설은 모집단에 대한 서로 배타적인 두 서술문입니다. 가설 검정은 표본 데이터를 사용하여 귀무 가설의 기각 여부를 확인합니다.
귀무 가설
귀무 가설은 모집단 모수(평균, 표준 편차 등)가 귀무 가설에서의 값과 같다는 것입니다. 귀무 가설은 종종 이전 분석 또는 전문 지식을 기반으로 한 초기 주장입니다.
대립 가설
대립 가설은 모집단 모수가 귀무 가설에서의 값보다 작거나 크거나 다르다는 것입니다. 대립 가설은 검정 당사자가 참이라고 믿거나 참으로 증명되기를 바라는 것입니다.

결과에서 귀무 가설과 대립 가설은 귀무 가설에서의 평균에 대해 올바른 값을 입력했는지 확인하는 데 도움이 됩니다.

표준 편차

표준 편차는 산포, 즉 데이터가 평균을 중심으로 퍼져 있는 정도를 나타내는 가장 일반적인 측도입니다. 모집단의 표준 편차를 나타내는 데는 σ(시그마) 기호를 자주 사용하는 반면, 표본의 표준 편차를 사용하는 데는 s를 사용합니다. 랜덤이 아니거나 공정에 자연스럽지 못한 변동은 종종 잡음이라고 합니다.

표준 편차는 데이터와 동일한 단위를 사용합니다.

해석

데이터가 평균을 중심으로 퍼져 있는 정도를 확인하려면 표준 편차를 사용합니다. 표준 편차 값이 클수록 데이터가 더 퍼져 있다는 것을 나타냅니다. 정규 분포에 대한 일반 규칙은 대략 68%의 값이 평균으로부터 1 표준 편차 거리 내에 있고, 95%의 값이 2 표준 편차 거리 내에 있고, 99.7%의 값이 3 표준 편차 거리 내에 있다는 것입니다.

Minitab에서는 표준 편차에 대해 두 개의 다른 값을 표시합니다. 알려진 표준 편차는 사용자가 분석을 실행하기 전에 입력한 모집단의 표준 편차입니다. 표준 편차는 신뢰 구간과 Z-값을 계산하는 데 사용됩니다. StDev는 표본 데이터의 표준 편차입니다. 모집단의 표준 편차를 알고 있기 때문에 Minitab에서는 표본의 값을 계산에 사용하지 않습니다.

모집단의 표준 편차를 모르는 경우에는 1-표본 t 검정을 사용하십시오.

N

표본 크기(N)는 표본의 총 관측치 수입니다.

해석

표본 크기는 신뢰 구간 및 검정의 검정력에 영향을 미칩니다.

일반적으로 표본 크기가 클수록 신뢰 구간이 좁아집니다. 또한 표본 크기가 클수록 차이를 탐지하기 위한 검정력이 더 높습니다. 자세한 내용은 검정력의 정의에서 확인하십시오.

평균

평균은 데이터의 중심을 나타내는 단일 값을 사용하여 표본 값을 요약합니다. 평균은 모든 관측치의 합을 관측치 수로 나눈 데이터의 평균입니다.

해석

표본 데이터의 평균은 모평균의 추정치입니다.

평균은 전체 모집단이 아니라 표본 데이터를 기반으로 하기 때문에 표본 평균이 모평균과 같을 가능성은 없습니다. 모평균을 더 잘 추정하려면 신뢰 구간을 사용하십시오.

SE 평균

평균의 표준 오차(SE 평균)는 같은 모집단에서 반복 표본을 추출하는 경우 얻게 될 표본 평균 간의 변동성을 추정합니다. 평균의 표준 오차는 표본 간의 변동성을 추정하는 반면, 표준 편차는 단일 표본 내의 변동성을 측정합니다.

예를 들어, 312개의 배송 시간 랜덤 표본에서 평균 배송 시간이 3.80일이고 표준 편차가 1.43일입니다. 이 숫자로 0.08일의 평균에 대한 표준 오차가 산출됩니다(1.43을 312 제곱근으로 나눈 값). 동일한 크기의 여러 랜덤 표본을 동일한 모집단에서 추출한 경우 서로 다른 표본 평균의 표준 편차는 약 0.08일이 됩니다.

해석

평균의 표준 오차를 사용하여 표본 평균이 모평균을 얼마나 정확하게 추정하는지 확인할 수 있습니다. .

평균의 표준 오차 값이 작을수록 모집단 평균의 더 정확한 추정치를 나타냅니다. 일반적으로 표준 편차가 클수록 평균의 표준 오차가 더 크고 추정치가 덜 정확합니다. 표본 크기가 클수록 평균의 표준 오차가 더 작고 모집단 평균의 추정치가 더 정확하게 됩니다.

Minitab에서는 평균의 표준 오차를 사용하여 신뢰 구간을 계산합니다.

신뢰 구간(CI) 및 한계

신뢰 구간은 모평균이 될 수 있는 값의 범위를 제공합니다. 표본이 랜덤이기 때문에 모집단의 두 표본에서 동일한 신뢰 구간이 생성될 가능성은 없습니다. 그러나 표본 추출을 여러 번 반복하면 일정한 백분율의 신뢰 구간이나 한계에는 알 수 없는 모평균이 포함됩니다. 평균을 포함하는 이러한 신뢰 구간 또는 한계의 백분율이 해당 구간의 신뢰 수준입니다. 예를 들어, 95% 신뢰 수준은 모집단에서 100개의 랜덤 표본을 추출할 경우 약 95개의 표본에서 모평균이 포함된 구간을 생성할 것으로 예상된다는 것을 나타냅니다.

상한은 모평균이 더 작을 가능성이 높은 값을 정의합니다. 하한은 모평균이 더 클 가능성이 높은 값을 정의합니다.

신뢰 구간은 결과의 실제 유의성을 평가하는 데 도움이 됩니다. 해당 상황에 실제적으로 유의한 값이 신뢰 구간에 포함되는지 여부를 확인하려면 전문 지식을 이용하십시오. 신뢰 구간이 너무 넓어서 유의하지 않은 경우에는 표본 크기를 늘려보십시오. 자세한 내용은 더 정밀한 신뢰 구간을 구하는 방법에서 확인하십시오.

기술 통계량 평균의 μ에 대한 95% N 평균 표준 편차 표준 오차 CI 20 16.460 2.258 0.581 (15.321, 17.599) μ: 지방 백분율의 평균 알려진 표준 편차 = 2.6

이 결과에서 지방 비율에 대한 모평균의 추정치는 16.46%입니다. 모평균이 15.321%와 17.599% 사이에 있다고 95% 확신할 수 있습니다.

Z-값

Z-값은 Z-검정에 대한 검정 통계량으로, 관측된 통계량과 귀무 가설에서의 모집단 모수 간의 차이를 표준 오차 단위로 측정합니다.

해석

Z-값을 표준 정규 분포의 임계값과 비교하여 귀무 가설의 기각 여부를 확인할 수 있습니다. 그러나 일반적으로 검정의 p-값을 사용하여 결정을 내리는 것이 더 실제적이고 편리합니다.

귀무 가설의 기각 여부를 확인하려면 Z-값을 임계값과 비교하십시오. 임계값은 양측 검정의 경우 Z1-α/2, 단측 검정의 경우 Z1-α입니다. 양측 검정의 경우 Z-값의 절대값이 임계값보다 크면 귀무 가설을 기각합니다. Z-값의 절대값이 임계값보다 작으면 귀무 가설을 기각할 수 없습니다. Minitab에서 임계값을 계산하거나 대부분의 통계 서적에 있는 표준 정규 표에서 임계값을 찾을 수 있습니다. 자세한 내용을 보려면 역 누적분포함수(ICDF) 사용에서 "ICDF를 사용하여 임계값 계산"을 클릭하십시오.

Z-값은 p-값을 계산하는 데 사용됩니다.

p-값

p-값은 귀무 가설에 반하는 증거를 측정하는 확률입니다. p-값이 작을수록 귀무 가설에 반하는 더 강력한 증거가 됩니다.

해석

모평균이 귀무 가설에서의 평균과 통계적으로 다른지 여부를 확인하려면 p-값을 사용하십시오.

모평균과 귀무 가설에서의 평균 간의 차이가 통계적으로 유의한지 여부를 확인하려면 p-값을 유의 수준과 비교하십시오. 일반적으로 0.05의 유의 수준(α 또는 알파로 표시함)이 적절합니다. 0.05의 유의 수준은 실제로 차이가 없는데 차이가 존재한다는 결론을 내릴 위험이 5%라는 것을 나타냅니다.
p-값 ≤ α: 평균 간의 차이가 통계적으로 유의함(H0 기각)
p-값이 유의 수준보다 작거나 같으면 귀무 가설을 기각합니다. 모평균과 귀무 가설에서의 평균 간의 차이가 통계적으로 유의하다는 결론을 내릴 수 있습니다. 차이가 실제로 유의한지 여부를 확인하려면 전문 지식을 활용합니다. 자세한 내용은 통계적 유의성 및 실제적 유의성에서 확인하십시오.
p-값 > α: 평균 간의 차이가 통계적으로 유의하지 않음(H0 기각 실패)
p-값이 유의 수준보다 크면 귀무 가설을 기각할 수 없습니다. 모평균과 귀무 가설에서의 평균 간의 차이가 통계적으로 유의하다는 결론을 내릴 충분한 증거가 없습니다.검정에 실제로 유의한 차이를 탐지할 만한 충분한 검정력이 있는지 확인해야 합니다. 자세한 내용은 1-표본 Z 검정에 대한 검정력 및 표본 크기에서 확인하십시오.

히스토그램

히스토그램은 표본 값을 여러 구간으로 나누고 각 구간 내 데이터 값의 빈도를 막대로 나타냅니다.

해석

데이터의 모양과 산포를 평가하려면 히스토그램을 사용합니다. 히스토그램은 표본 크기가 20보다 클 때 가장 적합합니다.

치우친 데이터

데이터가 치우쳐 있는 것으로 보이는지 여부를 확인하려면 데이터의 산포를 조사합니다. 데이터가 치우쳐 있으면 대부분의 데이터가 그래프의 높은 쪽이나 낮은 쪽에 위치합니다. 일반적으로 히스토그램이나 상자 그림에서 왜도를 탐지하기가 가장 쉽습니다.

오른쪽으로 치우침
왼쪽으로 치우침

오른쪽으로 치우친 데이터의 히스토그램은 대기 시간을 보여줍니다. 대부분의 대기 시간이 비교적 짧고 몇 개의 대기 시간만 깁니다. 왼쪽으로 치우친 데이터의 히스토그램은 수명 데이터를 보여줍니다. 몇 개의 품목이 즉시 고장나고 더 많은 품목이 나중에 고장납니다.

심하게 치우친 데이터는 표본이 작은 경우(20보다 작은 값) p-값의 유효성에 영향을 미칠 수 있습니다. 데이터가 심하게 치우쳐 있고 표본이 작은 경우 표본 크기를 늘리는 것을 고려해 보십시오.

특이치

다른 데이터 값에서 멀리 떨어져 있는 데이터 값인 특이치는 분석 결과에 크게 영향을 미칠 수 있습니다. 일반적으로 상자 그림에서 특이치를 식별하기가 가장 쉽습니다.

히스토그램에서는 그래프 양쪽 끝의 고립된 막대가 가능한 특이치를 나타냅니다.

특이치의 원인을 식별합니다. 모든 데이터 입력 오류 또는 측정 오류를 수정합니다. 비정상적인 일회성 사건에 대한 데이터 값을 삭제합니다(특수 원인이라고도 함). 그런 다음 분석을 반복합니다. 자세한 내용은 특이치 식별에서 확인하십시오.

개별 값 그림

개별 값 그림은 표본 내 개별 값을 표시합니다. 각 원은 관측치 하나를 나타냅니다. 개별 값 그림은 관측치 수가 비교적 적고 각 관측치의 영향도 평가해야 하는 경우 특히 유용합니다.

해석

데이터의 산포를 평가하고 잠재적 특이치를 식별하려면 개별 값 그림을 사용합니다. 개별 값 그림은 표본 크기가 50보다 작을 때 가장 적합합니다.

치우친 데이터

데이터가 치우쳐 있는 것으로 보이는지 여부를 확인하려면 데이터의 산포를 조사합니다. 데이터가 치우쳐 있으면 대부분의 데이터가 그래프의 높은 쪽이나 낮은 쪽에 위치합니다. 일반적으로 히스토그램이나 상자 그림에서 왜도를 탐지하기가 가장 쉽습니다.

오른쪽으로 치우침
왼쪽으로 치우침

오른쪽으로 치우친 데이터의 개별 값 그림은 대기 시간을 보여줍니다. 대부분의 대기 시간이 비교적 짧고 몇 개의 대기 시간만 깁니다. 왼쪽으로 치우친 데이터의 개별 값 그림은 수명 데이터를 보여줍니다. 몇 개의 품목이 즉시 고장나고 더 많은 품목이 나중에 고장납니다.

심하게 치우친 데이터는 표본이 작은 경우(20보다 작은 값) p-값의 유효성에 영향을 미칠 수 있습니다. 데이터가 심하게 치우쳐 있고 표본이 작은 경우 표본 크기를 늘리는 것을 고려해 보십시오.

특이치

다른 데이터 값에서 멀리 떨어져 있는 데이터 값인 특이치는 분석 결과에 크게 영향을 미칠 수 있습니다. 일반적으로 상자 그림에서 특이치를 식별하기가 가장 쉽습니다.

개별 값 그림에서는 비정상적으로 낮거나 높은 데이터 값이 가능한 특이치를 나타냅니다.

특이치의 원인을 식별합니다. 모든 데이터 입력 오류 또는 측정 오류를 수정합니다. 비정상적인 일회성 사건에 대한 데이터 값을 삭제합니다(특수 원인이라고도 함). 그런 다음 분석을 반복합니다. 자세한 내용은 특이치 식별에서 확인하십시오.

상자 그림

상자 그림은 표본 분포의 그래픽 요약을 제공합니다. 상자 그림은 데이터의 모양, 중심 위치 및 변동성을 보여줍니다.

해석

데이터의 산포를 평가하고 잠재적 특이치를 식별하려면 상자 그림을 사용합니다. 상자 그림은 표본 크기가 20보다 클 때 가장 적합합니다.

치우친 데이터

데이터가 치우쳐 있는 것으로 보이는지 여부를 확인하려면 데이터의 산포를 조사합니다. 데이터가 치우쳐 있으면 대부분의 데이터가 그래프의 높은 쪽이나 낮은 쪽에 위치합니다. 일반적으로 히스토그램이나 상자 그림에서 왜도를 탐지하기가 가장 쉽습니다.

오른쪽으로 치우침
왼쪽으로 치우침

오른쪽으로 치우친 데이터의 상자 그림은 대기 시간을 보여줍니다. 대부분의 대기 시간이 비교적 짧고 몇 개의 대기 시간만 깁니다. 왼쪽으로 치우친 데이터의 상자 그림은 수명 데이터를 보여줍니다. 몇 개의 품목이 즉시 고장나고 더 많은 품목이 나중에 고장납니다.

심하게 치우친 데이터는 표본이 작은 경우(20보다 작은 값) p-값의 유효성에 영향을 미칠 수 있습니다. 데이터가 심하게 치우쳐 있고 표본이 작은 경우 표본 크기를 늘리는 것을 고려해 보십시오.

특이치

다른 데이터 값에서 멀리 떨어져 있는 데이터 값인 특이치는 분석 결과에 크게 영향을 미칠 수 있습니다. 일반적으로 상자 그림에서 특이치를 식별하기가 가장 쉽습니다.

상자 그림에서는 별표(*)가 특이치를 나타냅니다.

특이치의 원인을 식별합니다. 모든 데이터 입력 오류 또는 측정 오류를 수정합니다. 비정상적인 일회성 사건에 대한 데이터 값을 삭제합니다(특수 원인이라고도 함). 그런 다음 분석을 반복합니다. 자세한 내용은 특이치 식별에서 확인하십시오.

이 사이트를 사용하면 분석 및 사용자 개인 컨텐츠에 대한 쿠키 사용에 동의하는 것입니다.  당사의 개인정보 보호정책을 확인하십시오