표본 크기(N)는 표본의 총 관측치 수입니다.
표본 크기는 신뢰 구간 및 검정의 검정력에 영향을 미칩니다.
일반적으로 표본 크기가 클수록 신뢰 구간이 좁아집니다. 또한 표본 크기가 클수록 차이를 탐지하기 위한 검정력이 더 높습니다. 자세한 내용은 검정력의 정의에서 확인하십시오.
Minitab에서는 각 표본에 대한 평균과 쌍체 관측치 간의 차이의 평균을 표시합니다.
평균은 데이터의 중심을 나타내는 단일 값을 사용하여 표본 값을 요약합니다. 평균은 모든 관측치의 합을 관측치 수로 나눈 데이터의 평균입니다.
평균 차이는 모평균 차이의 추정치입니다.
평균 차이는 전체 모집단이 아니라 표본 데이터를 기반으로 하기 때문에 표본 평균 차이가 모평균 차이와 같을 가능성은 없습니다. 모평균 차이를 더 잘 추정하려면 차이의 신뢰 구간을 사용하십시오.
표준 편차는 산포, 즉 데이터가 평균을 중심으로 퍼져 있는 정도를 나타내는 가장 일반적인 측도입니다. 모집단의 표준 편차를 나타내는 데는 σ(시그마) 기호를 자주 사용하는 반면, 표본의 표준 편차를 사용하는 데는 s를 사용합니다. 랜덤이 아니거나 공정에 자연스럽지 못한 변동은 종종 잡음이라고 합니다.
표준 편차는 데이터와 동일한 단위를 사용합니다.
데이터가 평균을 중심으로 퍼져 있는 정도를 확인하려면 표준 편차를 사용합니다. 표준 편차 값이 클수록 데이터가 더 퍼져 있다는 것을 나타냅니다. 정규 분포에 대한 일반 규칙은 대략 68%의 값이 평균으로부터 1 표준 편차 거리 내에 있고, 95%의 값이 2 표준 편차 거리 내에 있고, 99.7%의 값이 3 표준 편차 거리 내에 있다는 것입니다.
표본 데이터의 표준 편차는 모집단 표준 편차의 추정치입니다. 표준 편차는 신뢰 구간과 p-값을 계산하기 위해 사용됩니다. 값이 클수록 신뢰 구간이 덜 정확하고(더 넓고) 검정력이 더 낮습니다.
평균의 표준 오차(SE 평균)는 같은 모집단에서 반복 표본을 추출하는 경우 얻게 될 표본 평균 간의 변동성을 추정합니다. 평균의 표준 오차는 표본 간의 변동성을 추정하는 반면, 표준 편차는 단일 표본 내의 변동성을 측정합니다.
예를 들어, 312개의 배송 시간 랜덤 표본에서 평균 배송 시간이 3.80일이고 표준 편차가 1.43일입니다. 이 숫자로 0.08일의 평균에 대한 표준 오차가 산출됩니다(1.43을 312 제곱근으로 나눈 값). 동일한 크기의 여러 랜덤 표본을 동일한 모집단에서 추출한 경우 서로 다른 표본 평균의 표준 편차는 약 0.08일이 됩니다.
평균의 표준 오차를 사용하여 표본 평균이 모평균을 얼마나 정확하게 추정하는지 확인할 수 있습니다. .
평균의 표준 오차 값이 작을수록 모집단 평균의 더 정확한 추정치를 나타냅니다. 일반적으로 표준 편차가 클수록 평균의 표준 오차가 더 크고 추정치가 덜 정확합니다. 표본 크기가 클수록 평균의 표준 오차가 더 작고 모집단 평균의 추정치가 더 정확하게 됩니다.
Minitab에서는 평균의 표준 오차를 사용하여 신뢰 구간을 계산합니다.
신뢰 구간은 모평균 차이가 될 수 있는 값의 범위를 제공합니다. 표본이 랜덤이기 때문에 모집단의 두 표본에서 동일한 신뢰 구간이 생성될 가능성은 없습니다. 그러나 표본 추출을 여러 번 반복하면 일정한 백분율의 신뢰 구간이나 한계에는 알 수 없는 모평균 차이가 포함됩니다. 평균 차이를 포함하는 이러한 신뢰 구간 또는 한계의 백분율이 해당 구간의 신뢰 수준입니다. 예를 들어, 95% 신뢰 수준은 모집단에서 100개의 랜덤 표본을 추출할 경우 약 95개의 표본이 모평균 차이가 포함된 구간을 생성할 것으로 예상된다는 것을 나타냅니다.
상한은 모평균 차이가 더 작을 가능성이 높은 값을 정의합니다. 하한은 모평균 차이가 더 클 가능성이 높은 값을 정의합니다.
신뢰 구간은 결과의 실제 유의성을 평가하는 데 도움이 됩니다. 해당 상황에 실제적으로 유의한 값이 신뢰 구간에 포함되는지 여부를 확인하려면 전문 지식을 이용하십시오. 신뢰 구간이 너무 넓어서 유의하지 않은 경우에는 표본 크기를 늘려보십시오. 자세한 내용은 더 정밀한 신뢰 구간을 구하는 방법에서 확인하십시오.
평균 | 표준 편차 | 평균의 표준 오차 | µ_차이에 대한 95% CI |
---|---|---|---|
2.200 | 3.254 | 0.728 | (0.677, 3.723) |
이 결과에서 심박수의 모평균 차이에 대한 추정치는 2.2입니다. 모평균 차이가 0.677과 3.723 사이에 있다고 95% 확신할 수 있습니다.
결과에서 귀무 가설과 대립 가설은 검정 차이에 대해 올바른 값을 입력했는지 확인하는 데 도움이 됩니다.
t-값은 t-검정 통계량의 관측치로, 관측된 표본 통계량과 귀무 가설에서의 모집단 모수 간의 차이를 표준 오차 단위로 측정합니다.
t-값을 t-분포의 임계값과 비교하여 귀무 가설의 기각 여부를 확인할 수 있습니다. 그러나 일반적으로 검정의 p-값을 사용하여 결정을 내리는 것이 더 실제적이고 편리합니다.
귀무 가설의 기각 여부를 확인하려면 t-값을 임계값과 비교하십시오. 임계값은 양측 검정의 경우 tα/2, n–1, 단측 검정의 경우 tα, n–1입니다. 양측 검정의 경우 t-값의 절대값이 임계값보다 크면 귀무 가설을 기각합니다. 그렇지 않으면 귀무 가설을 기각할 수 없습니다. Minitab에서 임계값을 계산하거나 대부분의 통계 서적에 있는 t-분포 표에서 임계값을 찾을 수 있습니다. 자세한 내용을 확인하려면 역 누적분포함수(ICDF) 사용으로 이동하여 "ICDF를 사용하여 임계값 계산"을 클릭하십시오.
p-값은 귀무 가설에 반하는 증거를 측정하는 확률입니다. p-값이 작을수록 귀무 가설에 반하는 더 강력한 증거가 됩니다.
모집단 차이의 평균이 귀무 가설에서의 차이 평균과 통계적으로 다른지 여부를 확인하려면 p-값을 사용하십시오.
히스토그램은 표본 값을 여러 구간으로 나누고 각 구간 내 데이터 값의 빈도를 막대로 나타냅니다.
데이터의 모양과 산포를 평가하려면 히스토그램을 사용합니다. 히스토그램은 표본 크기가 20보다 클 때 가장 적합합니다.
데이터가 치우쳐 있는 것으로 보이는지 여부를 확인하려면 데이터의 산포를 조사합니다. 데이터가 치우쳐 있으면 대부분의 데이터가 그래프의 높은 쪽이나 낮은 쪽에 위치합니다. 일반적으로 히스토그램이나 상자 그림에서 왜도를 탐지하기가 가장 쉽습니다.
심하게 치우친 데이터는 표본이 작은 경우(20보다 작은 값) p-값의 유효성에 영향을 미칠 수 있습니다. 데이터가 심하게 치우쳐 있고 표본이 작은 경우 표본 크기를 늘리는 것을 고려해 보십시오.
다른 데이터 값에서 멀리 떨어져 있는 데이터 값인 특이치는 분석 결과에 크게 영향을 미칠 수 있습니다. 일반적으로 상자 그림에서 특이치를 식별하기가 가장 쉽습니다.
특이치의 원인을 식별합니다. 모든 데이터 입력 오류 또는 측정 오류를 수정합니다. 비정상적인 일회성 사건에 대한 데이터 값을 삭제합니다(특수 원인이라고도 함). 그런 다음 분석을 반복합니다. 자세한 내용은 특이치 식별에서 확인하십시오.
개별 값 그림은 표본 내 개별 값을 표시합니다. 각 원은 관측치 하나를 나타냅니다. 개별 값 그림은 관측치 수가 비교적 적고 각 관측치의 영향도 평가해야 하는 경우 특히 유용합니다.
데이터의 산포를 평가하고 잠재적 특이치를 식별하려면 개별 값 그림을 사용합니다. 개별 값 그림은 표본 크기가 50보다 작을 때 가장 적합합니다.
데이터가 치우쳐 있는 것으로 보이는지 여부를 확인하려면 데이터의 산포를 조사합니다. 데이터가 치우쳐 있으면 대부분의 데이터가 그래프의 높은 쪽이나 낮은 쪽에 위치합니다. 일반적으로 히스토그램이나 상자 그림에서 왜도를 탐지하기가 가장 쉽습니다.
심하게 치우친 데이터는 표본이 작은 경우(20보다 작은 값) p-값의 유효성에 영향을 미칠 수 있습니다. 데이터가 심하게 치우쳐 있고 표본이 작은 경우 표본 크기를 늘리는 것을 고려해 보십시오.
다른 데이터 값에서 멀리 떨어져 있는 데이터 값인 특이치는 분석 결과에 크게 영향을 미칠 수 있습니다. 일반적으로 상자 그림에서 특이치를 식별하기가 가장 쉽습니다.
특이치의 원인을 식별합니다. 모든 데이터 입력 오류 또는 측정 오류를 수정합니다. 비정상적인 일회성 사건에 대한 데이터 값을 삭제합니다(특수 원인이라고도 함). 그런 다음 분석을 반복합니다. 자세한 내용은 특이치 식별에서 확인하십시오.
상자 그림은 표본 분포의 그래픽 요약을 제공합니다. 상자 그림은 데이터의 모양, 중심 위치 및 변동성을 보여줍니다.
데이터의 산포를 평가하고 잠재적 특이치를 식별하려면 상자 그림을 사용합니다. 상자 그림은 표본 크기가 20보다 클 때 가장 적합합니다.
데이터가 치우쳐 있는 것으로 보이는지 여부를 확인하려면 데이터의 산포를 조사합니다. 데이터가 치우쳐 있으면 대부분의 데이터가 그래프의 높은 쪽이나 낮은 쪽에 위치합니다. 일반적으로 히스토그램이나 상자 그림에서 왜도를 탐지하기가 가장 쉽습니다.
심하게 치우친 데이터는 표본이 작은 경우(20보다 작은 값) p-값의 유효성에 영향을 미칠 수 있습니다. 데이터가 심하게 치우쳐 있고 표본이 작은 경우 표본 크기를 늘리는 것을 고려해 보십시오.
다른 데이터 값에서 멀리 떨어져 있는 데이터 값인 특이치는 분석 결과에 크게 영향을 미칠 수 있습니다. 일반적으로 상자 그림에서 특이치를 식별하기가 가장 쉽습니다.
특이치의 원인을 식별합니다. 모든 데이터 입력 오류 또는 측정 오류를 수정합니다. 비정상적인 일회성 사건에 대한 데이터 값을 삭제합니다(특수 원인이라고도 함). 그런 다음 분석을 반복합니다. 자세한 내용은 특이치 식별에서 확인하십시오.