2-표본 t 검정에 대한 모든 통계량 및 그래프 해석

N

표본 크기(N)는 표본의 총 관측치 수입니다.

해석

표본 크기는 신뢰 구간 및 검정의 검정력에 영향을 미칩니다.

일반적으로 표본 크기가 클수록 신뢰 구간이 좁아집니다. 또한 표본 크기가 클수록 차이를 탐지하기 위한 검정력이 더 높습니다. 자세한 내용은 검정력의 정의에서 확인하십시오.

평균

평균은 데이터의 중심을 나타내는 단일 값을 사용하여 표본 값을 요약합니다. 평균은 모든 관측치의 합을 관측치 수로 나눈 데이터의 평균입니다.

해석

각 표본의 평균은 각 표본의 모평균 추정치입니다.

표준 편차

표준 편차는 산포, 즉 데이터가 평균을 중심으로 퍼져 있는 정도를 나타내는 가장 일반적인 측도입니다. 모집단의 표준 편차를 나타내는 데는 σ(시그마) 기호를 자주 사용하는 반면, 표본의 표준 편차를 사용하는 데는 s를 사용합니다. 랜덤이 아니거나 공정에 자연스럽지 못한 변동은 종종 잡음이라고 합니다.

표준 편차는 데이터와 동일한 단위를 사용합니다.

해석

데이터가 평균을 중심으로 퍼져 있는 정도를 확인하려면 표준 편차를 사용합니다. 표준 편차 값이 클수록 데이터가 더 퍼져 있다는 것을 나타냅니다. 정규 분포에 대한 일반 규칙은 대략 68%의 값이 평균으로부터 1 표준 편차 거리 내에 있고, 95%의 값이 2 표준 편차 거리 내에 있고, 99.7%의 값이 3 표준 편차 거리 내에 있다는 것입니다.

각 표본의 표준 편차는 각 모집단 표준 편차의 추정치입니다. 표준 편차는 신뢰 구간과 p-값을 계산하기 위해 사용됩니다. 값이 클수록 신뢰 구간이 덜 정확하고(더 넓고) 검정력이 더 낮습니다.

또한 공정의 전체 변동을 추정하기 위한 벤치마크를 설정하기 위해 표준 편차를 사용할 수 있습니다.

병원 퇴원 시간
관리자들이 두 개 병원의 응급실 부서에서 치료한 환자의 퇴원 시간을 추적하고자 합니다. 평균 퇴원 시간은 동일하지만(35분) 표준 편차는 유의하게 다릅니다. 병원 1의 표준 편차가 약 6이며, 평균적으로 환자의 퇴원 시간은 평균(대시선)에서 약 6분 정도 멀어집니다. 병원 2의 표준 편차는 약 20입니다. 평균적으로 환자의 퇴원 시간은 평균(대시선)에서 약 20분 정도 멀어집니다.

SE 평균

평균의 표준 오차(SE 평균)는 같은 모집단에서 반복 표본을 추출하는 경우 얻게 될 표본 평균 간의 변동성을 추정합니다. 평균의 표준 오차는 표본 간의 변동성을 추정하는 반면, 표준 편차는 단일 표본 내의 변동성을 측정합니다.

예를 들어, 312개의 배송 시간 랜덤 표본에서 평균 배송 시간이 3.80일이고 표준 편차가 1.43일입니다. 이 숫자로 0.08일의 평균에 대한 표준 오차가 산출됩니다(1.43을 312 제곱근으로 나눈 값). 동일한 크기의 여러 랜덤 표본을 동일한 모집단에서 추출한 경우 서로 다른 표본 평균의 표준 편차는 약 0.08일이 됩니다.

해석

평균의 표준 오차를 사용하여 표본 평균이 모평균을 얼마나 정확하게 추정하는지 확인할 수 있습니다. .

평균의 표준 오차 값이 작을수록 모집단 평균의 더 정확한 추정치를 나타냅니다. 일반적으로 표준 편차가 클수록 평균의 표준 오차가 더 크고 추정치가 덜 정확합니다. 표본 크기가 클수록 평균의 표준 오차가 더 작고 모집단 평균의 추정치가 더 정확하게 됩니다.

Minitab에서는 평균의 표준 오차를 사용하여 신뢰 구간을 계산합니다.

차이: μ₁ – μ₂

차이는 추정하려는 모집단 평균 간의 알 수 없는 차이입니다. Minitab에서 어느 모집단 평균을 다른 모집단 평균에서 빼는지 나타냅니다.

차이 추정치

차이는 두 표본의 평균 간의 차이입니다.

차이는 전체 모집단이 아니라 표본 데이터를 기반으로 하기 때문에 표본 차이가 모집단 차이와 같을 가능성은 없습니다. 모집단 차이를 더 잘 추정하려면 차이에 대한 신뢰 구간을 사용하십시오.

신뢰 구간(CI) 및 한계

신뢰 구간은 모집단 차이가 될 수 있는 값의 범위를 제공합니다. 표본이 랜덤이기 때문에 모집단의 두 표본에서 동일한 신뢰 구간이 생성될 가능성은 없습니다. 그러나 표본 추출을 여러 번 반복하면 일정한 백분율의 신뢰 구간이나 한계에는 알 수 없는 모집단 차이가 포함됩니다. 차이를 포함하는 이러한 신뢰 구간 또는 한계의 백분율이 해당 구간의 신뢰 수준입니다. 예를 들어, 95% 신뢰 수준은 모집단에서 100개의 랜덤 표본을 추출할 경우 약 95개의 표본이 모집단 차이가 포함된 구간을 생성할 것으로 예상된다는 것을 나타냅니다.

상한은 모집단 차이가 더 작을 가능성이 높은 값을 정의합니다. 하한은 모집단 차이가 더 클 가능성이 높은 값을 정의합니다.

신뢰 구간은 결과의 실제 유의성을 평가하는 데 도움이 됩니다. 해당 상황에 실제적으로 유의한 값이 신뢰 구간에 포함되는지 여부를 확인하려면 전문 지식을 이용하십시오. 신뢰 구간이 너무 넓어서 유의하지 않은 경우에는 표본 크기를 늘려보십시오. 자세한 내용은 더 정밀한 신뢰 구간을 구하는 방법에서 확인하십시오.

차이 추정치

차이	차이에 대한 95% CI
21.00	(14.22, 27.78)

이 결과에서 병원 등급의 평균 모집단 차이의 추정치는 21입니다. 차이에 대한 모평균이 14.22와 27.78 사이에 있다고 95% 확신할 수 있습니다.

귀무 가설과 대립 가설

차이의 t-검정은 귀무 가설과 대립 가설을 표시합니다. 귀무 가설과 대립 가설은 모집단에 대한 서로 배타적인 두 서술문입니다. 가설 검정은 표본 데이터를 사용하여 귀무 가설의 기각 여부를 확인합니다.

귀무 가설: 귀무 가설은 모집단 모수(평균, 표준 편차 등)가 귀무 가설에서의 값과 같다는 것입니다. 귀무 가설은 종종 이전 분석 또는 전문 지식을 기반으로 한 초기 주장입니다.
대립 가설: 대립 가설은 모집단 모수가 귀무 가설에서의 값보다 작거나 크거나 다르다는 것입니다. 대립 가설은 검정 당사자가 참이라고 믿거나 참으로 증명되기를 바라는 것입니다.

결과에서 귀무 가설과 대립 가설은 검정 차이에 대해 올바른 값을 입력했는지 확인하는 데 도움이 됩니다.

T-값

t-값은 t-검정 통계량의 관측치로, 관측된 표본 통계량과 귀무 가설에서의 모집단 모수 간의 차이를 표준 오차 단위로 측정합니다.

해석

t-값을 t-분포의 임계값과 비교하여 귀무 가설의 기각 여부를 확인할 수 있습니다. 그러나 일반적으로 검정의 p-값을 사용하여 결정을 내리는 것이 더 실제적이고 편리합니다.

귀무 가설의 기각 여부를 확인하려면 t-값을 임계값과 비교하십시오. 등분산을 가정하는 경우 임계값은 양측 검정의 경우 t_{α/2, n+m–2}, 단측 검정의 경우 t_{α, n+m–2}입니다. 등분산을 가정할 수 없는 경우 임계값은 양측 검정의 경우 t_{α/2, r}, 단측 검정의 경우 t_{α, r}입니다(여기서 r은 자유도). 양측 검정의 경우 t-값의 절대값이 임계값보다 크면 귀무 가설을 기각합니다. 그렇지 않으면 귀무 가설을 기각할 수 없습니다. Minitab에서 임계값을 계산하거나 대부분의 통계 서적에 있는 t-분포 표에서 임계값을 찾을 수 있습니다. 자세한 내용을 확인하려면 역 누적분포함수(ICDF) 사용으로 이동하여 "ICDF를 사용하여 임계값 계산"을 클릭하십시오.

t-값은 p-값을 계산하는 데 사용됩니다.

p-값

p-값은 귀무 가설에 반하는 증거를 측정하는 확률입니다. p-값이 작을수록 귀무 가설에 반하는 더 강력한 증거가 됩니다.

해석

모평균의 차이가 통계적으로 유의한지 여부를 확인하려면 p-값을 사용하십시오.

모평균 간의 차이가 통계적으로 유의한지 여부를 확인하려면 p-값을 유의 수준과 비교하십시오.일반적으로 0.05의 유의 수준(α 또는 알파로 표시함)이 적절합니다. 0.05의 유의 수준은 실제로 차이가 없는데 차이가 존재한다는 결론을 내릴 위험이 5%라는 것을 나타냅니다.

p-값 ≤ α: 평균 간의 차이가 통계적으로 유의함(H₀ 기각): p-값이 유의 수준보다 작거나 같으면 귀무 가설을 기각합니다. 모평균 간의 차이가 귀무 가설에서의 차이와 같지 않다는 결론을 내릴 수 있습니다. 귀무 가설에서의 차이를 지정하지 않은 경우 Minitab에서는 평균 간에 차이가 없는지 여부(귀무 가설에서의 차이 = 0)를 검정합니다. 차이가 실제로 유의한지 여부를 확인하려면 전문 지식을 활용합니다. 자세한 내용은 통계적 유의성 및 실제적 유의성에서 확인하십시오.
p-값 > α: 평균 간의 차이가 통계적으로 유의하지 않음(H₀ 기각 실패): p-값이 유의 수준보다 크면 귀무 가설을 기각할 수 없습니다. 모평균 간의 차이가 통계적으로 유의하다는 결론을 내릴 충분한 증거가 없습니다. 검정에 실제로 유의한 차이를 탐지할 만한 충분한 검정력이 있는지 확인해야 합니다. 자세한 내용은 2-표본 t 검정에 대한 검정력과 표본 크기에서 확인하십시오.

DF

자유도(DF)는 데이터에서 알 수 없는 모수를 추정하고 이러한 추정치의 변동성을 계산하는 데 사용할 수 있는 정보의 양을 나타냅니다. 2-표본 t-검정의 경우, 자유도는 표본의 관측치 수에 따라 결정되며 등분산을 가정할 수 있는지 여부에 따라 다릅니다.

해석

Minitab에서는 검정 통계량을 계산하기 위해 자유도를 사용합니다. 자유도는 표본 크기에 따라 결정됩니다. 표본 크기를 증가시키면 모집단에 대한 더 많은 정보가 제공되므로, 자유도가 증가합니다.

합동 표준 편차

합동 표준 편차는 두 표본의 공통 표준 편차의 추정치입니다. 합동 표준 편차는 모든 데이터 점의 그룹 평균(전체 평균이 아님)에 대한 데이터 점의 표준 편차입니다. 그룹이 클수록 이에 비례하여 합동 표준 편차의 전체 평균에 미치는 영향이 더 큽니다.

해석

표준 편차는 신뢰 구간과 p-값을 계산하는 데 사용됩니다.

표준 편차 값이 클수록 데이터가 더 퍼져 있다는 것을 나타냅니다. 값이 클수록 신뢰 구간이 덜 정확하고(더 넓고) 검정력이 더 낮습니다.

합동 표준 편차의 예

다음 두 그룹을 연구에서 사용한다고 가정합니다.

그룹	평균	표준 편차	N
1	9.7	2.5	50
2	17.3	6.8	200

첫 번째 그룹(n=50)의 표준 편차는 2.5입니다. 두 번째 그룹은 훨씬 더 크고(n=200) 표준 편차(6.8)가 더 큽니다. 합동 표준 편차에서 가중 평균을 사용하기 때문에 합동 표준 편차 값은 더 큰 그룹의 표준 편차와 더 가깝습니다. 단순 평균을 사용한 경우 두 그룹 모두 동일한 영향을 받습니다.

개별 값 그림

개별 값 그림은 각 표본 내 개별 값을 표시합니다. 개별 값 그림을 사용하면 표본을 쉽게 비교할 수 있습니다. 각 원은 관측치 하나를 나타냅니다. 개별 값 그림은 관측치 수가 비교적 적고 각 관측치의 영향도 평가해야 하는 경우 특히 유용합니다.

해석

데이터의 산포를 평가하고 잠재적 특이치를 식별하려면 개별 값 그림을 사용합니다. 개별 값 그림은 표본 크기가 50보다 작을 때 가장 적합합니다.

치우친 데이터

데이터가 치우쳐 있는 것으로 보이는지 여부를 확인하려면 데이터의 산포를 조사합니다. 데이터가 치우쳐 있으면 대부분의 데이터가 그래프의 높은 쪽이나 낮은 쪽에 위치합니다. 일반적으로 히스토그램이나 상자 그림에서 왜도를 탐지하기가 가장 쉽습니다.

심하게 치우친 데이터는 표본이 작은 경우(각 표본이 15보다 작은 값) p-값의 유효성에 영향을 미칠 수 있습니다. 데이터가 심하게 치우쳐 있고 표본이 작은 경우 표본 크기를 늘리는 것을 고려해 보십시오.

특이치

다른 데이터 값에서 멀리 떨어져 있는 데이터 값인 특이치는 분석 결과에 크게 영향을 미칠 수 있습니다. 일반적으로 상자 그림에서 특이치를 식별하기가 가장 쉽습니다.

특이치의 원인을 식별합니다. 모든 데이터 입력 오류 또는 측정 오류를 수정합니다. 비정상적인 일회성 사건에 대한 데이터 값을 삭제합니다(특수 원인이라고도 함). 그런 다음 분석을 반복합니다. 자세한 내용은 특이치 식별에서 확인하십시오.

상자 그림

상자 그림은 각 표본 분포의 그래픽 요약을 제공합니다. 상자 그림을 사용하면 표본의 모양, 중심 위치 및 변동성을 쉽게 비교할 수 있습니다.

해석

데이터의 산포를 평가하고 잠재적 특이치를 식별하려면 상자 그림을 사용합니다. 상자 그림은 표본 크기가 20보다 클 때 가장 적합합니다.

치우친 데이터

데이터가 치우쳐 있는 것으로 보이는지 여부를 확인하려면 데이터의 산포를 조사합니다. 데이터가 치우쳐 있으면 대부분의 데이터가 그래프의 높은 쪽이나 낮은 쪽에 위치합니다. 일반적으로 히스토그램이나 상자 그림에서 왜도를 탐지하기가 가장 쉽습니다.

심하게 치우친 데이터는 표본이 작은 경우(각 표본이 15보다 작은 값) p-값의 유효성에 영향을 미칠 수 있습니다. 데이터가 심하게 치우쳐 있고 표본이 작은 경우 표본 크기를 늘리는 것을 고려해 보십시오.

특이치

다른 데이터 값에서 멀리 떨어져 있는 데이터 값인 특이치는 분석 결과에 크게 영향을 미칠 수 있습니다. 일반적으로 상자 그림에서 특이치를 식별하기가 가장 쉽습니다.

특이치의 원인을 식별합니다. 모든 데이터 입력 오류 또는 측정 오류를 수정합니다. 비정상적인 일회성 사건에 대한 데이터 값을 삭제합니다(특수 원인이라고도 함). 그런 다음 분석을 반복합니다. 자세한 내용은 특이치 식별에서 확인하십시오.

2-표본 t 검정에 대한 모든 통계량 및 그래프 해석

이 항목의 내용

N

해석

평균

해석

표준 편차

해석

병원 1

병원 2

병원 퇴원 시간

SE 평균

해석

차이: μ₁ – μ₂

차이 추정치

신뢰 구간(CI) 및 한계

차이 추정치

귀무 가설과 대립 가설

T-값

해석

p-값

해석

DF

해석

합동 표준 편차

해석

합동 표준 편차의 예

개별 값 그림

해석

오른쪽으로 치우침

왼쪽으로 치우침

상자 그림

해석

오른쪽으로 치우침

왼쪽으로 치우침

2-표본 t 검정에 대한 모든 통계량 및 그래프 해석

이 항목의 내용

N

해석

평균

해석

표준 편차

해석

병원 1

병원 2

병원 퇴원 시간

SE 평균

해석

차이: μ1 – μ2

차이 추정치

신뢰 구간(CI) 및 한계

차이 추정치

귀무 가설과 대립 가설

T-값

해석

p-값

해석

DF

해석

합동 표준 편차

해석

합동 표준 편차의 예

개별 값 그림

해석

오른쪽으로 치우침

왼쪽으로 치우침

상자 그림

해석

오른쪽으로 치우침

왼쪽으로 치우침

차이: μ₁ – μ₂