두 표본 분산 검정에 대한 모든 통계량 및 그래프 해석

2-표본 분산 분석과 함께 제공되는 모든 통계 및 그래프에 대한 정의 및 해석 방법을 확인해 보십시오.

귀무 가설과 대립 가설

귀무 가설과 대립 가설은 모집단에 대한 서로 배타적인 두 서술문입니다. 가설 검정은 표본 데이터를 사용하여 귀무 가설의 기각 여부를 확인합니다.
귀무 가설
귀무 가설은 모집단 모수(평균, 표준 편차 등)가 귀무 가설에서의 값과 같다는 것입니다. 귀무 가설은 종종 이전 분석 또는 전문 지식을 기반으로 한 초기 주장입니다.
대립 가설
대립 가설은 모집단 모수가 귀무 가설에서의 값보다 작거나 크거나 다르다는 것입니다. 대립 가설은 검정 당사자가 참이라고 믿거나 참으로 증명되기를 바라는 것입니다.

해석

결과에서 귀무 가설과 대립 가설은 귀무 가설에서의 비율에 대해 올바른 값을 입력했는지 확인하는 데 도움이 됩니다.

유의 수준

유의 수준(α 또는 알파로 표시됨)은 귀무 가설이 참일 때 귀무 가설을 기각할 위험(제1종 오류)의 최대 허용 수준입니다. 일반적으로 데이터를 분석하기 전에 유의 수준을 선택합니다. 유의 수준이 1 - 신뢰 수준과 같기 때문에 Minitab에서는 신뢰 수준을 사용하여 유의 수준을 선택할 수 있습니다. Minitab에서는 기본 신뢰 수준이 0.95이기 때문에 기본 유의 수준은 0.05입니다.

해석

귀무 가설(H0)을 기각할지 여부를 결정하려면 유의 수준을 p-값과 비교합니다. p-값이 유의 수준보다 작은 경우, 일반적으로 결과가 통계적으로 유의하다고 해석하고 H0을 기각합니다.

일반적으로 0.05의 유의 수준(α 또는 알파로 표시함)이 적절합니다. 0.05의 유의 수준은 실제로 차이가 없는데 차이가 존재한다는 결론을 내릴 위험이 5%라는 것을 나타냅니다.
  • 존재할 가능성이 있는 차이를 더 확실히 탐지하려면 더 높은 유의 수준(예: 0.10)을 선택하십시오. 예를 들어, 한 품질 엔지니어가 새 볼 베어링의 안정성을 현재 베어링의 안정성과 비교합니다. 불안정한 볼 베어링이 심각한 문제를 일으킬 수 있기 때문에 엔지니어는 새 볼 베어링이 안정적이라는 것을 확인해야 합니다. 엔지니어는 볼 베어링 안정성의 가능한 차이를 더 확실히 탐지하기 위해 0.10의 유의 수준을 선택합니다.
  • 실제로 존재하는 차이만 더 확실히 탐지하려면 더 낮은 유의 수준(예: 0.01)을 선택하십시오. 예를 들어, 한 제약 회사의 과학자는 회사의 새 약품이 증상을 유의하게 완화시킨다는 주장이 참이라는 것을 확인해야 합니다. 과학자는 증상에 유의한 차이가 존재하지 않는다는 것을 더 확실히 확인하기 위해 0.001의 유의 수준을 선택합니다.

N

표본 크기(N)는 표본의 총 관측치 수입니다.

해석

표본 크기는 신뢰 구간 및 검정의 검정력에 영향을 미칩니다.

일반적으로 표본 크기가 클수록 신뢰 구간이 좁아집니다. 또한 표본 크기가 클수록 차이를 탐지하기 위한 검정력이 더 높습니다. 자세한 내용은 검정력의 정의에서 확인하십시오.

표준 편차

표준 편차는 산포, 즉 데이터가 평균을 중심으로 퍼져 있는 정도를 나타내는 가장 일반적인 측도입니다. 모집단의 표준 편차를 나타내는 데는 σ(시그마) 기호를 자주 사용하는 반면, 표본의 표준 편차를 사용하는 데는 s를 사용합니다. 랜덤이 아니거나 공정에 자연스럽지 못한 변동은 종종 잡음이라고 합니다.

표준 편차는 데이터와 동일한 단위를 사용합니다.

해석

각 표본의 표준 편차는 각 모집단 표준 편차의 추정치입니다. Minitab에서는 표준 편차를 사용하여 모집단 표준 편차의 비율을 추정합니다. 이 비율에 집중해야 합니다.

또한 공정의 전체 변동을 추정하기 위한 벤치마크를 설정하기 위해 표준 편차를 사용할 수 있습니다.
병원 1
병원 2
병원 퇴원 시간

관리자들이 두 개 병원의 응급실 부서에서 치료한 환자의 퇴원 시간을 추적하고자 합니다. 평균 퇴원 시간은 동일하지만(35분) 표준 편차는 유의하게 다릅니다. 병원 1의 표준 편차가 약 6이며, 평균적으로 환자의 퇴원 시간은 평균(대시선)에서 약 6분 정도 멀어집니다. 병원 2의 표준 편차는 약 20입니다. 평균적으로 환자의 퇴원 시간은 평균(대시선)에서 약 20분 정도 멀어집니다.

분산

분산은 데이터가 평균 주위에 분산된 정도를 측정합니다. 분산은 표준 편차의 제곱과 같습니다.

해석

각 표본의 분산은 각 모집단 분산의 추정치입니다. Minitab에서는 분산을 사용하여 모집단 분산의 비율을 추정합니다. 이 비율에 집중해야 합니다.

추정된 표준 편차의 비율

표준 편차 비율은 첫 번째 표본의 표준 편차를 두 번째 표본의 표준 편차로 나눈 값입니다.

해석

표본 데이터의 표준 편차에 대한 추정 비율은 모집단 표준 편차의 비율 추정치입니다.

추정 비율은 전체 모집단이 아니라 표본 데이터를 기반으로 하기 때문에 표본 비율이 모집단 비율과 같다고 확신할 수 없습니다. 비율을 더 잘 추정하려면 신뢰 구간을 사용하십시오.

추정된 분산 비율

분산 비율은 첫 번째 표본 분산을 두 번째 표본 분산으로 나눈 값입니다.

해석

표본 데이터의 분산에 대한 추정 비율은 모집단 분산의 비율 추정치입니다.

추정 비율은 전체 모집단이 아니라 표본 데이터를 기반으로 하기 때문에 표본 비율이 모집단 비율과 같다고 확신할 수 없습니다. 비율을 더 잘 추정하려면 신뢰 구간을 사용하십시오.

신뢰 구간(CI) 및 한계

신뢰 구간은 모집단 비율이 될 수 있는 값의 범위를 제공합니다. 표본이 랜덤이기 때문에 모집단의 두 표본에서 동일한 신뢰 구간이 생성될 가능성은 없습니다. 그러나 표본 추출을 여러 번 반복하면 일정한 백분율의 신뢰 구간이나 한계에는 알 수 없는 모집단 비율이 포함됩니다. 비율을 포함하는 이러한 신뢰 구간 또는 한계의 백분율이 해당 구간의 신뢰 수준입니다. 예를 들어, 95% 신뢰 수준은 모집단에서 100개의 랜덤 표본을 추출할 경우 약 95개의 표본에서 모집단 비율이 포함된 구간을 생성할 것으로 예상된다는 것을 나타냅니다.

상한은 모집단 비율이 더 작을 가능성이 높은 값을 정의합니다. 하한은 모집단 비율이 더 클 가능성이 높은 값을 정의합니다.

신뢰 구간은 결과의 실제 유의성을 평가하는 데 도움이 됩니다. 해당 상황에 실제적으로 유의한 값이 신뢰 구간에 포함되는지 여부를 확인하려면 전문 지식을 이용하십시오. 신뢰 구간이 너무 넓어서 유의하지 않은 경우에는 표본 크기를 늘려보십시오. 자세한 내용은 더 정밀한 신뢰 구간을 구하는 방법에서 확인하십시오.

기본적으로 두 표본 분산 검정에서는 Levene의 방법과 Bonett의 방법을 사용한 결과를 표시합니다. 일반적으로 Bonett의 방법이 Levene의 방법보다 신뢰성이 높습니다. 그러나 심하게 치우쳐 있고 두꺼운 꼬리를 가진 분포의 경우, 일반적으로 Levene의 방법이 Bonett의 방법보다 신뢰성이 높습니다. 데이터가 확실히 정규 분포를 따르는 경우에만 F-검정을 사용하십시오. 정규성에서 조금 벗어나도 F-검정 결과에 크게 영향을 미칠 수 있습니다. 자세한 내용은 두 표본 분산 검정을 할 때 Bonett의 방법과 Levene의​ 방법 중 어떤 방법을 사용해야 합니까?에서 확인하십시오.

표준 편차의 비율 Bonett을 Levene을 사용한 사용한 비율에 대한 비율에 대한 추정 비율 95% CI 95% CI 0.658241 (0.372, 1.215) (0.378, 1.296)

이 결과에서 두 병원의 등급에 대한 표준 편차의 모집단 비율 추정치는 0.658입니다. Bonett의 방법을 사용하여 병원 등급에 대한 표준 편차의 모집단 비율이 0.372와 1.215 사이에 있다고 95% 확신할 수 있습니다.

DF

자유도(DF)는 알 수 없는 모집단 모수의 값을 추정하고 이러한 추정치의 변동성을 계산하는 데 "사용"할 수 있는 데이터가 제공하는 정보 양입니다. 2-표본 분산 검정의 경우 자유도는 표본의 관측치 수에 따라 결정되며 Minitab에서 사용하는 방법에 따라 다릅니다.

해석

Minitab에서는 검정 통계량을 계산하기 위해 자유도를 사용합니다. 자유도는 표본 크기에 따라 결정됩니다. 표본 크기를 증가시키면 모집단에 대한 더 많은 정보가 제공되므로, 자유도가 증가합니다.

Bonett의 방법에 대한 검정 통계량

Minitab에서 신뢰 구간을 거꾸로 하여 Bonett의 방법을 위해 계산하는 검정 통계량입니다. 요약 데이터나 균형을 이루지 않는 데이터에는 Bonett의 방법을 위한 검정 통계량을 사용할 수 없습니다.

해석

검정 통계량을 카이-제곱 분포의 임계값과 비교하여 귀무 가설의 기각 여부를 확인할 수 있습니다. 그러나 일반적으로 검정의 p-값을 사용하여 결정을 내리는 것이 더 실제적이고 편리합니다. 검정 크기에 관계없이 p-값은 동일한 의미를 갖지만, 표본 크기에 따라 동일한 카이-제곱 통계량이 반대의 결론을 나타낼 수 있습니다.

귀무 가설의 기각 여부를 확인하려면 검정 통계량을 임계값과 비교하십시오. Minitab에서 임계값을 계산하거나 대부분의 통계 서적에 있는 카이-제곱 표에서 임계값을 찾을 수 있습니다. 자세한 내용을 보려면 역 누적분포함수(ICDF) 사용에서 "ICDF를 사용하여 임계값 계산"을 클릭하십시오.
  • 양측 검정의 경우 임계값은 입니다. 검정 통계량이 첫 번째 값보다 작거나 두 번째 값보다 크면 귀무 가설을 기각합니다. 검정 통계량이 첫 번째 값과 두 번째 값 사이에 있으면 귀무 가설을 기각할 수 없습니다.
  • 보다 작음 대립 가설의 단측 검정의 경우 임계값은 입니다. 검정 통계량이 임계값보다 작으면 귀무 가설을 기각합니다. 그렇지 않으면 귀무 가설을 기각할 수 없습니다.
  • 보다 큼 단측 검정의 경우 임계값은 입니다. 검정 통계량이 임계값보다 크면 귀무 가설을 기각합니다. 그렇지 않으면 귀무 가설을 기각할 수 없습니다.

검정 통계량은 p-값을 계산하기 위해 사용됩니다.

Levene의 방법에 대한 검정 통계량

검정에서는 관측치의 절대 중위수 편차에 적용된 일원 분산 분석 F-통계량을 사용합니다. 따라서 Levene의 방법을 적용하는 것은 관측치의 절대 중위수 편차에 일원 분산 분석 절차를 적용하는 것과 같습니다. 또한 2-표본 문제의 경우 이 방법은 관측치의 절대 중위수 편차에 2-표본 t 절차를 적용하는 것과 같습니다.

해석

검정 통계량을 F-분포의 임계값과 비교하여 귀무 가설의 기각 여부를 확인할 수 있습니다. 그러나 일반적으로 검정의 p-값을 사용하여 결정을 내리는 것이 더 실제적이고 편리합니다.

귀무 가설의 기각 여부를 확인하려면 검정 통계량을 임계값과 비교하십시오. Minitab에서 임계값을 계산하거나 대부분의 통계 서적에 있는 F-분포 표에서 임계값을 찾을 수 있습니다. 자세한 내용을 보려면 역 누적분포함수(ICDF) 사용에서 "ICDF를 사용하여 임계값 계산"을 클릭하십시오.
  • 양측 검정의 경우 임계값은 입니다. 검정 통계량이 첫 번째 값보다 작거나 두 번째 값보다 크면 귀무 가설을 기각합니다. 검정 통계량이 첫 번째 값과 두 번째 값 사이에 있으면 귀무 가설을 기각할 수 없습니다.
  • 보다 작음 대립 가설의 단측 검정의 경우 임계값은 입니다. 검정 통계량이 임계값보다 작으면 귀무 가설을 기각합니다. 그렇지 않으면 귀무 가설을 기각할 수 없습니다.
  • 보다 큼 단측 검정의 경우 임계값은 입니다. 검정 통계량이 임계값보다 크면 귀무 가설을 기각합니다. 그렇지 않으면 귀무 가설을 기각할 수 없습니다.

검정 통계량은 p-값을 계산하기 위해 사용됩니다.

F 검정에 대한 검정 통계량

관측된 분산 사이의 비율을 측정하는 F-검정을 위한 검정 통계량입니다.

해석

검정 통계량을 F-분포의 임계값과 비교하여 귀무 가설의 기각 여부를 확인할 수 있습니다. 그러나 일반적으로 검정의 p-값을 사용하여 결정을 내리는 것이 더 실제적이고 편리합니다.

귀무 가설의 기각 여부를 확인하려면 (귀무 가설 하에서) 관측된 검정 통계량 값을 임계값과 비교하십시오. Minitab에서 임계값을 계산하거나 대부분의 통계 서적에 있는 F-분포 표에서 임계값을 찾을 수 있습니다. 자세한 내용을 보려면 역 누적분포함수(ICDF) 사용에서 "ICDF를 사용하여 임계값 계산"을 클릭하십시오.
  • 양측 검정의 경우 임계값은 입니다. 검정 통계량이 첫 번째 값보다 작거나 두 번째 값보다 크면 귀무 가설을 기각합니다. 검정 통계량이 첫 번째 값과 두 번째 값 사이에 있으면 귀무 가설을 기각할 수 없습니다.
  • 보다 작음 대립 가설의 단측 검정의 경우 임계값은 입니다. 검정 통계량이 임계값보다 작으면 귀무 가설을 기각합니다. 그렇지 않으면 귀무 가설을 기각할 수 없습니다.
  • 보다 큼 단측 검정의 경우 임계값은 입니다. 검정 통계량이 임계값보다 크면 귀무 가설을 기각합니다. 그렇지 않으면 귀무 가설을 기각할 수 없습니다.

검정 통계량은 p-값을 계산하기 위해 사용됩니다.

p-값

p-값은 귀무 가설에 반하는 증거를 측정하는 확률입니다. p-값이 작을수록 귀무 가설에 반하는 더 강력한 증거가 됩니다.

해석

모집단 표준 편차 또는 분산의 차이가 통계적으로 유의한지 여부를 확인하려면 p-값을 사용하십시오.

모집단 표준 편차 또는 분산 간의 차이가 통계적으로 유의한지 여부를 확인하려면 p-값을 유의 수준과 비교하십시오. 일반적으로 0.05의 유의 수준(α 또는 알파로 표시함)이 적절합니다. 0.05의 유의 수준은 실제로 차이가 없는데 차이가 존재한다는 결론을 내릴 위험이 5%라는 것을 나타냅니다.
p-값 ≤ α: 표준 편차 또는 분산의 비율이 통계적으로 유의함(H0 기각)
p-값이 유의 수준보다 작거나 같으면 귀무 가설을 기각합니다. 모집단 표준 편차 또는 분산의 비율이 귀무 가설에서의 비율과 같지 않다는 결론을 내릴 수 있습니다. 귀무 가설에서의 비율을 지정하지 않은 경우 Minitab에서는 표준 편차 또는 분산 간에 차이가 없는지 여부(귀무 가설에서의 비율 = 1)를 검정합니다. 차이가 실제로 유의한지 여부를 확인하려면 전문 지식을 활용합니다. 자세한 내용은 통계적 유의성 및 실제적 유의성에서 확인하십시오.
p-값 > α: 분산 또는 표준 편차의 비율이 통계적으로 유의하지 않음(H0 기각 실패)
p-값이 유의 수준보다 크면 귀무 가설을 기각할 수 없습니다. 모집단 표준 편차 또는 분산의 비율이 통계적으로 유의하다는 결론을 내릴 충분한 증거가 없습니다. 검정에 실제로 유의한 차이를 탐지할 만한 충분한 검정력이 있는지 확인해야 합니다. 자세한 내용은 두 표본 분산에 대한 검정력 및 표본 크기에서 확인하십시오.
기본적으로 두 표본 분산 검정에서는 Levene의 방법과 Bonett의 방법에 대한 p-값을 표시합니다. 정규 분포에 대한 검정을 사용하는 경우 Minitab에서는 F-검정에 대한 p-값을 표시합니다. 다음과 같이 데이터 분포의 속성에 대한 검정을 선택하십시오.
  • Bonett의 검정은 모든 계량형 분포에 대해 정확하며 데이터가 정규 분포를 따르지 않아도 됩니다. Bonett의 검정은 일반적으로 Levene의 검정보다 신뢰성이 높습니다.
  • Levene의 검정 역시 모든 계량형 분포에 대해 정확합니다. 심하게 치우쳐 있고 두꺼운 꼬리를 가진 분포의 경우, Levene의 방법이 Bonett의 방법보다 신뢰성이 높은 경향이 있습니다.
  • F-검정은 정규 분포 데이터에 대해서만 정확합니다. 정규성에서 조금만 벗어나면 큰 표본의 경우에도 F-검정이 부정확할 수 있습니다. 그러나 데이터가 정규 분포를 따르는 경우 일반적으로 F-검정이 Bonett의 검정이나 Levene의 검정보다 강력합니다.

자세한 내용은 두 표본 분산 검정을 할 때 Bonett의 방법과 Levene의​ 방법 중 어떤 방법을 사용해야 합니까?에서 확인하십시오.

요약도

요약도는 비율에 대한 신뢰 구간 및 각 표본의 표준 편차 또는 분산에 대한 신뢰 구간을 보여줍니다. 요약도는 또한 표본 데이터의 상자 그림 및 가설 검정에 대한 p-값을 보여줍니다.

신뢰 구간

신뢰 구간은 모집단 비율이 될 수 있는 값의 범위를 제공합니다. 표본이 랜덤이기 때문에 모집단의 두 표본에서 동일한 신뢰 구간이 생성될 가능성은 없습니다. 그러나 표본 추출을 여러 번 반복하면 일정한 백분율의 신뢰 구간이나 한계에는 알 수 없는 모집단 비율이 포함됩니다. 비율을 포함하는 이러한 신뢰 구간 또는 한계의 백분율이 해당 구간의 신뢰 수준입니다. 예를 들어, 95% 신뢰 수준은 모집단에서 100개의 랜덤 표본을 추출할 경우 약 95개의 표본에서 모집단 비율이 포함된 구간을 생성할 것으로 예상된다는 것을 나타냅니다.

상한은 모집단 비율이 더 작을 가능성이 높은 값을 정의합니다. 하한은 모집단 비율이 더 클 가능성이 높은 값을 정의합니다.

해석

신뢰 구간은 결과의 실제 유의성을 평가하는 데 도움이 됩니다. 해당 상황에 실제적으로 유의한 값이 신뢰 구간에 포함되는지 여부를 확인하려면 전문 지식을 이용하십시오. 신뢰 구간이 너무 넓어서 유의하지 않은 경우에는 표본 크기를 늘려보십시오. 자세한 내용은 더 정밀한 신뢰 구간을 구하는 방법에서 확인하십시오.

기본적으로 두 표본 분산 검정에서는 Levene의 방법과 Bonett의 방법을 사용한 결과를 표시합니다. 일반적으로 Bonett의 방법이 Levene의 방법보다 신뢰성이 높습니다. 그러나 심하게 치우쳐 있고 두꺼운 꼬리를 가진 분포의 경우, 일반적으로 Levene의 방법이 Bonett의 방법보다 신뢰성이 높습니다. 데이터가 확실히 정규 분포를 따르는 경우에만 F-검정을 사용하십시오. 정규성에서 조금 벗어나도 F-검정 결과에 크게 영향을 미칠 수 있습니다. 자세한 내용은 두 표본 분산 검정을 할 때 Bonett의 방법과 Levene의​ 방법 중 어떤 방법을 사용해야 합니까?에서 확인하십시오.

상자 그림

상자 그림은 각 표본 분포의 그래픽 요약을 제공합니다. 상자 그림을 사용하면 표본의 모양, 중심 위치 및 변동성을 쉽게 비교할 수 있습니다.

해석

데이터의 산포를 평가하고 잠재적 특이치를 식별하려면 상자 그림을 사용합니다. 상자 그림은 표본 크기가 20보다 클 때 가장 적합합니다.

치우친 데이터

데이터가 치우쳐 있는 것으로 보이는지 여부를 확인하려면 데이터의 산포를 조사합니다. 데이터가 치우쳐 있으면 대부분의 데이터가 그래프의 높은 쪽이나 낮은 쪽에 위치합니다. 일반적으로 히스토그램이나 상자 그림에서 왜도를 탐지하기가 가장 쉽습니다.

오른쪽으로 치우침
왼쪽으로 치우침

오른쪽으로 치우친 데이터의 상자 그림은 대기 시간을 보여줍니다. 대부분의 대기 시간이 비교적 짧고 몇 개의 대기 시간만 깁니다. 왼쪽으로 치우친 데이터의 상자 그림은 수명 데이터를 보여줍니다. 몇 개의 품목이 즉시 고장나고 더 많은 품목이 나중에 고장납니다.

심하게 치우친 데이터는 표본이 작은 경우(각 표본이 20보다 작은 값) p-값의 유효성에 영향을 미칠 수 있습니다. 데이터가 심하게 치우쳐 있고 표본이 작은 경우 표본 크기를 늘리는 것을 고려해 보십시오.

특이치

다른 데이터 값에서 멀리 떨어져 있는 데이터 값인 특이치는 분석 결과에 크게 영향을 미칠 수 있습니다. 일반적으로 상자 그림에서 특이치를 식별하기가 가장 쉽습니다.

상자 그림에서는 별표(*)가 특이치를 나타냅니다.

특이치의 원인을 식별합니다. 모든 데이터 입력 오류 또는 측정 오류를 수정합니다. 비정상적인 일회성 사건에 대한 데이터 값을 삭제합니다(특수 원인이라고도 함). 그런 다음 분석을 반복합니다. 자세한 내용은 특이치 식별에서 확인하십시오.

개별 값 그림

개별 값 그림은 각 표본 내 개별 값을 표시합니다. 개별 값 그림을 사용하면 표본을 쉽게 비교할 수 있습니다. 각 원은 관측치 하나를 나타냅니다. 개별 값 그림은 관측치 수가 비교적 적고 각 관측치의 영향도 평가해야 하는 경우 특히 유용합니다.

해석

데이터의 산포를 평가하고 잠재적 특이치를 식별하려면 개별 값 그림을 사용합니다. 개별 값 그림은 표본 크기가 50보다 작을 때 가장 적합합니다.

치우친 데이터

데이터가 치우쳐 있는 것으로 보이는지 여부를 확인하려면 데이터의 산포를 조사합니다. 데이터가 치우쳐 있으면 대부분의 데이터가 그래프의 높은 쪽이나 낮은 쪽에 위치합니다. 일반적으로 히스토그램이나 상자 그림에서 왜도를 탐지하기가 가장 쉽습니다.

오른쪽으로 치우침
왼쪽으로 치우침

오른쪽으로 치우친 데이터의 개별 값 그림은 대기 시간을 보여줍니다. 대부분의 대기 시간이 비교적 짧고 몇 개의 대기 시간만 깁니다. 왼쪽으로 치우친 데이터의 개별 값 그림은 수명 데이터를 보여줍니다. 몇 개의 품목이 즉시 고장나고 더 많은 품목이 나중에 고장납니다.

심하게 치우친 데이터는 표본이 작은 경우(각 표본이 20보다 작은 값) p-값의 유효성에 영향을 미칠 수 있습니다. 데이터가 심하게 치우쳐 있고 표본이 작은 경우 표본 크기를 늘리는 것을 고려해 보십시오.

특이치

다른 데이터 값에서 멀리 떨어져 있는 데이터 값인 특이치는 분석 결과에 크게 영향을 미칠 수 있습니다. 일반적으로 상자 그림에서 특이치를 식별하기가 가장 쉽습니다.

개별 값 그림에서는 비정상적으로 낮거나 높은 데이터 값이 가능한 특이치를 나타냅니다.

특이치의 원인을 식별합니다. 모든 데이터 입력 오류 또는 측정 오류를 수정합니다. 비정상적인 일회성 사건에 대한 데이터 값을 삭제합니다(특수 원인이라고도 함). 그런 다음 분석을 반복합니다. 자세한 내용은 특이치 식별에서 확인하십시오.

히스토그램

히스토그램은 표본 값을 여러 구간으로 나누고 각 구간 내 데이터 값의 빈도를 막대로 나타냅니다.

해석

데이터의 모양과 산포를 평가하려면 히스토그램을 사용합니다. 히스토그램은 표본 크기가 20보다 클 때 가장 적합합니다.

치우친 데이터

데이터가 치우쳐 있는 것으로 보이는지 여부를 확인하려면 데이터의 산포를 조사합니다. 데이터가 치우쳐 있으면 대부분의 데이터가 그래프의 높은 쪽이나 낮은 쪽에 위치합니다. 일반적으로 히스토그램이나 상자 그림에서 왜도를 탐지하기가 가장 쉽습니다.

오른쪽으로 치우침
왼쪽으로 치우침

오른쪽으로 치우친 데이터의 히스토그램은 대기 시간을 보여줍니다. 대부분의 대기 시간이 비교적 짧고 몇 개의 대기 시간만 깁니다. 왼쪽으로 치우친 데이터의 히스토그램은 수명 데이터를 보여줍니다. 몇 개의 품목이 즉시 고장나고 더 많은 품목이 나중에 고장납니다.

심하게 치우친 데이터는 표본이 작은 경우(각 표본이 20보다 작은 값) p-값의 유효성에 영향을 미칠 수 있습니다. 데이터가 심하게 치우쳐 있고 표본이 작은 경우 표본 크기를 늘리는 것을 고려해 보십시오.

특이치

다른 데이터 값에서 멀리 떨어져 있는 데이터 값인 특이치는 분석 결과에 크게 영향을 미칠 수 있습니다. 일반적으로 상자 그림에서 특이치를 식별하기가 가장 쉽습니다.

히스토그램에서는 그래프 양쪽 끝의 고립된 막대가 가능한 특이치를 나타냅니다.

특이치의 원인을 식별합니다. 모든 데이터 입력 오류 또는 측정 오류를 수정합니다. 비정상적인 일회성 사건에 대한 데이터 값을 삭제합니다(특수 원인이라고도 함). 그런 다음 분석을 반복합니다. 자세한 내용은 특이치 식별에서 확인하십시오.

이 사이트를 사용하면 분석 및 사용자 개인 컨텐츠에 대한 쿠키 사용에 동의하는 것입니다.  당사의 개인정보 보호정책을 확인하십시오