특이치의 정의

특이치는 비정상적으로 크거나 작은 관측치입니다. 특이치는 평균과 같은 통계 결과에 불균형적인 영향을 미칠 수 있으므로, 잘못된 해석이 나올 수 있습니다. 예를 들어, 데이터 집합에 1, 2, 3, 34 값이 포함됩니다. 대부분의 데이터(1, 2, 3)보다 높은 평균 값 10은 극단 데이터 점 34의 영향을 크게 받습니다. 이 경우 평균 값은 데이터 값을 실제 값보다 높게 표시합니다. 특이치가 데이터 또는 공정에 대한 유용한 정보를 제공할 수 있으므로 특이치를 조사해야 합니다. 특이치는 데이터를 그래프로 표시하여 확인하는 것이 가장 쉽습니다.

그래프를 사용하여 특이치 식별

상자 그림에서는 별표(*) 기호를 사용하여 특이치를 표시합니다. 이러한 특이치는 상자의 가장자리에서 사분위수 간 범위(Q3 – Q1)보다 1.5배 이상 떨어진 관측치입니다.

이 상자 그림에는 두 개의 특이치가 있습니다.

산점도에서 다른 점들로부터 멀리 떨어진 점은 특이치일 가능성이 있습니다.

이 산점도에는 특이치일 가능성이 있는 점이 하나 있습니다.

경우에 따라 한 그래프에 표시되는 특이치가 다른 그래프에서 확실하게 나타나지 않기 때문에 두 개 이상의 그래프 유형을 조사해야 합니다. 상자 그림과 히스토그램은 동일한 데이터를 사용합니다. 상자 그림에는 특이치가 표시되지만 히스토그램에는 확실하게 표시되지 않습니다.

특이치의 일반적인 원인

특이치의 일반적인 원인은 다음과 같습니다.
원인 가능한 해결책
데이터 입력 오류 오류를 수정하고 데이터를 다시 분석합니다.
공정 문제 공정을 조사하여 특이치의 원인을 확인합니다.
결측 요인 공정에 영향을 미치는 요인을 고려하지 못했는지 여부를 확인합니다.
랜덤 확률 공정 및 특이치가 우연히 발생했는지 확인합니다. 결과에 미치는 영향을 확인하기 위해 특이치를 사용하거나 사용하지 않고 분석을 수행합니다.
이 사이트를 사용하면 분석 및 사용자 개인 컨텐츠에 대한 쿠키 사용에 동의하는 것입니다.  당사의 개인정보 보호정책을 확인하십시오