랜덤 표본은 지정한 크기의 모든 표본이 동일하게 발생할 수 있게 하는 공정에서 선택한 모집단의 부분 집합입니다. 통계에서 랜덤 표본을 사용하여 모집단에 대한 일반화 또는 추론을 작성합니다.
그러나 표본을 추출한 모집단을 잘 나타내려면 표본을 랜덤하게 수집해야 합니다. 랜덤 표본이 되도록 데이터 수집 과정을 신중하게 계획해야 합니다. 또한 데이터를 가져오는 과정 또는 모집단이 안정적이어야 합니다.
선택 치우침을 제거하려면 표본이 랜덤 표본이어야 합니다. 선택 치우침은 일부 항목이 다른 항목보다 표본에 포함될 가능성이 높다는 것을 의미합니다. 표본이 치우쳐 있는 경우 전체 모집단이 아니라 표본의 항목에 대해서만 추론할 수 있습니다.
새로운 광고 캠페인을 시작하려고 하지만 인쇄물, 라디오 또는 텔레비전이 고객에게 광고할 수 있는 최상의 방법인지 여부가 불확실하다고 가정합니다. 모든 고객을 조사하는 것이 실용적이거나 비용면에서 효율적이지 않지만 랜덤 표본을 조사하는 것은 가능합니다. 처음에는 쿠폰이 있는 우편 광고물을 반송한 고객만 조사하고자 합니다. 이런 고객이 조사에 응답할 확률이 더 높기 때문입니다. 그러나 이 표본은 각 고객이 선택될 가능성이 같지 않기 때문에 전체 모집단을 나타내지 않습니다. 따라서 잘못된 비즈니스 결정을 내릴 수 있습니다. 대신 모든 고객의 문자순 리스트에서 랜덤으로 고객을 선택하기로 결정합니다. 이 데이터에서 광고 비용을 할당하는 최상의 방법을 결정하기 위해 고객층에 대해 추론할 수 있습니다.
데이터를 수집한 후 데이터가 랜덤 데이터인지 여부를 확인하는 한 가지 방법은 런 검정을 수행하여 데이터에서 시간 경과에 따른 패턴을 확인하는 것입니다. Minitab에서 런 검정을 수행하려면
을 선택하십시오.표본이 랜덤 표본인지 여부를 확인할 수 있는 다른 그래프도 있습니다.
한 면접자가 임의로 30명을 선택하여 각각에게 사지선다형 질문을 한다고 가정합니다. 반응은 0, 1, 2, 3으로 코드화됩니다.