평균 분석에 대한 데이터 고려 사항

유효한 결과를 얻으려면 데이터를 수집하고 분석을 수행하거나 결과를 해석할 때 다음 지침을 따르십시오.

반응 데이터는 정규, 이항 또는 포아송 분포를 따라야 합니다.
  • 정규 분포를 따르는 데이터는 일반적으로 측정 데이터(예: 무게)입니다. 데이터가 정규 분포를 따르는 경우 Minitab에서는 각 그룹의 평균을 전체 평균과 비교합니다.
  • 이항 데이터는 각 관측치를 두 범주(예: 통과/실패) 중 하나로 분류합니다. 이항 데이터의 경우 Minitab에서는 각 표본의 비율을 전체 비율과 비교합니다.
  • 포아송 데이터에는 카운트(예: 단위 또는 표본당 결점 수)가 포함됩니다. 포아송 데이터의 경우 Minitab에서는 각 표본에 대한 발생률을 전체 비율과 비교합니다.
데이터가 정규 분포를 따르면 데이터에 하나 또는 두 개의 범주형 요인이 포함되어야 합니다.
  • 요인이 2개인 평균 분석 설계에는 균형 설계가 있어야 합니다. 균형 설계의 경우 가능한 모든 요인 수준의 조합에 대해 관측치 개수가 같습니다. 설계에 범주형 요인이 두 개 있고 설계가 불균형이면 모두 고정 요인인 경우 일반 선형 모형 적합, 변량 요인이 있는 경우 혼합 효과 모형 적합을 사용하십시오.
  • 설계에 범주형 요인이 세 개 이상 있거나 공변량이 포함되어 있으면 모두 고정 요인인 경우 일반 선형 모형 적합, 변량 요인이 있는 경우 혼합 효과 모형 적합을 사용하십시오.

요인 및 균형 설계에 대한 자세한 내용은 요인 및 요인 수준분산 분석 모형의 균형 및 불균형 설계에서 확인하십시오.

이항 데이터가 있으면 표본 크기가 일정하고 충분히 커야 합니다.
  • 각 표본에 대한 비율과 전체 비율을 제대로 비교하려면 모든 표본이 같은 크기여야 합니다.
  • 결정 한계는 정규 분포를 기반으로 하기 때문에 표본 크기는 정규 분포가 이항 분포를 적절히 근사할 수 있을 만큼 충분히 커야 합니다. 정규 분포는 np > 5이고 n(1 − p) > 5인 경우 적절하며, 여기서 n은 표본 크기이고 p는 사건의 비율입니다.

표본이 이러한 기준을 충족하지 않는 경우 결과가 유효하지 않을 수도 있습니다.

포아송 데이터가 있으면 표본 크기가 일정하고 충분히 커야 합니다.
  • 표본당 비율이 유효하려면 모든 표본이 같은 크기여야 합니다.
  • 결정 한계는 정규 분포를 기반으로 하기 때문에 표본 크기는 정규 분포가 포아송 분포를 적절히 근사할 수 있을 만큼 충분히 커야 합니다. 정규 분포는 평균이 5 이상인 경우 적절합니다.

표본이 이러한 기준을 충족하지 않는 경우 결과가 유효하지 않을 수도 있습니다.

각 관측치가 다른 모든 관측치로부터 독립적이어야 함
관측치가 종속되면 결과가 유효하지 않을 수도 있습니다. 관측치가 독립적인지 여부를 확인하려면 다음과 같은 점을 고려하십시오.
  • 한 관측치가 다른 관측치에 대한 정보를 제공하지 않으면 관측치가 독립적입니다.
  • 한 관측치가 다른 관측치에 대한 정보를 제공하면 관측치가 종속됩니다.
표본 데이터는 랜덤하게 선택해야 합니다.

랜덤 표본은 모집단에 대한 일반화 또는 추론을 작성하기 위해 사용됩니다. 데이터가 랜덤하게 수집되지 않은 경우에는 결과가 모집단을 나타내지 않을 수 있습니다.

최적의 경험을 사용한 데이터 수집
유효한 결과를 얻으려면 다음 지침을 따르십시오.
  • 데이터가 관심 있는 모집단을 나타내는지 확인합니다.
  • 필요한 정밀도를 제공하기에 충분한 데이터를 수집합니다.
  • 최대한 정확하게 변수를 측정합니다.
  • 데이터를 수집된 순서대로 기록합니다.
이 사이트를 사용하면 분석 및 사용자 개인 컨텐츠에 대한 쿠키 사용에 동의하는 것입니다.  당사의 개인정보 보호정책을 확인하십시오