개요

통계학이란 데이터를 수집, 요약, 분석하고 결과를 해석할 수 있는 원리와 방법을 제시하는 학문입니다. 통계학을 사용하여 데이터를 설명하고 추론할 수 있습니다. 그런 다음 추론을 사용하여 공정과 제품을 개선할 수 있습니다.

Minitab은 회귀 분석, 분산 분석, 품질 도구, 시계열 등 많은 통계 분석을 제공합니다. 빌트-인 그래프는 데이터를 시각화하고 결과를 검증하는 데 도움이 됩니다. Minitab을 이용하여 통계량 및 진단 측도를 표시하고 저장할 수도 있습니다.

이 장에서는 지연 주문과 이월 주문의 수를 평가하고 세 물류 센터 간의 배송 시간 차이가 통계적으로 유의한지 여부를 검정합니다.

데이터 요약

기술 통계량은 데이터의 중요한 특징을 요약하고 기술합니다. 각 물류 센터에서 정시에 배송한 도서 주문 수, 지연된 도서 주문 수, 초기에 이월 주문된 도서 주문 수를 확인하려면 기술 통계량 표시를 사용하십시오.

기술 통계량 표시

  1. 표본 데이터배송데이터.MTW을(를) 엽니다.
  2. 통계분석 > 기초 통계 > 기술 통계량 표시을 선택합니다.
  3. 변수일 수를 입력합니다.
  4. 기준 변수(옵션)센터 상태를 입력합니다.
    대부분의 Minitab 명령은 주 대화 상자에만 정보를 입력해도 명령을 실행할 수 있습니다. 분석을 수정하거나 다른 출력 항목(예: 그래프)을 표시하기 위해 하위 대화 상자를 자주 사용합니다.
  5. 통계량을 클릭합니다.
  6. 제1 사분위수, 중위수, 제3 사분위수, 비결측값 개수결측값 개수를 선택 취소합니다.
  7. 관측치 개수을 선택합니다.
  8. 각 대화 상자에서 확인을 클릭합니다.
    참고

    통계량 하위 대화 상자의 변경 사항은 현재 세션에만 적용됩니다. 이후 세션에 대한 기본 옵션을 변경하려면 도구 > 옵션을 선택합니다. 개별 명령를 확장하고 기술 통계량 표시를 선택합니다. 표시하려는 통계량을 선택합니다. 통계량 하위 대화 상자를 다시 열 때 새 옵션이 표시됩니다.

기술 통계량: 일 수

센터 = 중부에 대한 결과

통계량 전체 평균의 변수 상태 카운트 평균 표준 오차 표준 편차 최소값 최대값 일 수 이월 주문 6 * * * * * 지연 6 6.431 0.157 0.385 6.078 7.070 정각 93 3.826 0.119 1.149 1.267 5.983

센터 = 동부에 대한 결과

통계량 전체 평균의 변수 상태 카운트 평균 표준 오차 표준 편차 최소값 최대값 일 수 이월 주문 8 * * * * * 지연 9 6.678 0.180 0.541 6.254 7.748 정각 92 4.234 0.112 1.077 1.860 5.953

센터 = 서부에 대한 결과

통계량 전체 평균의 변수 상태 카운트 평균 표준 오차 표준 편차 최소값 최대값 일 수 이월 주문 3 * * * * * 정각 102 2.981 0.108 1.090 0.871 5.681
참고

세션 창에는 Microsoft Word 및 Microsoft PowerPoint로 보낼 수 있는 텍스트 출력이 표시됩니다. PowerPoint로 텍스트 출력을 보내는 데 대한 자세한 내용은 Minitab의 결과 표시에서 확인하십시오.

결과 해석

세션 창에는 각 물류 센터의 결과가 개별적으로 표시됩니다. 각 물류 센터 결과의 전체 카운트 열에서 이월 주문, 지연 배송된 주문 및 일정에 맞게 배송된 주문 수를 확인할 수 있습니다.

  • 동부 물류 센터의 이월 주문 수(8)와 지연 주문 수(9)가 가장 많습니다.
  • 그 다음으로 중부 물류 센터의 이월 주문 수(6)와 지연 주문 수(6)가 많습니다.
  • 서부 물류 센터의 경우 이월 주문 수(3)가 가장 적고 지연 배송된 주문은 없습니다.

세션 창 결과에는 각 물류 센터의 배송 시간(일수)의 평균, 평균의 표준오차, 표준 편차, 최소값, 최대값 등이 있습니다. 이월 주문의 경우에는 이런 통계량이 존재하지 않습니다.

두 개 이상의 평균 비교

통계 분석에서 가장 일반적으로 사용되는 방법은 가설 검정입니다. Minitab에서는 t 검정과 분산 분석 등 다양한 가설 검정을 제공합니다. 일반적으로 가설 검정을 수행하는 경우 초기 주장을 참이라고 가정한 후 표본 데이터를 사용하여 그 주장을 검정합니다.

가설 검정에는 두 개의 가설(주장)인 귀무 가설(H0) 및 대립 가설(H1)이 포함됩니다. 귀무 가설은 초기 주장이며, 대부분 이전에 수행된 연구 또는 상식을 바탕으로 지정됩니다. 대립 가설은 검정을 수행하는 사람이 참일 수 있다고 믿는 주장입니다.

앞 장의 그래픽 분석과 위의 기술 통계량 분석 결과에 따라 각 물류 센터에 대한 평균 배송일 수의 차이가 통계적으로 유의할 것으로 예상합니다. 이를 확인하기 위해 일원 분산 분석을 수행하여 두 개 이상의 평균이 동일한지 여부를 검정합니다. 또한 Tukey의 다중 비교 검정을 수행하여 어떤 물류 센터의 평균이 다른 지도 확인할 수 있습니다. 일원 분산 분석의 경우 배송일 수가 반응이고 물류 센터가 요인입니다.

분산 분석 수행

  1. 통계분석 > 분산 분석 > 일원 분산 분석을 선택합니다.
  2. 반응 데이터가 모든 요인 수준에 대해 별도의 열에 있음을 선택합니다.
  3. 반응 변수일 수를 입력합니다. 요인센터를 입력합니다.
  4. 비교을 클릭합니다.
  5. 분산이 같다고 가정하는 비교 절차에서 Tukey을 선택합니다.
  6. 확인을 클릭합니다.
  7. 그래프을 클릭합니다. 대부분의 통계 명령에 대해 Minitab에는 결과를 해석하고 통계적 가정의 타당성을 평가하는 데 유용한 그래프가 있습니다. 이러한 그래프를 빌트-인 그래프라고 합니다.
  8. 데이터 그림에서 구간 그림, 개별 값 그림상자 그림을 선택합니다.
  9. 잔차 그림에서 네 개 모두을 선택합니다.
  10. 각 대화 상자에서 확인을 클릭합니다.

일원 분산 분석: 일 수 대 센터

방법 귀무 가설 모든 평균이 동일합니다. 대립 가설 평균이 모두 같지 않음 유의 수준 α = 0.05 사용되지 않은 행 17 분석을 위해 분산이 같다고 가정되었습니다.
요인 정보 요인 수준 값 센터 3 중부, 동부, 서부
분산 분석 출처 DF Adj SS Adj MS F-값 P-값 센터 2 114.6 57.317 39.19 0.000 오차 299 437.3 1.462 총계 301 551.9
모형 요약 S R-제곱 R-제곱(수정) R-제곱(예측) 1.20933 20.77% 20.24% 19.17%
평균 센터 N 평균 표준 편차 95% CI 중부 99 3.984 1.280 (3.745, 4.223) 동부 101 4.452 1.252 (4.215, 4.689) 서부 102 2.981 1.090 (2.746, 3.217) 합동 표준 편차 = 1.20933

Tukey 쌍별 비교

Tukey의 방법 및 95% 신뢰 구간을 사용한 그룹화 정보 센터 N 평균 그룹화 동부 101 4.452 A 중부 99 3.984 B 서부 102 2.981 C 문자를 공유하지 않는 평균들은 유의하게 서로 다릅니다.

세션 창 결과 해석

귀무 가설이 실제로 참인데 귀무 가설을 잘못 기각할 확률을 나타내는 p-값에 따라 가설을 결정할 수 있습니다.

  • p-값이 사전에 결정된 유의 수준(알파 또는 α로 표시함)보다 작거나 같으면 귀무 가설을 기각하고 대립 가설을 채택합니다.
  • p-값이 α보다 크면 귀무 가설을 기각하지 못하며 대립 가설을 채택할 수 없습니다.

α가 0.05인 경우 분산 분석 표의 p-값(0.00)은 물류 센터의 평균 배송 시간이 둘 이상 유의하게 서로 다르다는 결론을 내릴 수 있는 충분한 증거를 제공합니다.

Tukey 검정 결과는 유의한 비교와 유의하지 않은 비교를 강조 표시하는 그룹화 정보 표에 있습니다. 각 물류 센터가 다른 그룹에 있는 경우 모든 물류 센터의 평균 배송 시간이 유의하게 서로 다릅니다.

분산 분석 그래프

분산 분석 그래프 해석

Minitab에서는 다음과 같은 그래프를 출력합니다.
  • 네 개 모두 잔차 그림
  • 구간 그림
  • 개별 값 그림
  • 상자 그림
  • Tukey 95% 신뢰 구간 그림

먼저 잔차 그림을 조사합니다. 그런 다음 구간 그림, 개별 값 그림 및 상자 그림을 함께 조사하여 평균의 동일성을 평가합니다. 마지막으로 Tukey 95% 신뢰 구간을 조사하여 통계적 유의성을 확인합니다.

잔차 그림 해석

다음과 같이 잔차 그림을 다양한 통계 명령과 함께 사용하여 통계적 가정을 확인할 수 있습니다.
정규 확률도
이 그림을 사용하여 비정규성을 탐지할 수 있습니다. 점들이 거의 직선을 이루면 잔차가 정규 분포를 따른다는 의미입니다.
히스토그램
이 그림을 사용하여 여러 개의 정점, 특이치 및 비정규성을 탐지할 수 있습니다. 대칭이면서 종 모양에 가까운 정규 히스토그램이면 좋습니다.
대 적합치
이 그림에서 분산이 일정하지 않은지, 고차항이 누락되었는지, 특이치가 있는 지를 탐지할 수 있습니다. 잔차가 0주위에 랜덤하게 흩어져 있으면 좋습니다.
대 순서
이 그림에서 잔차가 시간에 따라 종속적인 지를 탐지할 수 있습니다. 잔차에 아무런 패턴이 없으면 좋습니다.

배송 데이터의 경우, 네 개 모두 잔차 그림을 보면 통계적 가정을 위반하지 않았음을 알 수 있습니다. 일원 분산 분석 모형이 데이터를 비교적 잘 적합합니다.

참고

Minitab에서는 각 잔차 그림을 개별 페이지에 표시할 수 있습니다.

구간 그림, 개별 값 그림 및 상자 그림 해석

구간 그림, 개별 값 그림, 상자 그림을 살펴봅니다. 각 그래프는 앞 장의 히스토그램과 마찬가지로 배송 시간이 물류 센터별로 다르다는 것을 나타냅니다. 동부 물류 센터의 상자 그림에는 별표가 있습니다. 별표는 특이치를 나타냅니다. 이 특이치는 배송 시간이 비정상적으로 긴 주문입니다.

구간 그림을 다시 살펴봅니다. 구간 그림에는 각 평균에 대한 95% 신뢰 구간이 표시됩니다. 평균을 보려면 그래프의 점 위에 커서를 놓습니다. 95% 신뢰 구간을 보려면 구간 막대 위에 커서를 놓습니다. 구간 그림은 서부 물류 센터의 평균 배송 시간(2.981일)이 가장 짧고 신뢰 구간이 2.75~3.22일이라는 것을 보여줍니다.

Tukey 95% 신뢰 구간 그림 해석

Tukey 95% 신뢰 구간 그림은 차이가 포함될 가능성이 있는 범위를 파악하고 이러한 차이의 실제 유의성을 평가하는 데 사용할 수 있는 가장 적합한 그래프입니다. Tukey 신뢰 구간은 다음과 같은 쌍 비교를 나타냅니다.
  • 동부 물류 센터 평균 빼기 중부 물류 센터 평균
  • 서부 물류 센터 평균 빼기 중부 물류 센터 평균
  • 서부 물류 센터 평균 빼기 동부 물류 센터 평균

중간, 상한 및 하한 추정치를 보려면 그래프의 점 위에 포인터를 놓으십시오. 동부 빼기 중부 비교에 대한 구간은 0.068 ~ 0.868입니다. 즉, 동부 물류 센터의 평균 배송 시간 빼기 중부 물류 센터의 평균 배송 시간이 0.068과 0.868일 사이입니다. 동부 물류 센터의 배송이 중부 물류 센터의 배송보다 유의하게 오래 걸립니다. 다른 Tukey 신뢰 구간도 비슷하게 해석합니다. 또한 0 위치의 점선에도 유의하십시오. 구간에 0이 포함되지 않은 경우 해당 평균은 유의하게 서로 다릅니다. 따라서 모든 물류 센터의 평균 배송 시간은 유의하게 다릅니다.

주요 결과 활용

일원 분산 분석, 특히 Tukey의 다중 비교 방법을 해석하는 방법에 대해 자세히 알아보려고 합니다. Minitab을 통해 대부분의 통계 명령에 대한 세션 창 결과 정보를 참조할 수 있습니다.

  1. 일원 분산 분석 세션 창 결과의 원하는 위치에 커서를 놓습니다.
  2. 표준 도구 모음에서 도움말 단추를 클릭합니다 .

프로젝트 저장

모든 작업 내용을 Minitab 프로젝트에 저장합니다.

  1. 파일 > 다른 이름으로 프로젝트 저장을 선택합니다.
  2. 파일을 저장할 폴더로 이동합니다.
  3. 파일 이름내 통계량을 입력합니다.
  4. 저장을 클릭합니다.

Minitab의 Project Manager 사용

이제 Minitab 프로젝트에는 한 개의 워크시트와 몇 개의 그래프, 세션 창의 분석 결과가 있습니다. Project Manager를 사용하면 Minitab 프로젝트의 각 부분을 탐색하거나 검토하고 편집할 수 있습니다.

Project Manager를 사용하여 방금 수행한 통계 분석을 검토하려 합니다.

세션 창 결과 보기

Project Manager를 사용하여 일원 분산 분석 세션 창 결과를 검토할 수 있습니다.

  1. Project Manager 도구 모음에서 세션 폴더 표시 단추를 클릭합니다..
  2. 왼쪽 창에서 일원 분산 분석: 일 수 대 센터를 두 번 클릭합니다.

Project Manager의 오른쪽 창에 일원 분산 분석 세션 창 결과가 표시됩니다.

그래프 보기

상자 그림을 다시 볼 수 있습니다. 세션 폴더의 일 수 상자 그림을 두 번 클릭하거나 도구 모음의 그래프 폴더 표시 단추를 클릭합니다.

  1. Project Manager 도구 모음에서 그래프 폴더 표시 단추를 클릭합니다 .
  2. 왼쪽 창에서 일 수 상자 그림을 두 번 클릭합니다.

Project Manager의 그래프 창에 상자 그림이 표시됩니다.

다음 장 내용

기술 통계량 및 분산 분석 결과를 보면 서부 물류 센터에서 지연 배송된 주문 및 이월 주문 수가 가장 적고, 배송 시간도 가장 짧다는 것을 알 수 있습니다. 다음 장에서는 관리도를 만들고 공정 능력 분석을 수행하여 시간 경과에 따라 서부 물류 센터의 공정이 안정적인지 그리고 지정된 규격 내에서 운영되는지 여부를 조사합니다.

이 사이트를 사용하면 분석 및 사용자 개인 컨텐츠에 대한 쿠키 사용에 동의하는 것입니다.  당사의 개인정보 보호정책을 확인하십시오