데이터를 그래프로 표시

개요

통계 분석을 수행하기 전에 그래프를 사용하여 데이터를 조사하고 변수 사이의 관계를 평가할 수 있습니다. 또한 그래프를 사용하여 데이터를 요약하고 통계적 결과도 해석할 수 있습니다.

Minitab의 그래프는 그래프통계분석 메뉴를 통해 액세스할 수 있습니다. 결과를 해석하고 통계적 가정의 타당성을 평가하는 데 유용한 빌트-인 그래프를 다양한 통계 명령과 함께 사용할 수도 있습니다.

Minitab 그래프에는 다음과 같은 기능이 있습니다.
  • 그래프 유형을 선택하는 데 유용한 그림 갤러리
  • 유연한 그래프 사용자 정의
  • 사용자가 변경할 수 있는 그래프 요소
  • 자동으로 업데이트되는 옵션

이 장에서는 앞 장에서 사용한 배송 데이터 워크시트에 대해 살펴봅니다. 그래프를 사용하여 정규성을 확인하고, 평균을 비교하고, 변동성을 조사하고, 변수 사이의 관계를 조사합니다.

Minitab 그래프에 대한 자세한 내용은 도움말 및 방법 개요에서 확인하십시오. 왼쪽 탐색 메뉴에서 그래프를 클릭합니다. 그래프 섹션에 있는 "방법"에는 특정 그래프를 생성하고 해석하는 방법에 대한 정보가 포함되어 있습니다. "지원 항목"에는 그래프 편집, 그래프 수정 등 일반적인 정보가 포함되어 있습니다.

데이터 탐색

통계 분석을 수행하기 전에 데이터의 중요한 특징을 표시하는 그래프를 먼저 작성합니다. 예를 들어 배송 데이터의 경우, 각 물류 센터의 평균 배송 시간 및 각 물류 센터의 데이터 변동이 어느 정도인 지를 알고자 합니다. 또한 배송 데이터가정규 분포를 따르는지 확인하여 일반적인 통계 방법으로 평균의 동일성 검정을 할 수 있는 지를 알고자 합니다.

여러 패널로 표시되는 히스토그램 생성

배송 데이터가 정규 분포를 따르는지 여부를 확인하기 위해 여러 패널로 표시되는 히스토그램을 만듭니다. 이 히스토그램은 주문 날짜와 배송 날짜 간의 시간 경과를 나타냅니다.

  1. 앞 장에 이어서 계속하는 경우 2단계로 이동합니다. 그렇지 않은 경우 표본 데이터 집합배송데이터.MTW을(를) 엽니다.
  2. 그래프 > 히스토그램을 선택합니다.
    히스토그램 대화 상자
  3. 적합선 표시를 선택한 다음 확인을 클릭합니다.
  4. 그래프 변수일 수를 입력합니다.
    히스토그램: 적합선 표시 대화 상자
  5. 다중 그래프를 클릭한 다음 기준 변수 탭을 클릭합니다.
  6. 별도의 패널에 그룹이 있는 기준 변수센터를 입력합니다.
    히스토그램: 다중 그래프 대화 상자
  7. 각 대화 상자에서 확인을 클릭합니다.
참고

대부분의 Minitab 대화 상자에서 변수를 선택하려면 다음 방법 중 하나를 사용하십시오.

  • 변수 리스트 상자에서 변수를 두 번 클릭합니다.
  • 변수 리스트 상자에서 변수를 강조 표시한 다음 선택을 클릭합니다.
  • 변수 이름 또는 열 번호를 입력합니다.

Histogram with groups in separate panels
별도의 패널에 그룹이 있는 히스토그램

결과 해석

히스토그램은 종 모양과 비슷하고 평균에 대해 대칭이므로, 각 센터의 배송 시간이 근사적으로 정규 분포를 따르는 것으로 보입니다.

여러 패널로 표시되는 히스토그램 재배열

생성한 그래프에 대해 평균과 변동을 더 쉽게 비교할 수 있도록 세 개의 패널을 재배열할 수 있습니다.

  1. 히스토그램을 마우스 오른쪽 단추로 클릭한 다음 패널을 선택합니다.
  2. 배열 탭의 행과 열에서 사용자 정의을 선택합니다. 3을 입력합니다. 1을 입력합니다.
  3. 확인을 클릭합니다.
This paneled histogram shows three histograms stacked vertically in one column on the same graph.
하나의 열에 배열된 여러 패널로 표시되는 히스토그램

결과 해석

각 배송 센터의 평균 배송 시간은 서로 다릅니다.
  • 중부: 3.984일
  • 동부: 4.452일
  • 서부: 2.981일

히스토그램은 중부 및 동부 물류 센터의 배송 시간의 평균과 산포가 모두 비슷하다는 것을 보여줍니다. 반면에 서부 물류 센터의 경우 평균 배송 시간이 더 짧고 흩어진 정도도 적습니다. 데이터 분석에서는 분산 분석을 사용하여 평균 간에 통계적으로 유의한 차이를 탐지하는 방법을 보여줍니다.

데이터가 변경될 경우 Minitab은 자동으로 그래프를 업데이트합니다. 자세한 내용은 데이터 변경 시 그래프 업데이트에서 확인하십시오.

제목 편집 및 각주 추가

관리자가 신속하게 히스토그램을 해석할 수 있도록 제목을 변경하고 각주를 추가할 수 있습니다.

  1. 일 수 히스토그램 제목을 두 번 클릭합니다.
  2. 텍스트배송 시간 히스토그램을 입력합니다.
  3. 확인을 클릭합니다.
  4. 히스토그램을 마우스 오른쪽 단추로 클릭한 다음 추가 > 각주을 선택합니다.
  5. 각주서부 센터: 가장 빠른 배송 시간, 가장 낮은 변동성을 입력합니다.
  6. 확인을 클릭합니다.
This paneled histogram has a more descriptive title and a footnote that provides a brief interpretation of the results.
편집된 제목 및 새 각주가 있는 히스토그램

결과 해석

이제 여러 패널로 표시된 히스토그램에는 더 이해하기 쉬운 제목과 결과에 대한 간단한 해석이 있는 주석이 들어 있습니다.

두 변수 간의 관계 조사

그래프는 변수 간의 관계가 존재하는지 여부 및 관계의 강도를 알아내는데 도움이 됩니다. 변수 간의 관계를 알면 어느 변수가 분석에 중요한 지와 추가적으로 어떤 분석을 해야하는 지를 선택할 수 있습니다.

각 물류 센터는 하나의 지역을 담당하므로, 배송 위치까지의 거리는 배송 시간에 큰 영향을 미치지 않을 것이라 예상할 수 있습니다. 이러한 가정이 맞는지 확인하고 거리를 잠재적으로 중요한 요인에서 제거하려면 각 센터의 배송 시간과 배송 거리 간의 관계를 조사해야 합니다.

그룹이 표시된 산점도 생성

두 변수 간의 관계를 조사하기 위해 산점도를 사용할 수 있습니다. 그래프 메뉴에서 산점도를 선택하거나 Minitab 보조 도구를 사용할 수 있습니다. 보조 도구는 분석 단계를 안내하며 결과를 올바르게 해석하는 데 도움이 됩니다. 보조 도구는 대부분의 기본적인 통계 검정, 그래프, 품질 분석 및 실험계획법에 사용할 수 있습니다.

보조 도구는 다음과 같은 경우에 사용하십시오.
  • 분석을 위해 올바른 도구를 선택하려는 경우
  • 기술적 용어가 적고 작성하기 더 쉬운 대화 상자를 원하는 경우
  • Minitab에서 분석 가정을 확인하려는 경우
  • 더 많은 그래픽이 포함되고 결과를 해석하는 방법에 대해 자세히 설명하는 결과를 원하는 경우
  1. 보조 도구 > 그래픽 분석을 선택합니다.
  2. 변수들 간의 관계를 그래프로 표시에서 산점도(그룹)를 클릭합니다.
  3. Y 열일 수를 입력합니다.
  4. X 열거리를 입력합니다.
  5. X 열의 수에서 1을 선택합니다.
  6. X1센터를 입력합니다.
  7. 확인을 클릭합니다.
This Summary Report provides a scatterplot of days versus distance by center overlaid on the same graph. This report also provides smaller blob plots of each shipping center.
요약 보고서

요약 보고서에는 물류 센터별 일 수 대 거리의 산점도가 동일한 그래프에 겹쳐진 상태로 표시됩니다. 이 보고서에는 또한 각 물류 센터에 대한 더 작은 산점도가 포함됩니다.

This Diagnostic Report provides a scatterplot with guidance on possible patterns in your data.
진단 보고서

진단 보고서에서는 데이터 내 가능한 패턴에 대해 설명합니다. 산점도의 점은 일 수와 거리 사이에 분명한 관계가 없다는 것을 보여줍니다. 각 물류 센터의 적합 회귀선이 비교적 평평하고, 물류 센터와 배송 위치 사이의 거리가 배송 시간에 영향을 미치지 않음을 나타냅니다.

This Descriptive Statistics Report provides descriptive statistics for each shipping center.
기술 통계량 보고서

기술 통계량 보고서에는 각 물류 센터에 대한 기술 통계량이 포함됩니다.

This Report Card indicates no unusual data and provides next steps in your analysis.
보고서 카드

보고서 카드는 비정상적인 데이터를 확인하는 방법에 대한 정보를 제공합니다. 보고서 카드는 또한 Y 변수와 X 변수 사이에 관계가 있다는 사실을 나타냅니다. Y 변수는 일 수이고 X 변수는 거리센터입니다. 산점도는 일 수와 거리 사이에 분명한 관계가 없다는 사실을 나타냈습니다. 그러나 일 수와 물류 센터 사이에 관계가 있을 수도 있으며 이런 내용은 다음 장 데이터 분석에서 자세히 알아보겠습니다.

한 페이지에 여러 그래프 배열

여러 그래프를 한 페이지에 배치하려면 Minitab의 그래프 레이아웃 도구를 사용합니다. 레이아웃에 주석을 추가할 수 있고, 레이아웃 내의 개별 그래프를 편집할 수 있습니다.

관리자에게 배송 데이터의 그래프 분석 결과를 보여주기 위해 요약 보고서 및 여러 패널로 나뉘어진 히스토그램을 한 페이지에 배치하려 합니다.

그래프 레이아웃 생성

  1. 산점도 요약 보고서가 활성 상태인지 확인한 다음 편집기 > 레이아웃 도구를 선택합니다.
    산점도 요약 보고서는 이미 레이아웃에 있습니다.
  2. 두 그래프를 한 페이지에 배치하려면 1을 입력합니다.
  3. 요약 보고서를 클릭하여 레이아웃의 오른쪽으로 끕니다.
  4. 오른쪽 화살표 단추 를 클릭하여 레이아웃 왼쪽에 여러 패널이 있는 히스토그램을 배치합니다.
  5. 마침을 클릭합니다.
여러 패널이 있는 히스토그램 및 산점도가 있는 그래프 레이아웃
참고

레이아웃을 생성한 후 워크시트 데이터를 편집하는 경우 Minitab에서 레이아웃의 그래프를 자동으로 업데이트할 수 없습니다. 새 그래프를 사용하여 레이아웃을 다시 생성해야 합니다.

그래프 레이아웃에 주석 달기

이해하기 쉬운 제목을 그래프 레이아웃에 추가할 수 있습니다.

  1. 전체 그래프 레이아웃을 선택했는지 확인하려면 편집기 > 항목 선택 > 그래프 영역을 선택합니다.
  2. 편집기 > 추가 > 제목을 선택합니다.
  3. 제목배송 데이터의 그래픽 분석을 입력합니다.
  4. 확인을 클릭합니다.
새 제목이 있는 그래프 레이아웃

Minitab 프로젝트 저장

Minitab 데이터는 워크시트에 저장됩니다. 또한 워크시트, 세션 창 결과, 그래프, 세션 기록, 대화 상자 설정 등 모든 작업 내용이 포함된 Minitab 프로젝트를 저장할 수 있습니다.

  1. 파일 > 다른 이름으로 프로젝트 저장을 선택합니다.
  2. 파일을 저장할 폴더로 이동합니다.
  3. 파일 이름내 그래프를 입력합니다.
  4. 저장을 클릭합니다.

다음 장 내용

그래프 결과에서 도서 주문에 대한 세 물류 센터의 배송 시간이 다르다는 것을 알 수 있습니다. 다음 장에서는 기술 통계량을 표시하고 분산 분석을 수행하여 물류 센터 간의 차이가 통계적으로 유의한지 여부를 검정합니다.

이 사이트를 사용하면 분석 및 사용자 개인 컨텐츠에 대한 쿠키 사용에 동의하는 것입니다.  당사의 개인정보 보호정책을 확인하십시오