데이터 파이프라인 생성

Minitab Data Center에서 데이터 파이프라인을 생성하여 한 개 이상의 출처에서 데이터를 정제하고 즉시 사용할 수 있는 데이터셋으로 변환할 수 있습니다.

데이터 파이프라인이란 무엇인가요?

데이터 파이프라인은 데이터를 수집, 변환, 준비하여 분석이나 보고를 위해 준비하는 일련의 단계입니다. 데이터 파이프라인은 다음을 보장합니다:
  • 데이터는 일관되고 신뢰할 수 있습니다
  • 업데이트는 필요에 따라 이루어집니다
  • 팀들은 동일한 신뢰할 수 있는 데이터셋을 사용합니다
  • 데이터가 사용되기 전에 오류가 식별됩니다

데이터 파이프라인은 실시간 처리 상태와 오류 메시지를 받으면서 노드를 추가, 삭제, 수정할 수 있는 인터랙티브 시각 다이어그램으로 나타납니다.

예를 들어, CSV 파일과 Minitab 워크시트에서 데이터를 추출해 데이터를 정리하고 결합한 후 대시보드에 사용할 단일 데이터셋을 출력하는 파이프라인을 만들 수 있습니다.
참고

각 파이프라인은 최대 60개의 처리 노드와 1개의 출력 노드(총 61개 노드)를 지원합니다. 최대 10개의 데이터 소스 노드를 가질 수 있습니다.

파이프라인 뷰

모든 Data Center 프로젝트에는 데이터 처리 단계를 나타내는 인터랙티브 파이프라인 다이어그램이 포함되어 있습니다.
정리 보기
뷰를 정리 이용해 데이터를 정리하고 준비하세요
데이터 출처 보기
뷰를 데이터 출처 사용해 데이터셋 스키마나 전체 데이터셋에 영향을 미치는 설정을 수정하세요.

자세한 내용은 데이터셋 스키마 관리 또는 데이터 원본 옵션 설정(으)로 이동하십시오.

파이프라인 표시 조정

파이프라인 캔버스의 , , 축소또는 보기 적합 버튼을 사용 확대해 뷰를 조정하세요.
툴바에서 자동 레이아웃 을 선택하여 파이프라인 뷰를 최적화할 수도 있습니다.
참고

최적의 시각적 구성을 위해 노드를 드래그하거나 재배치할 수 있습니다.

사용 가능한 노드

대부분의 파이프라인에는 다음과 같은 유형의 노드가 포함되어 있습니다:
  • 데이터 출처
  • 정리
  • 병합
  • 재구성(Reshape)
  • 출력

데이터 소스 노드

데이터 소스 노드는 파이프라인을 데이터셋에 연결합니다. 각 파이프라인은 최대 10개의 데이터 소스 노드를 지원합니다.
데이터 소스 노드를 추가하려면 툴바에서 선택 데이터 추가 하세요.캔버스 컨텍스트 메뉴에서도 선택할 데이터 소스 추가 수 있습니다.

데이터 소스 노드 소스 노드 기본 사항에 대한 자세한 정보는 .

정화 노드

서식 문제를 수정하고, 오류를 제거하며, 기타 데이터 준비 작업을 수행합니다.
데이터 센터는 유연한 계층 구조의 여러 정제 노드를 지원하여 모든 데이터 정제 프로세스를 지원합니다.
정리 번째 노드는 직렬로 추가되고, 이후 노드들은 다음과 같이 병렬로 연결됩니다. 언제든지 노드의 이름을 바꾸고 어떤 위치로든 이동할 수 있습니다.

부모가 없는 정리 노드를 추가하려면 캔버스 컨텍스트 메뉴에서 선택 정리 추가 하세요.

데이터 정리 노드 정리 단계 기본에 대한 자세한 정보는 .

데이터 병합 노드

노드를 사용 조인 결합 해 여러 데이터셋을 결합하세요.
기존 노드나 커넥터 라인에서 조인과 유니언 노드를 추가할 수 있습니다.

부모가 아닌 데이터 병합 노드를 추가하려면 캔버스 컨텍스트 메뉴에서 선택 조인 추가 하거나 연합 추가 선택하세요.

데이터 머지 노드 데이터셋 병합에 대한 자세한 정보는 .

노드 재형성

연산을 통해 전치 데이터셋을 재구성하세요.
기존 노드나 연결 라인에서 전조 노드를 추가할 수 있습니다.

부모가 아닌 리셰이핑 노드를 추가하려면 캔버스 컨텍스트 메뉴에서 선택 전조 추가 하세요.

노드 전치 데이터셋재형성에 대한 자세한 정보는 .

출력 노드

데이터 파이프라인의 터미널 노드를 나타냅니다. 분석 도구나 대시보드와 같은 최종 목적지에 데이터를 전달합니다.

출력 노드를 설정하려면 우클릭 메뉴를 열고 부모 노드 중에서 선택 출력 설정 하세요. 여기서 정리된 데이터를 Minitab 프로젝트나 Minitab 대시보드에 전송할 수 있습니다.

툴바에서 정리된 데이터를 Minitab 프로젝트나 Minitab 대시보드로 복사본을 전송 다음에서 열기 할 수도 있습니다.

데이터 내보내기나 전체 데이터 센터 파이프라인 수출 데이터 및 프로젝트에 대한 자세한 정보는 .

파이프라인을 새로고침하세요

데이터 파이프라인 내 데이터 변환을 재처리하는 데 사용됩니다 새로 고침 . 데이터 소스 노드만 독립적으로 새로고침할 수 있습니다.

전체 파이프라인을 새로고침하려면 툴바에서 선택 새로 고침 하세요.

개별 데이터 소스를 새로고침하려면 소스 노드의 컨텍스트 메뉴에서 선택 새로 고침 하세요. 데이터 소스에 접근할 수 없으면 재연결하거나 파일을 탐색하라는 안내가 뜨게 됩니다.