사기 탐지 추세를 분석하기 전에 데이터셋을 정리하고 표준화해야 합니다. 이 섹션에서는 다음과 같은 내용을 하게 됩니다:
Minitab Data Center 데이터 파이프라인을 사용해 데이터를 준비합니다. 파이프라인은 원시 데이터를 깔끔하고 분석이 가능한 데이터셋으로 변환하는 연결된 단계들의 연속입니다.
모든 데이터 센터 프로젝트에는 데이터 처리 단계를 나타내는 인터랙티브 파이프라인 다이어그램이 포함되어 있습니다. 일반적인 파이프라인 흐름에는 다음과 같은 노드들이 포함됩니다.
데이터 출처 → 정리 합병/재구성→ → 출력
각 단계는 파이프라인 내 시각적 노드로 나타나 데이터 준비 과정을 쉽게 이해하고 재사용할 수 있도록 합니다.
데이터 출처 → 정리 → 출력


자세한 내용은 '데이터셋 스키마 관리 ' 또는 '데이터 소스 옵션 설정'으로 이동하세요.
각 뷰를 언제 사용해야 하는지:

데이터 타입 claim_number 숫자에서 텍스트로 변경하세요.
모든 청구 번호에 # 기호를 붙이세요.
왜 이것이 중요한가: 수치 해석을 방지하고 서식의 일관성을 유지합니다.
왜 이것이 중요한가: 결과를 왜곡할 수 있는 비현실적인 나이와 무효 소득 기록을 제거합니다.
왜 이것이 중요한가: 표준화된 범주는 가독성, 그룹화, 보고를 향상시킵니다.
왜 이것이 중요한가: 선행 0을 보존하고 의도치 않은 숫자 연산을 방지합니다.
왜 이것이 중요한가: 분류는 사기 관련 기록의 우선순위를 효율적으로 정하고 검토하는 데 도움을 줍니다.
데이터를 정리하고 표준화하는 것 외에도, 분석 전에 데이터셋을 결합하거나 재구성해야 할 수도 있습니다.
자세한 내용은 'Join datasets'로 가세요.
자세한 정보는 Union datasets를 참조하세요.
자세한 내용은 전관 데이터셋으로 가세요.
Minitab Data Center 뷰에서 데이터 준비 정리 를 안내하는 대화형 인터페이스를 제공합니다.
위의 예에서 프롬프트에 Minitab AI 다음 텍스트를 입력하여 개별 단계와 동일한 결과를 얻을 수 있습니다.
청구 번호를 문자로 작성하십시오. 번호를 청구하기 위해 숫자 기호를 추가합니다. 100개보다 오래된 드라이버를 제거합니다. m을 수컷으로, f를 암컷으로 변경합니다. 유효한 소득이 없는 운전자를 제거합니다. address_change 텍스트로 변경합니다. 주소 변경의 경우 1을 예로, 0을 아니오로 만드십시오. 사기, 상해 청구 및 우편번호별로 정렬합니다.
사용에 관한 Minitab AI Data Center자세한 내용은 'Minitab AI 사용법으로 데이터를 정리하기'로 안내하세요.



예를 들어, 채널 은 3단계로 구성되어 있고, 개봉일 은 이중분포를 보여줍니다.


채널에 대한 데이터 요약에는 3가지 수준 각각에 대한 빈도가 표시됩니다.

우클릭 메뉴를 사용해 그룹화 라벨을 편집하거나, 그룹을 데이터셋에서 제외하거나, 이 값을 포함하는 행만 표시하세요.
개봉 일수 동안의 데이터는 두 가지 분포를 나타내기 때문에 보험 회사는 이를 더 자세히 살펴보려고 합니다. 데이터 분석으로 이동하십시오.