Antes de analizar las tendencias de detección de fraude, el conjunto de datos debe ser limpiado y estandarizado. En esta sección, tú deberás:
Utiliza Minitab Data Center una cadena de datos para preparar tus datos. Una pipeline es una secuencia de pasos conectados que transforman los datos en bruto en un conjunto de datos limpio y listo para el análisis.
Cada proyecto de Centro de Datos contiene un diagrama interactivo de pipeline que representa los pasos de procesamiento de datos. Un flujo típico de tubería contiene los siguientes nodos.
Origen de datos → Limpieza → Fusionar/Remodelar→ Salida
Cada paso aparece como un nodo visual en la pipeline, facilitando la comprensión y la reutilización de tu proceso de preparación de datos.
Origen de datos → Limpieza → Salida


Para más información, visita Gestionar el esquema del conjunto de datos o Establecer opciones de fuente de datos.
Cuándo usar cada vista:

Cambiar claim_number tipo de dato de numérico a texto.
Adelanta el símbolo # a todos los números de reclamación.
Por qué es importante: Previene la interpretación numérica y mantiene la consistencia del formato.
Por qué es importante: Elimina edades poco realistas y entradas de ingresos inválidas que podrían distorsionar los resultados.
Por qué es importante: Las categorías estandarizadas mejoran la legibilidad, la agrupación y la elaboración de informes.
Por qué es importante: Conserva los ceros iniciales y evita operaciones numéricas no intencionadas.
Por qué es importante: La clasificación ayuda a priorizar y revisar de forma eficiente los registros relacionados con fraudes.
Además de limpiar y estandarizar los datos, puede que necesites combinar o reorganizar conjuntos de datos antes del análisis.
Para más información, visita Unirse a conjuntos de datos.
Para más información, visita los conjuntos de datos de Union.
Para más información, visita Transpose datasets.
Proporciona Minitab Data Center una interfaz conversacional que guía la preparación de tus datos en la Limpieza vista.
Para el ejemplo anterior, puede ingresar el siguiente texto en el Minitab AI mensaje para obtener los mismos resultados que los pasos individuales.
Haga números de reclamo para enviar mensajes de texto. Agregue el símbolo numérico para reclamar números. Retire los controladores que tengan más de cien años. Cambia m a macho y f a hembra. Eliminar a los conductores que no tienen ingresos válidos. Cambiar address_change a texto. Realice 1 a sí y 0 a no para cambios de dirección. Ordene por fraude, reclamo por lesiones y código postal.
Para más información sobre cómo usar Minitab AI en el Data Center, visita Usar Minitab AI para limpiar tus datos.



Por ejemplo, el canal tiene 3 niveles y los días abiertos muestran una distribución bimodal.


El resumen de datos para el channel muestra la frecuencia para cada uno de los 3 niveles.

Utiliza el menú de clic derecho para editar la etiqueta de agrupación, excluir el grupo del conjunto de datos o mostrar solo las filas que contienen este valor.
Debido a que los datos de days open indican dos distribuciones, la compañía de seguros quiere analizar esto más a fondo. Vaya a Analice sus datos.