Neste exemplo, uma equipe de conformidade está preocupada com a precisão da detecção de fraudes no setor automotivo; no entanto, os dados precisam ser preparados antes que a análise possa começar. Siga estas etapas para se preparar insurance_fraud_data.csv para uma análise mais aprofundada. Para fazer essas modificações, selecione a coluna e abra o Opções de preparação de dados menu suspenso para acessar as opções de limpeza da coluna.
Por claim_number, altere o tipo de dados de numérico para texto.
Por claim_number, anexe # aos valores da coluna.
Por age_of_driver, filtre para incluir apenas drivers menores ou iguais a 100 anos.
No gênero, mude M para masculino e F para feminino.
Por annual_income, filtre para incluir apenas drivers que fazem mais de 1.
Por address_change, altere o tipo de dados de numérico para texto.
Em address_change, altere 1 para sim e 0 para não.
Para CEP, altere o tipo de dados de numérico para texto.
Use Ordenação avançada para classificar por fraude, reivindicação de lesão e CEP.
Exportar etapas de preparação de dados
Depois de aplicar todas as etapas de preparação, salve-as a serem usadas para conjuntos de dados futuros com as mesmas colunas. Para salvar as etapas, exporte-as como um arquivo .mdcs.
No painel Etapas à esquerda, selecione Exportar etapas no menu suspenso.
O arquivo é salvo na pasta de downloads ou em outro local de salvamento e usa o mesmo nome do arquivo de dados. Altere o nome de acordo.
Importar etapas de preparação de dados
Para aplicar as etapas a um novo arquivo de dados, importe-as como um arquivo .mdcs. Selecione Importar etapas no menu suspenso no Etapas painel.
Explore resumos de dados
Cada coluna tem um resumo que mostra a forma dos dados, o intervalo dos dados e um ícone que representa o tipo de dados.
Uma rápida olhada nos resumos gráficos da coluna mostra que o canal tem 3 níveis e os dias abertos mostram uma distribuição bimodal.
Abra o Resumo dos dados para obter mais informações sobre as estatísticas resumidas nessas colunas.
O resumo de dados do canal mostra a frequência de cada um dos 3 níveis.
Próxima etapa
Como os dados dos dias abertos indicam duas distribuições, a seguradora quer analisar isso mais a fundo. Acesse Analise seus dados.