Exemplo de preparação de dados

Use ferramentas de preparação de dados para organizar e preparar seus dados para análises mais robustas.

Etapas de preparação de dados

Neste exemplo, uma equipe de conformidade está preocupada com a precisão da detecção de fraudes no setor automotivo; no entanto, os dados precisam ser preparados antes que a análise possa começar. Siga estas etapas para se preparar insurance_fraud_data.csv para uma análise mais aprofundada. Para fazer essas modificações, selecione a coluna e abra Opções de preparação de dados para acessar as opções de limpeza da coluna.
  1. Abra Dados de fraude de seguros no Minitab Data Center arquivo .
  2. Por claim_number, altere o tipo de dados de numérico para texto.
  3. Por claim_number, anexe # aos valores da coluna.
  4. Por age_of_driver, filtre para incluir apenas drivers menores ou iguais a 100 anos.
  5. No gênero, mude M para masculino e F para feminino.
  6. Por annual_income, filtre para incluir apenas drivers que fazem mais de 1.
  7. Por address_change, altere o tipo de dados de numérico para texto.
  8. Em address_change, altere 1 para sim e 0 para não.
  9. Para CEP, altere o tipo de dados de numérico para texto.
  10. Use Classificação avançada para classificar por fraude, reivindicação de lesão e CEP.

Exportar etapas de preparação de dados

Depois de aplicar todas as etapas de preparação, salve-as a serem usadas para conjuntos de dados futuros com as mesmas colunas. Para salvar as etapas, exporte-as como um arquivo .mdcs.
  1. No painel Etapas, selecione Etapas de exportação no menu suspenso.
  2. O arquivo é salvo na pasta de downloads ou em outro local de salvamento e usa o mesmo nome do arquivo de dados. Altere o nome de acordo.

Importar etapas de preparação de dados

Para aplicar as etapas a um novo arquivo de dados, importe-as como um arquivo .mdcs. Selecione Etapas de importação no menu suspenso no Etapas painel.

Explore resumos de dados

Cada coluna tem um resumo que mostra a forma dos dados, o intervalo dos dados e um ícone que representa o tipo de dados.

Uma rápida olhada nos resumos gráficos da coluna mostra que o canal tem 3 níveis e os dias abertos mostram uma distribuição bimodal.

Abra o Resumo dos dados para obter mais informações sobre as estatísticas resumidas nessas colunas.

O resumo de dados do canal mostra a frequência de cada um dos 3 níveis.

Próxima etapa

Como os dados dos dias abertos indicam duas distribuições, a seguradora quer analisar isso mais a fundo. Acesse Exemplo de análise de dados.