A fusão de dados é o processo de combinar dados de múltiplas fontes em uma estrutura unificada para que possam ser analisados, reportados ou passados para etapas posteriores em um pipeline de dados. Ela garante que as informações relacionadas estejam alinhadas, comparáveis e organizadas de forma a apoiar insights significativos.
Minitab Data Center oferece as seguintes operações comuns de fusão de dados.
Juntar
Combina dados relacionados de diferentes conjuntos de dados ao combinar valores em um ou mais campos-chave (por exemplo, vinculando medições a metadados de partes).
Adiciona colunas e amplia os conjuntos de dados
Associação
Stacka múltiplos conjuntos de dados com a mesma estrutura em um único conjunto de dados, aumentando o número de linhas enquanto mantém as mesmas colunas.
Adiciona linhas e torna os conjuntos de dados mais longos
Juntas, essas operações ajudam a padronizar, enriquecer e remodelar os dados para que fluam suavemente pelo pipeline e estejam prontos para análise ou relatório.