Vou criar um script ETL em python para limpar, mesclar e consolidar seus dados CSV

Algumas informações foram traduzidas automaticamente.

Índia

Eu falo Inglês, Japonês, Francês

1 pedido finalizado

Dados e Software

Sou engenheiro de dados em Python, especializado em pipelines ETL, limpeza de dados e consolidação de CSV/Excel. Transformo exportações confusas e inconsistentes de várias fontes em um conjunto de dad...
Sobre este Serviço

Você tem planilhas de diferentes equipes, ferramentas ou departamentos, cada uma com nomes de colunas diferentes, formatos de data variados, registros duplicados e valores sujos? Limpar e mesclar manualmente é lento e propenso a erros. Eu automatizo tudo isso com Python + Pandas.

O que eu faço

Construo um fluxo de trabalho ETL reutilizável que:

  • Extrai dados de todos os seus arquivos CSV/Excel em uma única execução
  • Mapeia nomes de colunas de diferentes fontes para um esquema padrão
  • Limpa & padroniza remove espaços em branco, ajusta para maiúsculas e minúsculas, converte todas as datas para AAAA-MM-DD, remove símbolos de moeda/unidades e converte valores e quantidades para números limpos
  • Padroniza categorias (por exemplo, valores de status em um conjunto consistente)
  • Valida registros e remove linhas que faltam campos obrigatórios
  • Remove duplicatas para que cada registro apareça uma única vez
  • Consolida tudo em um arquivo mestre único, em UTF-8, pronto para relatórios

O que você recebe

  • Um script Python limpo, bem documentado que você possui integralmente
  • Seu arquivo de saída consolidado (CSV/Excel)
  • Um README com instruções de instalação e execução
  • Código reutilizável para os arquivos do próximo mês, sem precisar recomeçar do zero

Por que me escolher

  • Especialista em engenharia de dados & ETL, não um generalista
  • Código limpo, legível, comentado (sem caixas pretas)
  • Resultados consistentes e repetíveis a cada execução
  • Respostas rápidas, no horário

Tecnologia:

Amazon Redshift

apache spark

Excel

MATLAB

Python

Especialidade:

Classificação

Extração de dados

Fluxo de dados

Meu portfólio