Eu vou limpar e automatizar seus dados como um engenheiro de dados
Engenheiro de Dados na Nuvem
Sobre este Serviço
Vou limpar, formatar e transformar conjuntos de dados de algumas milhares de linhas até tens de milhões de linhas de forma eficiente usando Python & PySpark para uma análise precisa.
Remover nulos e duplicados
Padronizar textos, datas e números
Trabalhar com CSV, Excel & JSON (planos/semi-estruturados)
Automação com Python/PySpark para maior eficiência
Com minha experiência em Engenharia de Dados, seus dados ficarão consistentes, precisos e prontos para análise.
Warehouse Platform:
Azure Synapse
•
Databricks
Tipo de projeto:
New Build
Meu portfólio
Outros serviços de Engenharia de Dados que eu ofereço
Perguntas frequentes
Tradução automática
O que preciso fornecer antes de fazer um pedido?
Você precisa compartilhar seu conjunto de dados (CSV, Excel, JSON(semi-estruturado), etc.) junto com instruções claras sobre o que precisa de limpeza ou transformação.
Quais ferramentas/tecnologias você usa?
Eu uso principalmente Python e PySpark para conjuntos de dados maiores.
Você consegue lidar com grandes conjuntos de dados (milhões de linhas)?
Sim, para o pacote Premium eu projeto fluxos de trabalho escaláveis usando PySpark que podem lidar com milhões de linhas de forma eficiente.
Vou receber o script/código junto com os dados limpos?
Sim, entregarei o conjunto de dados final e o script Python/PySpark no pacote premium para que você possa reutilizá-lo sempre que precisar.
Você consegue integrar com bancos de dados ou armazenamento na nuvem?
Sim, sou um Engenheiro de Dados e uso armazenamento na nuvem (Azure Blob, Databricks, etc.) se necessário (para pacotes Standard e Premium).
Você fornece documentação?
Sim, para o pacote Premium forneço documentação passo a passo para que você possa executar e gerenciar o fluxo de trabalho facilmente.

