Vou desenvolver pipelines ETL escaláveis usando databricks
Sobre este Serviço
Precisa de uma pipeline ETL robusta e escalável construída no Databricks? Você está no lugar certo!
Eu sou Gajendra, um Engenheiro de Dados e Analista de Dados Certificado, com mais de 6 anos de experiência criando soluções de dados completas para clientes corporativos. Seja trabalhando com dados em batch ou streaming, eu me especializo em projetar pipelines ETL limpas, eficientes e prontas para produção usando Databricks, PySpark e AWS.
O que eu ofereço:
- Desenvolvimento de pipelines ETL/ELT de ponta a ponta no Databricks
- Ingestão de dados de múltiplas fontes (S3, RDS, APIs, etc.)
- Limpeza, transformação e enriquecimento de dados usando PySpark
- Integração com Delta Lake, SQL e armazenamento na nuvem
- Orquestração de workflows com Databricks Jobs ou Apache Airflow
- Implantação controlada por versão (Git, CI/CD)
- Documentação e entrega via notebooks
Ferramentas & Tecnologias: Databricks (Jobs, Notebooks, Delta Lake), PySpark, SQL, AWS (S3, Glue, Lambda, RDS), Airflow / Databricks Workflows, Git, CI/CD, DBFS
Por que trabalhar comigo?
- Certificado em Databricks & AWS
- Mais de 6 anos de experiência em Engenharia de Dados & Analytics
- Comunicação rápida e clara
- Código de nível de produção com design reutilizável
Vamos automatizar e escalar seus workflows de dados do jeito certo!
Perguntas frequentes
Tradução automática
O que você precisa de mim para começar?
Apenas um breve resumo sobre suas fontes de dados, resultados esperados e configuração na nuvem (se houver).
Você consegue trabalhar com dados on-premises ou outros provedores de nuvem?
Sim, mas AWS é minha principal expertise. Podemos discutir outras opções.
