Eu vou escrever e otimizar pipelines ETL em pyspark para seus fluxos de dados

Algumas informações foram traduzidas automaticamente.

Índia

Eu falo Hindi, Inglês

Engenheiro de Dados Sênior, Spark, Scala, AWS, Airflow, Kafka, Big Data

Sou Pankaj, um Engenheiro de Dados com mais de 3 anos de experiência construindo pipelines de dados em grande escala, fluxos de ETL e plataformas de dados na nuvem. Especializo-me em Spark (Scala/PySp...
Sobre este Serviço

Você está procurando um Engenheiro de Dados PySpark confiável para construir ou otimizar seus pipelines ETL?

Você está no lugar certo.

Sou Pankaj, um Engenheiro de Dados com mais de 3 anos de experiência na Paytm, onde criei mais de 200 pipelines ETL em produção processando mais de 5 TB/dia usando PySpark, Airflow, AWS e Kafka.

Este serviço foca 100% em entregar soluções PySpark ETL rápidas, escaláveis e limpas para o seu negócio.


O que posso fazer por você

  • Escrever código PySpark ETL limpo e otimizado
  • Construir fluxos de trabalho ETL de ponta a ponta (extrair, transformar, carregar)
  • Converter lógica SQL em transformações PySpark
  • Corrigir jobs PySpark que estão falhando ou lentos
  • Otimizar jobs Spark para reduzir tempo de execução e custo no EMR
  • Integrar PySpark com AWS Glue, S3, EMR, Athena
  • Limpeza, validação e transformação de dados
  • Depurar pipelines ETL existentes


Por que me escolher

  • Código pronto para produção, limpo
  • Experiência sólida no mundo real
  • Comunicação e entrega rápidas
  • Foco total em confiabilidade e escalabilidade
  • Entendimento prático de falhas em pipelines e otimizações


Tecnologias que uso

  • PySpark / Spark
  • AWS Glue, S3, EMR
  • SQL
  • Airflow (orquestração de workflows)
  • Kafka
  • Python & Scala


Tem uma necessidade personalizada?

Me envie uma mensagem que respondo rapidinho.

Vamos construir algo escalável.