Vou construir pipelines ETL com spark para processamento em lote e fluxos de trabalho de big data

Algumas informações foram traduzidas automaticamente.

Turquia

Eu falo Turco, Inglês

10 pedidos finalizados

Soluções escaláveis, código limpo e comunicação clara

Olá! Sou Veysi, um desenvolvedor de software freelance que cria soluções poderosas, sustentáveis e escaláveis usando .NET Core, RabbitMQ, PostgreSQL e Vue.js. Com mais de 4 anos de experiência corpor...
Sobre este Serviço

Vou projetar e desenvolver pipelines Spark ETL escaláveis para processamento de dados em lote, transformação e fluxos de trabalho de grande volume.


Este serviço é ideal para empresas que precisam processar dados de arquivos, bancos de dados, APIs ou outras fontes estruturadas de forma confiável e fácil de manter. Seja para criar um novo pipeline de batch do zero ou melhorar um existente, posso ajudar a construir uma solução limpa e orientada para produção.


Foco em resultados práticos de engenharia de dados, como ingestão, transformação, validação, agregação e entrega em conjuntos de dados prontos para análise ou sistemas downstream.


O que este serviço pode incluir

  • Desenvolvimento de pipelines ETL com Spark ou PySpark
  • Processamento em lote para grandes conjuntos de dados
  • Ingestão de dados de CSV, JSON, Parquet, APIs e bancos de dados
  • Limpeza, normalização e transformação de dados
  • Lógica de joins, agregações, filtros e enriquecimento
  • Saída para arquivos, data warehouses ou bancos de dados
  • Otimização e refatoração de jobs Spark existentes
  • Registro estruturado e organização de código fácil de manter
  • Documentação básica e suporte na entrega

Especialidade:

Integração via API

Big data

Extração de dados

Tecnologia:

apache spark

BigQuery

Python

Scala

SQL

Apache Airflow