Eu vou otimizar e ajustar seus pipelines de apache spark e scripts de ETL em python
Arquiteto de Dados
Sobre este Serviço
Você está enfrentando tempos lentos de processamento de dados, jobs de ETL quebrados ou contas de nuvem enormes por causa de pipelines não otimizados?
Como um Arquiteto de Dados de empresa, eu me especializo em depurar, refatorar e ajustar a infraestrutura de dados existente para máxima performance e eficiência de custos. Eu paro vazamentos de recursos para que seus fluxos de dados fiquem mais rápidos e custem menos.
O que farei por você neste pacote de otimização:
- Ajuste de Apache Spark: Corrigir vazamentos de memória, otimizar partições de shuffle e resolver jobs com gargalos.
- Refatoração de scripts em Python & Bash: Reescrever scripts personalizados ineficientes para rodar mais rápido e lidar com exceções de forma elegante.
- Auditoria do ELK Stack/Elasticsearch: Ajustar configurações de índice, tamanhos de shard e desempenho de consultas para reduzir a carga do cluster.
- Redução de custos: Identificar e eliminar recursos de computação na nuvem desperdiçados dentro do seu pipeline.
Por que me escolher?
Eu tenho experiência de nível empresarial otimizando infraestrutura de alto volume, semelhante à de telecomunicações. Você receberá um aumento imediato de performance, ajustes em código limpo e documentação clara.
Por favor, envie uma mensagem antes de fazer seu pedido para que possamos revisar sua configuração atual e logs de erro!
