Eu vou otimizar e ajustar seus pipelines de apache spark e scripts de ETL em python

Algumas informações foram traduzidas automaticamente.

Índia

Eu falo Hindi, Inglês

Arquiteto de Dados

Sou um Arquiteto de Dados experiente, especializado em projetar ecossistemas de dados tolerantes a falhas, clusters ELK e soluções nativas de nuvem em grande escala. Tenho uma forte experiência em Apa...
Sobre este Serviço

Você está enfrentando tempos lentos de processamento de dados, jobs de ETL quebrados ou contas de nuvem enormes por causa de pipelines não otimizados? 


Como um Arquiteto de Dados de empresa, eu me especializo em depurar, refatorar e ajustar a infraestrutura de dados existente para máxima performance e eficiência de custos. Eu paro vazamentos de recursos para que seus fluxos de dados fiquem mais rápidos e custem menos.


O que farei por você neste pacote de otimização:

- Ajuste de Apache Spark: Corrigir vazamentos de memória, otimizar partições de shuffle e resolver jobs com gargalos.

- Refatoração de scripts em Python & Bash: Reescrever scripts personalizados ineficientes para rodar mais rápido e lidar com exceções de forma elegante.

- Auditoria do ELK Stack/Elasticsearch: Ajustar configurações de índice, tamanhos de shard e desempenho de consultas para reduzir a carga do cluster.

- Redução de custos: Identificar e eliminar recursos de computação na nuvem desperdiçados dentro do seu pipeline.


Por que me escolher?

Eu tenho experiência de nível empresarial otimizando infraestrutura de alto volume, semelhante à de telecomunicações. Você receberá um aumento imediato de performance, ajustes em código limpo e documentação clara.


Por favor, envie uma mensagem antes de fazer seu pedido para que possamos revisar sua configuração atual e logs de erro!

Idioma:

Inglês

Hindi

Experiência técnica:

Apache NiFi

Apache Airflow

apache spark

Especialidade:

Pipelines de dados

Desenvolvimento de ETL

Setor:

Data analytics