Vou criar modelos de big data e pipelines de ETL usando pyspark e databricks

Algumas informações foram traduzidas automaticamente.

Índia

Eu falo Hindi, Gujarati, Inglês

34 pedidos finalizados

Especialista em Engenharia de Dados e Arquiteto de Soluções em Cloud

Engenheiro de dados Azure com mais de 13 anos de experiência construindo soluções de dados escaláveis usando Microsoft Fabric, Azure Data Factory (ADF), Azure Data Lake e Synapse Analytics. Também tra...
Sobre este Serviço

Processa petabytes de dados em velocidade relâmpago com modelos otimizados de PySpark e pipelines de Databricks que escalam infinitamente.


Sobrecarregado por conjuntos de dados massivos que derrubam sistemas tradicionais? Precisa de processamento em tempo real que lida com bilhões de registros sem esforço? Você encontrou seu arquiteto de big data.


O que você vai receber:

  • Modelos de dados escaláveis de PySpark e transformações
  • Configurações otimizadas de clusters do Databricks
  • Arquitetura Delta Lake para transações ACID
  • Pipelines de processamento em tempo real e em lote
  • Consultas Spark SQL ajustadas para desempenho
  • Estratégias de otimização de custos e configuração de monitoramento


Minha expertise em Big Data:

Com 13+ anos arquitetando soluções Spark, construí pipelines que processam mais de 500 TB diariamente para gigantes da tecnologia, alcançando melhorias de desempenho de 10x através de técnicas avançadas de otimização e ajuste de cluster.


Tecnologias que domino:

  • Plataformas: Databricks, Apache Spark, Delta Lake, MLflow
  • Linguagens: PySpark, Scala, Spark SQL, Python
  • Otimização: Catalyst optimizer, particionamento, estratégias de cache

Idioma:

Inglês

Experiência técnica:

apache spark

Databricks

Snowflake

Especialidade:

Pipelines de dados

Desenvolvimento de ETL

Setor:

Data analytics

Serviços financeiros

Outros serviços de Engenharia de Dados que eu ofereço