Vou construir pipelines de big data e processar conjuntos de dados usando pyspark e sql

Algumas informações foram traduzidas automaticamente.

Paquistão

Eu falo Inglês, Francês

Engenheiro de IA, Dados e Web3

Sou um engenheiro de ML e Dados com mestrado em Dados e Inteligência pela Université Claude Bernard Lyon 1. Minha especialidade é conectar a pesquisa avançada em IA com softwares escaláveis e prontos ...
Sobre este Serviço

Está tendo dificuldades com conjuntos de dados massivos ou tempos de processamento lentos?


Sou um Engenheiro de Dados especializado em processamento de Big Data em grande escala, ETL e análise. Construo pipelines de dados altamente otimizados para ingerir, limpar e transformar gigabytes de dados de forma eficiente usando PySpark e Python. Seja para agregações complexas, mapeamento geoespacial ou visualizações limpas, entrego código pronto para produção.


Meus Serviços Principais:


  • Pipelines de Big Data: Fluxos de trabalho ETL de alto desempenho usando Apache Spark, PySpark e Python.
  • Transformações Avançadas: Consultas Spark SQL otimizadas, funções de janela complexas, UDFs e junções em grande escala.
  • Integração de Dados: Limpeza e formatação de dados estruturados/semi-estruturados para análises posteriores.
  • Dados Geoespaciais: Processamento de dados baseados em localização e séries temporais.
  • Insights Visuais: Transformando big data em visualizações acionáveis usando Pandas e Matplotlib.


Pilha Tecnológica: Python | Apache Spark | PySpark | Spark SQL | Pandas | Matplotlib


Por que me escolher?

Escrevo código limpo, escalável e totalmente documentado, garantindo que suas operações de dados sejam precisas e otimizadas computacionalmente.


Por favor, envie uma mensagem antes de fazer seu pedido para discutir seu conjunto de dados!

Destination Platform:

Databricks Lakehouse

PostgreSQL

Ferramentas e plataformas:

Outros