Vou configurar o catálogo Unity do databricks, camadas medallion e pipelines ETL em pyspark

Algumas informações foram traduzidas automaticamente.

Vetted Pro

Paquistão

Eu falo Urdu, Inglês, Hindi, Polonês

6 pedidos finalizados

Engenheiro de dados, desenvolvedor Python, automação com IA e agentes de IA

Líder em arquitetura de dados e engenheiro de dados sênior com mais de 6 anos de experiência ajudando empresas a projetar, escalar e estabilizar suas plataformas de dados. Trabalho com empresas para ...
Verificado pelo Fiverr Pro

Hamza Anwar foi selecionado pela equipe do Fiverr Pro considerando sua experiência.

Verificado para

  • Engenharia de Dados

Sobre este Serviço

Vetted Pro

A maioria dos projetos de data lake falha na fase Silver. Os dados brutos ficam na camada Bronze e simplesmente permanecem lá, bagunçados, não confiáveis, inutilizáveis. Eu construo toda a pipeline desde a ingestão dos dados brutos até uma camada Gold que suas ferramentas de BI podem realmente consultar.


Sou um Engenheiro de Dados em Python com experiência prática em Databricks, cobrindo toda a stack lakehouse, arquitetura medallion, pipelines PySpark, Delta Lake, Unity Catalog e Databricks Workflows. Também tenho um mestrado em Business Intelligence, então entendo como os dados precisam estar na camada Gold para que os relatórios funcionem de verdade.


O que vou montar para você:

  1. Arquitetura medallion (Bronze / Silver / Gold) planejada com base nas suas fontes de dados e lógica de negócio
  2. Notebooks PySpark documentados, testados e prontos para produção
  3. Tabelas Delta com particionamento adequado, Z-ordering e vacuuming
  4. Configuração do Unity Catalog com schemas, catálogos e políticas de acesso
  5. Databricks Workflows para agendar, monitorar e reiniciar suas pipelines automaticamente
  6. Camada Gold pronta para BI, que sua equipe pode consultar desde o primeiro dia


Não sabe exatamente o que precisa? Envie suas fontes de dados e seu objetivo final, que eu te digo exatamente o que faz sentido construir.

Warehouse Platform:

Databricks

Tipo de projeto:

New Build

Clientes com quem já trabalhei
Acuity Healthcare

Acuity Healthcare

Built an automated healthcare executive leads pipeline in Python that scrapes Indeed, enriches contacts via Apollo, anymailfinder, verifies emails through Million Verifier, and delivers 2,000 job-matched leads per batch to Excel.

mar. de 2026-mai. de 2026

Meu portfólio

Outros serviços de Engenharia de Dados que eu ofereço

Tags relacionadas