Vou configurar o catálogo Unity do databricks, camadas medallion e pipelines ETL em pyspark

Name: configurar o catálogo Unity do databricks, camadas medallion e pipelines ETL em pyspark
Brand: Fiverr
Availability: InStock

Algumas informações foram traduzidas automaticamente.

Hamza Anwar

Vetted Pro

Paquistão

Eu falo Urdu, Inglês, Hindi, Polonês

6 pedidos finalizados

Engenheiro de dados, desenvolvedor Python, automação com IA e agentes de IA

Líder em arquitetura de dados e engenheiro de dados sênior com mais de 6 anos de experiência ajudando empresas a projetar, escalar e estabilizar suas plataformas de dados. Trabalho com empresas para ...

Saiba mais

Verificado pelo Fiverr Pro

Hamza Anwar foi selecionado pela equipe do Fiverr Pro considerando sua experiência.

Verificado para

Engenharia de Dados

Sobre este Serviço

Vetted Pro

A maioria dos projetos de data lake falha na fase Silver. Os dados brutos ficam na camada Bronze e simplesmente permanecem lá, bagunçados, não confiáveis, inutilizáveis. Eu construo toda a pipeline desde a ingestão dos dados brutos até uma camada Gold que suas ferramentas de BI podem realmente consultar.

Sou um Engenheiro de Dados em Python com experiência prática em Databricks, cobrindo toda a stack lakehouse, arquitetura medallion, pipelines PySpark, Delta Lake, Unity Catalog e Databricks Workflows. Também tenho um mestrado em Business Intelligence, então entendo como os dados precisam estar na camada Gold para que os relatórios funcionem de verdade.

O que vou montar para você:

Arquitetura medallion (Bronze / Silver / Gold) planejada com base nas suas fontes de dados e lógica de negócio
Notebooks PySpark documentados, testados e prontos para produção
Tabelas Delta com particionamento adequado, Z-ordering e vacuuming
Configuração do Unity Catalog com schemas, catálogos e políticas de acesso
Databricks Workflows para agendar, monitorar e reiniciar suas pipelines automaticamente
Camada Gold pronta para BI, que sua equipe pode consultar desde o primeiro dia

Não sabe exatamente o que precisa? Envie suas fontes de dados e seu objetivo final, que eu te digo exatamente o que faz sentido construir.

Saiba mais

setup databricks unity catalog, medallion layers and pyspark etl pipelines

Tela Inteira

Visualizar Apresentação

Warehouse Platform:

Databricks

Tipo de projeto:

New Build

Clientes com quem já trabalhei

Acuity Healthcare

Built an automated healthcare executive leads pipeline in Python that scrapes Indeed, enriches contacts via Apollo, anymailfinder, verifies emails through Million Verifier, and delivers 2,000 job-matched leads per batch to Excel.

mar. de 2026-mai. de 2026

Meu portfólio

Outros serviços de Engenharia de Dados que eu ofereço

ETLs de dados
A partir de US$ 150

Perguntas frequentes

Tradução automática

O que é arquitetura medallion e eu preciso dela?

Medallion é uma abordagem em camadas para organizar dados em um lakehouse. Bronze contém os dados brutos. Silver limpa e conforma esses dados. Gold agrega em tabelas prontas para negócios. Se você tem múltiplas fontes de dados e precisa de dados confiáveis e consultáveis para relatórios ou ML, esse é o padrão certo.

Eu preciso de um workspace Databricks já criado?

Sim, você vai precisar de um workspace Databricks configurado na Azure, AWS ou GCP. Eu trabalho dentro do seu ambiente, assim tudo fica na sua conta. Se não souber o que configurar primeiro, me envie uma mensagem que posso te orientar.

Quais fontes de dados você consegue ingestar na Bronze?

APIs REST, bancos relacionais (PostgreSQL, MySQL, SQL Server), arquivos de armazenamento na nuvem (CSV, JSON, Parquet, Avro no S3 ou ADLS), fontes de streaming via Auto Loader, e plataformas de terceiros. Me diga suas fontes e eu confirmo o que é mais fácil ou o que precisa de trabalho extra.

O que é Unity Catalog e por que isso importa?

Unity Catalog é a camada de governança de dados do Databricks. Permite controlar quem pode acessar quais tabelas, rastrear a linhagem dos dados e gerenciar schemas em diferentes workspaces num só lugar. Para equipes com múltiplos usuários ou requisitos regulatórios, vale a pena configurar desde o começo.

A camada Gold consegue se conectar ao Power BI ou Tableau?

Sim. Tabelas Delta Gold se conectam nativamente ao Power BI via o conector do Databricks, e ao Tableau e Looker Studio do mesmo jeito. Eu estruturo a camada Gold para que sua ferramenta de BI possa consultá-la diretamente, sem precisar de transformação adicional.

Procurando criatividade?

Procurando por um especialista em tecnologia?

Pronto para alcançar e converter consumidores?

Procurando escritores?

Faça seu negócio funcionar de forma mais inteligente