Vou construir um pipeline de data lakehouse em tempo real

Algumas informações foram traduzidas automaticamente.

Sri Lanka

Eu falo Cingalês, Inglês

Desenvolvedor Python, FastAPI, Web Scraping, automação com IA, Engenharia de Dados

Sou um Engenheiro de Dados com mais de 3 anos de experiência na indústria criando APIs RESTful, sistemas de web scraping e aplicações alimentadas por IA. Sou especialista em FastAPI, Streamlit e LangG...
Sobre este Serviço

Quer criar um pipeline de dados em tempo real que mantém seu data warehouse sempre atualizado sem jobs manuais de ETL?


Vou projetar e entregar um pipeline de data lakehouse totalmente automatizado, de ponta a ponta, que captura toda mudança no seu banco de dados no momento em que acontece, transmite via Kafka e armazena como tabelas Delta Lake consultáveis, tudo orquestrado e monitorado pelo Apache Airflow.

O que você recebe:


  • CDC ao vivo do seu banco MySQL (sem downtime, sem exportações manuais)
  • Processamento de stream escalável com Apache Spark
  • Armazenamento Delta Lake compatível com S3 (MinIO) consultável com Trino ou Spark SQL
  • Airflow DAG para verificações de saúde automatizadas e monitoramento do pipeline
  • Execuções totalmente Dockerizadas no seu servidor ou VM na nuvem
  • Guia de configuração e documentação inclusos


Perfeito para startups, equipes de dados e negócios que precisam de disponibilidade de dados confiável em tempo real, sem gerenciar infraestrutura complexa do zero.

Destination Platform:

Databricks Lakehouse

PostgreSQL

mySQL

Ferramentas e plataformas:

Airbyte

Kafka Connect

Debezium

Meu portfólio