Vou construir pipelines de dados end to end no GCP usando pubsub, kafka e dataform

Algumas informações foram traduzidas automaticamente.

Índia

Eu falo Inglês, Hindi
Sou Arpit, graduado em IIT M.Tech e Engenheiro de Dados Certificado pela GCP, especializado em arquitetar soluções de alto impacto e escaláveis. Com mais de 4 anos de experiência em engenharia de dado...
Sobre este Serviço

Uma plataforma de dados moderna exige uma ingestão robusta e análises modeladas com cuidado. Como um Engenheiro de Dados Certificado pelo Google Cloud, construo sistemas de ponta a ponta garantindo a integridade dos dados desde a fonte até o dashboard.


Eu projeto pipelines orientados a eventos de alto volume com entrega pelo menos uma vez, enquanto arquiteturo modelos centralizados no BigQuery que unem tabelas distintas de mais de 19 unidades de negócio.


O que posso fazer por você:

  • Ingestão em Tempo Real: Arquitetar sistemas seguros usando Apache Kafka & GCP Pub/Sub em Java Spring Boot.
  • Processamento Sem Servidor: Projetar microsserviços desacoplados via Cloud Run para transformar grandes conjuntos de dados.
  • Modelagem Dimensional: Transformar dados brutos do BigQuery em Star Schemas usando Dataform, aplicando SCD Tipo 2 & 4.
  • Orquestração: Orquestrar fluxos de trabalho ELT em várias etapas via Cloud Composer (Airflow) para automatizar jobs do Dataform.


Tecnologias que uso: GCP Pub/Sub, Kafka, BigQuery, Dataform, Java (Spring Boot), Cloud Run, Airflow e Terraform.


Por que me escolher? Você terá um especialista em nuvem certificado que implementa frameworks robustos de qualidade de dados, registrando falhas de asserção em tabelas de erro persistentes para que suas análises permaneçam confiáveis.


Vamos conversar antes de você fazer o pedido para alinharmos o escopo!

Destination Platform:

Google BigQuery

Databricks Lakehouse

Ferramentas e plataformas:

Fivetran

Airbyte