Parece que este serviço está em espera
Eu vou desenvolver pipelines ETL no azure usando databricks
Estados Unidos
54 pedidos finalizados
Corrigir bug de código e repetir
Sobre este Serviço
Eu ofereço desenvolvimento básico de pipelines ETL usando Azure Databricks e Apache Spark. Este serviço é adequado para cargas de trabalho de dados pequenas a médias e implementações de aprendizado ou prototipagem.
O que eu faço:
- Construir pipelines ETL usando PySpark / Spark SQL
- Ler dados de Azure Data Lake, Blob Storage ou fontes SQL
- Aplicar transformações (filtragem, junções, agregações, limpeza de dados)
- Carregar dados processados em Delta Lake ou Azure SQL
- Criar notebooks Databricks limpos e bem estruturados
- Validação básica e código Spark com foco em desempenho
Pilha de tecnologia:
- Azure Databricks
- Apache Spark (PySpark, Spark SQL)
- Azure Data Lake / Blob Storage
- Delta Lake
Mais adequado para fluxos de trabalho ETL básicos, preparação de dados e projetos de prática em Databricks.
Envie uma mensagem antes de fazer o pedido para confirmar fontes de dados e requisitos.
Especialidade:
Big data
•
Extração de dados
•
Validação de dados
•
etl
Tecnologia:
Python
•
Databricks
Perguntas frequentes
Tradução automática
Você fornece recursos do Azure?
Não. O comprador deve fornecer acesso ao Azure Databricks, armazenamento e fontes de dados necessárias.
Quais fontes de dados você suporta?
Azure Data Lake, Azure Blob Storage, Azure SQL Database e arquivos flat (CSV, Parquet, JSON).
Qual linguagem de programação você usa?
Principalmente PySpark e Spark SQL no Azure Databricks.
Vou receber os notebooks do Databricks?
Sim. Todos os notebooks criados durante o projeto serão compartilhados.
Devo entrar em contato com você antes de fazer o pedido?
Sim. Por favor, envie uma mensagem primeiro para confirmar requisitos, fontes de dados e acesso.

