Parece que este serviço está em espera
Farei tarefas de big data usando apache hadoop superset kafka mongo clickhouse
Paquistão
Sobre este Serviço
Olá! Sou um engenheiro de dados interessado em escalar e otimizar pipelines de dados.
Este serviço é sobre oferecer meus serviços de Big-data para Machine Learning e análises com Apache Spark, Apache Hadoop, Apache Hive, Apache Kafka, Apache Airflow, superset, Spark SQL e MongoDB, clickhouse.
Programo em Python.
Gosto de transformar big-data bruto (estruturado ou não estruturado) em análises, visualizações ou para treinar modelos de ML altamente precisos.
Meu projeto anterior
- sistema de recomendação musical no spotify,
- motor de busca de arquivos Excel personalizados,
- análise de cesta de mercado da Amazon,
- otimização de cluster Hadoop,
- algoritmo de Dijkstra usando GraphX.
ferramentas: shell-scripting, hadoop, pyspark, java + spark, Scala + Spark, kafka e mongodb
Embora todos esses projetos incluam streaming de dados, ETL, análises, ML.
Além disso, posso configurar clusters Spark em VM ou na nuvem com Mesos, Yarn ou configurações standalone.
Por favor, envie uma mensagem e discuta a tarefa antes de fazer o pedido.
Obrigado, espero poder ajudar no seu próximo projeto :)
Idioma:
Inglês
Experiência técnica:
Outros
Setor:
Data analytics
