Eu vou projetar algoritmos de aprendizado de reforço profundo

Algumas informações foram traduzidas automaticamente.

Quênia

Eu falo Inglês

1 pedido finalizado

Olá! Sou um cientista de dados altamente qualificado, com expertise em aprendizado de máquina, aprendizado profundo e aprendizado por reforço. Tenho uma forte formação em IA e desenvolvi algoritmos...
Sobre este Serviço

Olá!!

Bem-vindo ao meu serviço,


Ofereço expertise em Aprendizado por Reforço Profundo (RL). Tenho experiência em diversos projetos acadêmicos e industriais, e já apresentei meu trabalho em principais conferências de IA.

Aqui, ofereço ajuda na construção de agentes de RL que podem resolver quase qualquer problema do mundo real, incluindo multiobjetivo e multiagente, baseado em preferências e RL guiado por humanos. Sou especialista nas seguintes áreas:


  • Algoritmos de RL baseados em modelo ou sem modelo
  • Problemas simples ou complexos de processo de decisão de Markov (MDP)
  • Algoritmos de RL on-policy e off-policy, como:
  • Q-learning, SARSA, CQL, DQN, A2C, TRPO, PPO, SAC, TD3 e outros algoritmos de RL sem modelo
  • Ambientes personalizados ou simulados, como controladores de semáforo (SUMO), controladores de data center, MuJoCo, Unity, PyBullet e OpenAI Gym
  • Problemas de RL multiagente, como Independent DQN, Independent PPO, MAPPO, QMIX, VDN e outros métodos de fatoração de valor
  • Aprendizado por reforço baseado em preferências, como PbRL com feedback sintético e humano


Tenho facilidade em trabalhar com as seguintes linguagens e ferramentas:

  • Python
  • TensorFlow
  • Keras
  • PyTorch
  • NumPy
  • Pandas
  • Matplotlib


Sinta-se à vontade para me enviar uma mensagem para discutir seu projeto.

Atenciosamente.

Especialidade:

processamento de imagem

Feature learning

Linguagem de programação:

Python

SQL

Colab

JAVA

MLflow

Frameworks:

DeepPy

Google ML Kit

PyTorch

APIs:

IA de Visão Computacional da Microsoft

Ferramentas:

caderno Jupyter

fluxo tensor

Excel

MLflow

Colab