Eu treinarei um agente de aprendizado por reforço profundo para você


Sobre este Serviço
Tradução automática
Engenheiro de pesquisa experiente em Visão Computacional em Aprendizado por Reforço, com habilidade em treinar agentes de aprendizado por reforço.
Trabalhos anteriores incluem:
- Implementação de artigos de pesquisa.
- Agentes de Q learning para jogar jogos single e multiplayer.
- Treinamento na maioria dos ambientes do OpenAI Gym.
- Treinamento de DQN usando apenas NumPy do zero.
- Treinamento de múltiplos agentes personalizados.
- Treinamento de qualquer agente de Aprendizado por Reforço em ambientes personalizados.
Oferecendo implementação de ponta de algoritmos de aprendizado por reforço para seus ambientes personalizados ou ambientes do OpenAI gymnasium.
Capaz de lidar tanto com ambientes simples quanto complexos.
- Proficiente em MDPs, TD e Q-learning.
- DQN (Deep Q-Networks)
- PPO (Proximal Policy Optimization)
- TRPO (Trust Region Policy Optimization)
- Métodos Actor-Critic
- A2C (Advantage Actor-Critic)
- A3C (Asynchronous Advantage Actor-Critic)
- Métodos Monte Carlo
- DDPG (Deep Deterministic Policy Gradient)
- SAC (Soft Actor-Critic)
- HER (Hindsight Experience Replay)
- ACER (Actor-Critic com Replay de Experiência)
Entre em contato antes de fazer seu pedido para uma assistência rápida.
Fique tranquilo, você receberá uma resposta rápida.
Conheça mais sobre Hakim Ali
- A partir dePaquistão
- Membro desdejan. de 2023
- Última entrega2 anos
Idiomas
Inglês
Tradução automática
4 avaliações deste Serviço
| (4) | ||
| (0) | ||
| (0) | ||
| (0) | ||
| (0) |
Classificação detalhada
- Nível de comunicação do freelancer
- Recomendar a um amigo
- Serviço conforme a descrição
Ordenar por
A ash5355
Cliente recorrente

Reino Unido
This is second time I work with him..Great job..Indeed a smart person who deliver the work in a day or two as quick as posdibke covering all the requirements.
US$ 50-US$ 100
Preço
4 dias
Tempo
Útil?N 
nemosu
Cliente recorrente

Emirados Árabes Unidos
Hakim is very brilliant and talented. He gave me a perfect MLP built from scratch without using any Python libraries as I asked him and implemented TD correctly to the game. He was very patient with me in changing anything I point to him and answer any questions I had. He cares about his clients and...
US$ 50-US$ 100
Preço
4 dias
Tempo
Útil?A ash5355
Cliente recorrente

Reino Unido
Best work ever..He delivered within few hours..Perfectionist..would definitely recommend him ..He trained an RL agent for me to race car..
Útil?Z zagato5800

Alemanha
Thanks again for your fast and good work, ihkali! I am very satisfied with the results achieved and would also let you solve RL tasks in the future! In addition, a nice contact who also responds to questions very well.
Útil?
4 avaliações deste Serviço
| (4) | ||
| (0) | ||
| (0) | ||
| (0) | ||
| (0) |
Classificação detalhada
- Nível de comunicação do freelancer
- Recomendar a um amigo
- Serviço conforme a descrição
Ordenar por
A ash5355
Cliente recorrente

Reino Unido
This is second time I work with him..Great job..Indeed a smart person who deliver the work in a day or two as quick as posdibke covering all the requirements.
US$ 50-US$ 100
Preço
4 dias
Tempo
Útil?N 
nemosu
Cliente recorrente

Emirados Árabes Unidos
Hakim is very brilliant and talented. He gave me a perfect MLP built from scratch without using any Python libraries as I asked him and implemented TD correctly to the game. He was very patient with me in changing anything I point to him and answer any questions I had. He cares about his clients and...
US$ 50-US$ 100
Preço
4 dias
Tempo
Útil?A ash5355
Cliente recorrente

Reino Unido
Best work ever..He delivered within few hours..Perfectionist..would definitely recommend him ..He trained an RL agent for me to race car..
Útil?Z zagato5800

Alemanha
Thanks again for your fast and good work, ihkali! I am very satisfied with the results achieved and would also let you solve RL tasks in the future! In addition, a nice contact who also responds to questions very well.
Útil?
