Vou construir modelos de IA de aprendizado por reforço e raciocínio para pesquisa e agentes

Algumas informações foram traduzidas automaticamente.
5,0
5,0

Índia

Eu falo Inglês, Hindi, Marata

8 pedidos finalizados

Sou engenheiro de Visão Computacional e cientista de dados. Interessado em trabalhar em projetos relacionados a machine learning. Também interessado em reforço de aprendizagem e desenvolvimento de jog...
Sobre este Serviço

Você está procurando um Engenheiro de Pesquisa em IA que seja especialista em Deep Learning, Reinforcement Learning (RL) e raciocínio com Large Language Models (LLMs)?

Eu ajudo pesquisadores, startups e empresas a projetar, ajustar e otimizar sistemas avançados de IA que vão além da simples geração de texto, permitindo raciocínio, tomada de decisão e comportamento de agentes inteligentes.


O que eu ofereço:

  • Desenvolvimento de LLMs de raciocínio
  • Prompt de cadeia de pensamento
  • LLMs com ferramentas e raciocínio em múltiplas etapas
  • Benchmarking em tarefas de raciocínio
  • Reinforcement Learning para LLMs
  • RLHF (Reinforcement Learning com feedback humano)
  • RLAIF (RL com feedback de IA)
  • Otimização de políticas para alinhamento e segurança
  • Soluções personalizadas de Deep Learning
  • Arquiteturas Transformer, embeddings, IA generativa
  • Ajuste fino para tarefas específicas de domínio (chatbots, busca, sumarização, agentes)
  • Otimização e implantação
  • Compressão de modelos (quantização, poda, destilação)
  • APIs de inferência escaláveis e pipelines de MLOps

️ Ferramentas e frameworks:

  • Deep Learning: PyTorch, TensorFlow, JAX
  • Treinamento de RL e LLMs: Hugging Face TRL, bibliotecas RLHF, PPO, CRPO DeepSpeed, Accelerate
  • LLMs de raciocínio: LangChain, OpenAI API, Anthropic, LLaMA, Mistral

Especialidade:

Desenvolvimento de software

Linguagem de programação:

Python

Avaliações

1 avaliações deste Serviço
5,0

(1)
(0)
(0)
(0)
(0)
Classificação detalhada
  • Nível de comunicação do freelancer
    5
  • Recomendar a um amigo
    5
  • Serviço conforme a descrição
    5
Ordenar por
Mais relevante
  • B

    billyjoel99

    US

    Estados Unidos

    5

    Ok thank you

    Útil?
    Sim
    Não
Avaliações

1 avaliações deste Serviço
5,0

(1)
(0)
(0)
(0)
(0)
Classificação detalhada
  • Nível de comunicação do freelancer
    5
  • Recomendar a um amigo
    5
  • Serviço conforme a descrição
    5
Ordenar por
Mais relevante
  • B

    billyjoel99

    US

    Estados Unidos

    5

    Ok thank you

    Útil?
    Sim
    Não