Eu vou programar nvidia isaac sim e reinforcement learning no isaac lab


Sobre este Serviço
Tradução automática
Implante simulações aceleradas por GPU e pipelines de reinforcement learning no NVIDIA Isaac Sim
Precisa de reinforcement learning (RL) de última geração ou simulação com física precisa para quadrúpedes, bípedes ou manipuladores complexos? Eu configuro ambientes do NVIDIA Isaac Sim e Isaac Lab (antigamente Orbit) para criar pipelines de treinamento de alta fidelidade.
O que eu ofereço:
1 Importação de asset (URDF para USD):** Importar seus modelos CAD/URDFs para OpenUSD, ajustar materiais físicos, propriedades de massa e malhas de colisão.
2 Tarefas do Isaac Lab Gym:** Criar ambientes personalizados de reinforcement learning, configurar espaços de ação/observação e desenhar funções de recompensa.
3 Treinamento de políticas de RL:** Treinar políticas estáveis usando Stable-Baselines3, rsl_rl ou algoritmos PPO personalizados com ambientes paralelos acelerados por CUDA.
4 Ponte ROS2 e Sim-to-Real:** Configurar pontes de comunicação para implantar políticas de redes neurais treinadas em hardware físico real.
Entregáveis:
1 Workspace Python documentado.
2 Arquivos USD e scripts de tarefas personalizadas.
3 Pesos de modelos pré-treinados.
4 Ambiente Docker.
Por favor, entre em contato antes de fazer o pedido para discutir os objetivos de DoF e tarefas de RL do seu robô!*
Conheça mais sobre Aman Patel
System Integrator
- A partir deÍndia
- Membro desdeabr. de 2023
- Responde em aprox.:3 horas
Idiomas
Hindi, Gujarati, Inglês, Marata
Tradução automática
Meu portfólio
Perguntas frequentes
Tradução automática
Q: Por que você recomenda o NVIDIA Isaac Sim ao invés do Gazebo para treinamento de IA?
A: O Isaac Sim é construído na NVIDIA Omniverse e usa o motor de física PhysX, que roda diretamente na GPU. Isso permite simular milhares de robôs em paralelo ao mesmo tempo, acelerando o treinamento de reinforcement learning de semanas para horas.
Q: Como transferimos a política treinada para um robô real?
A: Eu configuro o script de inferência da política em Python/C++ para ler os estados das juntas em tempo real do seu hardware (via ROS2 ou comunicação serial), passar pelo modelo treinado e enviar torques ou velocidades alvo de volta aos motores.
Q: Você desenha as funções de recompensa do reinforcement learning?
A: Sim. Eu personalizo as funções de recompensa com base na sua tarefa. Por exemplo, para caminhada de quadrúpedes, incluo recompensas por velocidade de rastreamento do alvo, estabilidade de altura do corpo e contato dos pés, além de penalidades por torques altos, picos de velocidade nas juntas e colisões.
Q: Você consegue rodar o treinamento em um servidor headless?
A: Sim. Embalo todo o workspace do Isaac Sim dentro de um container Docker configurado para rodar headlessly na sua nuvem com GPU (AWS, GCP) ou servidor local, permitindo treinar modelos via SSH.

