← 返回首页

RL 控制模块

建设中。这个模块用于整理机器人强化学习控制与部署链路。

PPO / SAC / TD3 基础
状态空间、动作空间、奖励函数
Isaac Lab / MuJoCo / PyBullet 对比
ONNX 策略导出与 C++ 推理部署
Sim2Real gap 与真机调试
日志、回放、策略评估与安全保护