-
学习时长
9周/建议每周至少6小时
-
答疑服务
专属微信答疑群/讲师助教均参与
-
作业批改
课程配有作业/助教1V1批改
-
课程有效期
一年/告别拖延,温故知新
为什么要学这门课程
人形机器人作为具身智能的终极载体,已成为全球科技竞争的核心赛道。而运动控制能力是决定人形机器人能否从实验室走向千家万户、实现最终商业落地的核心瓶颈。尽管前景广阔,但复杂地形的双足稳定行走、全身自然流畅动作、带感知的运动闭环等技术难题尚未完全攻克。
与此同时,市场对掌握这些核心技术的专业人才需求激增,人才缺口日益扩大。但多数学习者要么空有理论,无法训练贴合真机物理特性、可实机迁移的控制策略;要么仅掌握基础控制方法,难以应对高自由度、复杂地形、动作模仿、全身运控等核心问题。
为此,我们推出这门以宇树G1为实践载体的人形机器人运动控制课程。围绕平地行走、斜坡/碎石/楼梯等复杂地形越障、动作风格模仿、全身协同控制以及融合感知的跨地形行走等任务展开。从感知空间、动作空间、奖励函数等多维度逐层拆解对比主流强化学习运控算法。让大家不仅学懂算法背后的原理,更能上手训练在真机上稳定运行的智能策略,具备人形机器人运动控制的核心研发能力。
课程亮点
直指人形机器人最核心、最难突破的运动控制模块,每一讲都围绕运控核心难题展开。
不止于论文复现,而是将运控算法拆解到RL的观测空间、动作空间、奖励函数等核心模块。
丰富的实践项目,覆盖复杂地形行走、风格模仿、重定向、全身运控、感知运控闭环等。
课程收获
课程讲师
孔 贺
南科大研究员,博士生导师,机器人研究院副院长、自动化与智能制造学院副院长
孔贺,南方科技大学研究员,博士生导师,南科大机器人研究院副院长、自动化与智能制造学院副院长。本硕博分别毕业于中国矿业大学、哈尔滨工业大学、澳大利亚Newcastle大学,曾在悉尼大学野外机器人研究中心开展博士后研究。入选国家海外高层次人才青年项目,近三年主持获批国自然原创探索计划项目、国自然联合基金重点项目、国家重点研发计划-智能机器人重点专项课题。主要致力于机器人多模态感知及融合、机器人与航天器控制等方面的研究。担任IEEE RAL、IEEE RAM、IEEE Sens. Lett.、IJACSP副主编以及机器人领域多个主流会议副主编。
课程大纲
- 第1章: 人形机器人运动控制导论
- 第1节: 人形机器人的任务
- 第2节: 人形机器人运动控制技术发展脉络
- 第3节: 宇树G1人形机器人硬件与软件架构解析
- 第4节: 人形机器人强化学习运控核心逻辑
- 第5节: 人形运控核心痛点
- 第6节: 课程学习路径
- 第7节: 实践1:宇树G1仿真环境(Isaac Lab/MuJoCo)搭建与基础功能验证
- 第2章: 感知系统与RL观测空间设计
- 第1节: 机器人本体感知传感器(RL核心观测来源)
- 第2节: 环境感知传感器(高阶场景观测来源)
- 第3节: 宇树G1的RL观测空间工程化设计
- 第4节: 实践2:不同运控任务中的RL观测空间设计
- 第3章: 执行系统与RL动作空间设计
- 第1节: 机器人执行系统硬件解析
- 第2节: 关节级PD控制核心原理
- 第3节: RL动作空间设计与PD控制的融合
- 第4节: 实践3:如何打通RL动作空间设计与底层PD控制链路
- 第4章: 人形机器人RL奖励函数设计
- 第1节: 奖励函数设计的底层逻辑
- 第2节: 人形运控任务的奖励项拆解与G1适配
- 第3节: 宇树G1典型任务奖励函数设计实战案例
- 第4节: 奖励函数的优化与调试方法论
- 第5节: 实践4:G1复杂地形行走任务与AMP奖励函数的对比
- 第6节: Sim-to-Real迁移核心技术
- 第7节: 实践5:G1复杂地形行走任务域随机化
- 第5章: 人形运控常用RL算法与训练
- 第1节: 人形机器人RL算法选型逻辑
- 第2节: PPO(近端策略优化)算法详解
- 第3节: AMP(对抗性运动先验)算法详解
- 第4节: 实践6:尝试调整Policy与Value网络结构和参数
- 第6章: 数据重定向与AMP运动模仿
- 第1节: 人体全身运动数据采集技术
- 第2节: 动作重定向(Retarget)
- 第3节: 基于AMP的G1全身人类运动模仿
- 第4节: 实践7:基于GMR算法的G1动作重定向
- 第5节: 实践8:基于AMP算法,实现G1 拟人步态行走
- 第7章: 全身运动控制与轨迹跟踪
- 第1节: 全身运动控制架构与逻辑
- 第2节: 单轨迹跟踪BeyondMimic
- 第3节: 通用轨迹跟踪GMT与SONIC
- 第4节: 实践9:BeyondMimic训练与部署
- 第5节: 实践10:SONIC仿真部署实践
- 第8章: 带感知的人形机器人运动控制
- 第1节: 感知-运动闭环控制架构
- 第2节: 基于视觉感知的跨地形自适应行走
- 第3节: 融合感知和面向交互的运动控制
- 第4节: 实践11:复杂地形感知与自适应行走
这门课适合谁
希望系统学习基于强化学习的人形机器人运控算法的在校学生、科研人员
从事人形机器人、具身智能、双足/四足机器人算法研发的工程师
具备强化学习和机器人学基础,希望转型人形机器人方向的算法开发者
基础&设备要求
基础要求
数学基础:线性代数、刚体运动学与动力学、概率论与数理统计
编程基础:熟练使用Python/PyTorch,具备基础的C++/ROS开发能力
理论基础:具备强化学习(RL)理论基础、机器人学基础
设备要求
算力要求:NVIDIA 3060及以上GPU,显存>=8G
操作系统:Ubuntu22.04
全方位的学习服务
作业批改
助教1V1批改作业,定期针对作业中的“通病”进行点评
结业证书
本课程将根据作业完成情况评选结业学员及优秀学员,颁发证书
实时答疑
讲师和助教微信答疑,及时解决大家遇到的问题
班班督学
班主任全程带班,不定时“关照”未交作业的同学,克服拖延
上课流程说明
进入答疑群,参加开课仪式
每周学习课程,完成作业
助教1V1批改作业、社群内讲评答疑
完成课程,领取证书
— 开启“人形机器人运动控制 ”的学习之旅吧 —
Q1
学习形式是什么样的?
A:为了保证学习效果,本门课程采取录播的形式,每周解锁一章。建议同学们登录深蓝学院PC端官网,体验更佳!
Q2
课程有有效期吗?
A:为了督促同学们学习,保证学习效率,学院的课程有效期均为一年,当课程有效期截止后将不再支持观看视频、下载课件等课程服务及操作。若同学们依旧想观看视频和下载课件,建议可选择续费本课程。需要提醒大家的是,课程答疑、作业批改&讲评等课程相关服务仅限开课仪式至结课仪式期间。
Q3
作业会提供参考答案吗?
A:课程不提供参考答案。每章作业截止提交后,会组织作业讲解。我们倾向于引导大家培养独立思考的习惯与敢于动手实践的勇气,以便于更快适应实际工作中解决问题的模式。做作业过程中,如果有任何困惑和问题,可以在答疑群中提问解决。
Q4
如果不满意,可以退款吗?
A:我们承诺:开班后7天内可以无条件全额退款。课好不好,学了就知道了!
更多信息,请添加客服咨询
添加时请备注关键词『人形运控』
