四足机器人：从动力学建模到强化学习 - 深蓝学院 - 专注人工智能与机器人的学习平台

学习时长

8周/建议每周至少6小时
答疑服务

专属微信答疑群/讲师助教均参与
作业批改

课程配有作业/助教1V1批改
课程有效期

一年/告别拖延，温故知新

第一期 26年05月22日开课
报名中

课程价格：￥899.00

支持花呗分期

剩余名额： 80个

加入购物车立即报名

第一期 26年05月22日开课

课程价格：￥899.00

支持花呗分期

加入购物车立即报名

第1章: 导论：四足控制的演进与可微仿真
第1节: 四足机器人控制的技术演进：PID → MPC → RL
第2节: 传统方法的能力边界：MPC 为什么在碎石路摔倒
第3节: 可微仿真：统一 MPC 与 RL 的技术桥梁
第4节: MATRiX 平台：可微、GPU 并行、平台无关

第2章: 机器人建模：URDF与刚体动力学
第1节: URDF 解析：17 个连杆、运动学树结构
第2节: 四元数与构型流形：n_q=19 vs n_v=18
第3节: 浮动基座运动方程与欠驱动的两条间接路径
第4节: ABA / RNEA 算法与李群积分
第5节: Project 1：仿真环境搭建与动力学验证

第3章: 模型精度与系统辨识
第1节: URDF 参数精度评估：206 个参数分类
第2节: 关节摩擦模型：库仑 + 粘性 + Stribeck
第3节: 折算转子惯量：KNEE 转子惯量是连杆的 100 倍
第4节: 经典辨识：单关节实验 → 回归 → 最小二乘
第5节: MATRiX 可微梯度辨识：jax.grad 直接求导

第4章: 强化学习与运动控制（上）
第1节: PPO 算法：截断比率的直觉
第2节: MATRiX GPU 并行训练：4096 环境 vs Isaac Gym
第3节: 观测空间设计：48 维向量每项物理含义
第4节: 奖励函数设计：速度跟踪 · 步态约束 · 能耗惩罚
第5节: Trot 步态约束实现与调参经验

第5章: 强化学习与运动控制（下）
第1节: Domain Randomization：参数分布上的期望优化
第2节: 辨识值 → DR 范围：有辨识 vs 无辨识效果对比
第3节: Curriculum Learning：5 阶段渐进训练
第4节: 地形生成：斜坡 · 碎石 · 台阶 · 随机凹凸
第5节: Project 2：行走策略训练与地形泛化

第6章: Sim-to-Real 迁移
第1节: Gap 系统性分解：6 个来源 × 严重度 × 解决方法
第2节: 摩擦前馈补偿：收益最大、成本最低的技术
第3节: 教师-学生蒸馏（RMA 范式）：三步训练流程
第4节: PD 增益调优与实机安全流程
第5节: Project 3：策略部署与摩擦补偿

第7章: 感知导航与系统集成
第1节: 6 层分层架构：VLN → 导航 → RL → PD → 硬件
第2节: RoamerX 导航栈：LiDAR SLAM + 路径规划
第3节: 视觉语言导航（VLN）：自然语言 → 运动指令
第4节: 高级运动技能：跳跃力矩估算与实现

第8章: 实机部署与案例分析
第1节: IROS 2025 四足挑战赛冠军案例详解
第2节: 赛场应急：“15 分钟重新训练”的工程实现
第3节: 前沿展望：四足→人形的技术迁移路径
第4节: 学员 Project 展示与点评
第5节: Project 4：完整四足自主系统（Final）

Project 1：仿真环境搭建与动力学验证

在MATRiX中加载ZSL-1，SDK遥控行走，计算质量矩阵M和重力向量g，验证零力矩时基座自由落体，可视化12个关节传感器数据。

Project 2：行走策略训练与地形泛化

设计奖励函数，PPO+MATRiX并行训练Trot步态，设置DR（基于第3章辨识值），在≥3种地形上评估泛化能力，对比有/无DR策略表现。

Project 3：策略部署与摩擦补偿

通过SDK底层接口部署策略，实现摩擦前馈补偿，对比三组实验：无补偿/摩擦补偿/补偿+DR，量化关节跟踪误差和跌倒率。

Project 4：完整四足自主系统（Final）

综合性Final Project，在MATRiX场景中整合RoamerX导航栈与RL运动策略，实现“目标点→自主导航→到达”完整闭环，含消融实验和失败分析。

+ 86

中国 +86
美国 +1
日本 +81
中国香港 +852
中国澳门 +853
中国台湾 +886
马来西亚 +60
澳大利亚 +61
加拿大 +1
英国 +44
新加坡 +65
德国 +49
俄罗斯 +7
埃及 +20
南非 +27
希腊 +30
荷兰 +31
比利时 +32
法国 +33
西班牙 +34
匈牙利 +36
意大利 +39
罗马尼亚 +40
瑞士 +41
奥地利 +43
丹麦 +45
瑞典 +46
挪威 +47
波兰 +48
秘鲁 +51
墨西哥 +52
古巴 +53
阿根廷 +54
巴西 +55
智利 +56
哥伦比亚 +57
委内瑞拉 +58
印度尼西亚 +62
菲律宾 +63
新西兰 +64
泰国 +66
哈萨克斯坦 +7
韩国 +82
越南 +84
土耳其 +90
印度 +91
巴基斯坦 +92
阿富汗 +93
斯里兰卡 +94
缅甸 +95
伊朗 +98
摩洛哥 +212
阿尔及利亚 +213
突尼斯 +216
利比亚 +218
冈比亚 +220
塞内加尔 +221
马里 +223
几内亚 +224
科特迪瓦 +225
布基纳法索 +226
尼日尔 +227
多哥 +228
贝宁 +229
毛里求斯 +230
利比里亚 +231
塞拉利昂 +232
加纳 +233
尼日利亚 +234
乍得 +235
中非共和国 +236
喀麦隆 +237
圣多美和普林西比 +239
加蓬 +241
刚果民主共和国 +243
安哥拉 +244
阿森松岛 +247
塞舌尔 +248
苏丹 +249
埃塞俄比亚 +251
索马里 +252
吉布提 +253
肯尼亚 +254
坦桑尼亚 +255
乌干达 +256
布隆迪 +257
莫桑比克 +258
赞比亚 +260
马达加斯加 +261
津巴布韦 +263
纳米比亚 +264
马拉维 +265
莱索托 +266
博茨瓦纳 +267
斯威士兰 +268
直布罗陀 +350
葡萄牙 +351
卢森堡 +352
爱尔兰 +353
冰岛 +354
阿尔巴尼亚 +355
马耳他 +356
塞浦路斯 +357
芬兰 +358
保加利亚 +359
立陶宛 +370
拉脱维亚 +371
爱沙尼亚 +372
摩尔多瓦 +373
亚美尼亚 +374
白俄罗斯 +375
安道尔共和国 +376
摩纳哥 +377
圣马力诺 +378
乌克兰 +380
斯洛文尼亚 +386
捷克 +420
斯洛伐克 +421
列支敦士登 +423
伯利兹 +501
瓜地马拉 +502
萨尔瓦多 +503
洪都拉斯 +504
尼加拉瓜 +505
哥斯达黎加 +506
巴拿马 +507
海地 +509
玻利维亚 +591
圭亚那 +592
厄瓜多尔 +593
法属圭亚那 +594
巴拉圭 +595
马提尼克 +596
苏里南 +597
乌拉圭 +598
文莱 +673
巴布亚新几内亚 +675
汤加 +676
所罗门群岛 +677
斐济 +679
库克群岛 +682
法属波利尼西亚 +689
柬埔寨 +855
老挝 +856
孟加拉国 +880
马尔代夫 +960
黎巴嫩 +961
约旦 +962
叙利亚 +963
伊拉克 +964
科威特 +965
沙特阿拉伯 +966
也门 +967
阿曼 +968
阿拉伯联合酋长国 +971
以色列 +972
巴林 +973
卡塔尔 +974
蒙古 +976
尼泊尔 +977
塔吉克斯坦 +992
土库曼斯坦 +993
阿塞拜疆 +994
格鲁吉亚 +995
吉尔吉斯斯坦 +996
乌兹别克斯坦 +998
巴哈马 +1242
巴巴多斯 +1246
安圭拉岛 +1264
安提瓜和巴布达 +1268
开曼群岛 +1345
百慕大群岛 +1441
格林纳达 +1473
蒙特塞拉特岛 +1664
关岛 +1671
毛里塔尼亚 +222
圣露西亚 +1758
波多黎各 +1787
多明尼加共和国 +1809
特立尼达和多巴哥 +1868
牙买加 +1876
塞尔维亚共和国 +381

获取验证码

账号密码登录

未注册验证后自动登录，注册/登录则视为同意

《服务协议》和《隐私协议》

未注册验证后自动登录，注册/登录则视为同意

《服务协议》和《隐私协议》

服务协议反馈建议联系邮箱：hezuo@shenlanxueyuan.com

友情链接：

在线咨询

常见问题

证书查询

返回顶部

学习时长

答疑服务

作业批改

课程有效期

相关推荐