VLN-PE:视觉语言导航物理仿真平台及研究

主讲人:王柳懿 | 同济大学RAIL实验室博士研究生,上海AI Lab算法实习生

  • 开课时间

    2025.08.26 20:00

  • 课程时长

    100分钟

  • 预约人数

    16人预约

立即报名
添加助教,入群交流

直播将于08月26日 20:00开始

立即报名

已有16人报名了此课程

VLN-PE:视觉语言导航物理仿真平台及研究

近年来,视觉语言导航(VLN)取得了显著进展,但多数方法仍基于对机器人运动与控制的理想化假设,难以真实反映具身部署中的复杂挑战。

VLN-PE基于桃源系统开发而成,是一个具备物理真实感的导航仿真平台,支持人形、四足和轮式机器人,能够覆盖多种技术路径下的典型方法评估,包括受限视角的分类模型、扩散路径预测模型,以及结合地图与大语言模型的零训练方法。

研究表明,现有方法在实际物理平台上性能显著下降,主要受限于视角抖动、观测空间狭小、光照变化、碰撞与跌倒等因素,特别是在复杂环境中,足式机器人的运动能力也面临严峻考验。

VLN-PE 具备高度扩展性,支持集成 MP3D 以外的新场景,为构建更具适应性与鲁棒性的导航系统提供了新的平台,也为社区深入理解和突破 VLN 局限性提供一定的启示。

直播精华文稿暂未上传
直播课件暂未上传
机器人与自动驾驶 具身智能 规划控制 定位与建图 具身智能 进阶
机器人与自动驾驶 具身智能 具身智能 高级
机器人与自动驾驶 具身智能 具身智能 进阶
机器人与自动驾驶 人形机器人 三维视觉 规划控制 定位与建图 具身智能 环境感知 高级