三维场景理解的通用模型与评估基准 - 深蓝学院 - 专注人工智能与机器人的学习平台

收藏

邀
请
朋
友
一
起
学

三维场景理解的通用模型与评估基准

主讲人：黄江勇 | 北京大学博士生

开课时间

2025.01.15 19:55
课程时长

87分钟
学习人数

3827人次学习

立即学习

添加助教，领取课件

立即学习

三维场景理解的通用模型与评估基准

三维场景理解能力是具身通用智能体的一项关键能力，我们提出三维场景中的通用智能体LEO，基于以物体为中心的三维点云表征与语言模型，展示了其在三维场景理解以及具身交互等任务中的出色表现。另一方面，三维场景理解能力的评估方法与测试基准存在诸多局限性，针对此我们提出了新的测试基准Beacon3D，引入了以物体为中心的评估框架以及基于任务链的一致性分析。

课程介绍
课件领取
相关课程

三维场景理解能力是具身通用智能体的一项关键能力，我们提出三维场景中的通用智能体LEO，基于以物体为中心的三维点云表征与语言模型，展示了其在三维场景理解以及具身交互等任务中的出色表现。另一方面，三维场景理解能力的评估方法与测试基准存在诸多局限性，针对此我们提出了新的测试基准Beacon3D，引入了以物体为中心的评估框架以及基于任务链的一致性分析。

点击领取完整课件

关于我们版权声明联系电话：010-86226736

服务协议反馈建议联系邮箱：hezuo@shenlanxueyuan.com

友情链接：

在线咨询

返回顶部