多模态大模型时代的智能体研究：从可供性，功能理解到运动输出 - 深蓝学院 - 专注人工智能与机器人的学习平台

收藏

邀
请
朋
友
一
起
学

多模态大模型时代的智能体研究：从可供性，功能理解到运动输出

主讲人：黄思渊 | 上海交通大学-上海人工智能实验室联培博士生

开课时间

2024.10.15 19:55
课程时长

81分钟
学习人数

4859人次学习

立即学习

添加助教，领取课件

立即学习

多模态大模型时代的智能体研究：从可供性，功能理解到运动输出

随着多模态大模型的迅速发展，越来越多的研究探索其在机器人领域（尤其是具身任务中）的应用，以增强机器人的高层推理和底层运动能力。然而，具身任务与传统视觉任务在关注点上存在显著差异，且现有的具身数据不足以支持从头训练多模态大模型。为此，本报告将从可供性和功能理解的角度出发，探讨如何以最小成本构建具身任务与视觉任务之间的桥梁。这一研究旨在激活现有通用多模态大模型在具身任务中的潜力，推动机器人技术的进一步发展，使其在复杂环境中表现得更灵活和智能。

课程介绍
课件领取
相关课程

随着多模态大模型的迅速发展，越来越多的研究探索其在机器人领域（尤其是具身任务中）的应用，以增强机器人的高层推理和底层运动能力。然而，具身任务与传统视觉任务在关注点上存在显著差异，且现有的具身数据不足以支持从头训练多模态大模型。为此，本报告将从可供性和功能理解的角度出发，探讨如何以最小成本构建具身任务与视觉任务之间的桥梁。这一研究旨在激活现有通用多模态大模型在具身任务中的潜力，推动机器人技术的进一步发展，使其在复杂环境中表现得更灵活和智能。

点击领取完整课件

关于我们版权声明联系电话：010-86226736

服务协议反馈建议联系邮箱：hezuo@shenlanxueyuan.com

友情链接：

在线咨询

返回顶部