系统掌握Transformer在计算机视觉中的核心技术,全面解析CLIP、BLIP系列及LLaVA等多模态模型的架构设计思想与技术实现细节
基础知识与前沿算法并重,算法原理与代码实践融合讲解
精心设计作业和实践项目,班主任全程带班,助教1V1批改作业
万物皆点云
学习基于几何的三维重建完整流程,核心算法逐行代码实现
当下热门的三维重建技术
细致讲解多传感器系统的构建,实践主流的融合感知策略
溯本清源,把握问题的本质,理解经典方法的思想精髓,举一反三
系统学习人脸识别理论知识,实战交互式系统demo
三维重建中的显式建模与隐式建模,摄像机内外参数及其获取方法,神经辐射场、体渲染、神经网络与位置编码