系统掌握Transformer在计算机视觉中的核心技术,全面解析CLIP、BLIP系列及LLaVA等多模态模型的架构设计思想与技术实现细节
全面覆盖运动规划、视觉反馈、模仿学习、VLA 等关键技术,贯穿 “感知 - 决策 - 控制” 全流程
涵盖抓取与操作的主流算法及Project实践,课程内容融合工业界机器人与具身智能的开发实战经验
讲解自动驾驶预测和决策的典型算法,分析预测决策的建模技巧和数据驱动方法,分享量产自动驾驶中的难点场景和潜在方案
系统拆解RAG技术体系,结合行业案例与实战教学,培养企业级工程落地能力。
掌握人形机器人项目开发全流程,深入强化学习、定位规划及VLN等前沿技术
CUDA核心的并行运算操作,涵盖主流的模型加速工具cuDNN与TensorRT。
虽然是基础,但也可以讲得很深入。学习C++语法,更能学到C++的编程思想。
深入理解大模型微调与部署的原理、方法和最佳实践,获得在不同应用场景中灵活运用大模型的能力
全面梳理BEV感知算法及其发展脉络,细致讲解各类代表性算法的代码实现。