系统掌握Transformer在计算机视觉中的核心技术,全面解析CLIP、BLIP系列及LLaVA等多模态模型的架构设计思想与技术实现细节
深入理解大模型微调与部署的原理、方法和最佳实践,获得在不同应用场景中灵活运用大模型的能力
C++ IO 流的整体框架与功能划分, 每个组成部分的具体功能、实现细节与如何扩展, 结合新的C++语言工具实现更复杂的功能(如国际化、流同步等)
学习基于几何的三维重建完整流程,核心算法逐行代码实现
全面梳理BEV感知算法及其发展脉络,细致讲解各类代表性算法的代码实现,分享BEV落地的工程实践经验
论文第一作者直击分享!
讲解端到端语音识别的框架及其核心模块,并以FunASR开源库为例讲解实现与部署
3位一线青年学者直播分享大模型的压缩与部署,内容主要包括:大模型高效微调、量化、软硬件协同设计等
讲解工业界常用的模型压缩方法(量化、稀疏)以及实战经验,课程无需模型压缩的经验即可听懂