课程价格 :
¥599.00
剩余名额
0
-
学习时长
8周/建议每周至少6小时
-
答疑服务
专属微信答疑群/讲师助教均参与
-
作业批改
课程配有作业/助教1V1批改
-
课程有效期
一年/告别拖延,温故知新
- 1:开课仪式PPT
- 2:【课件】Transformer in Vision课程介绍
- 3:【视频】Transformer in Vision课程介绍
- 第1章: Transformer 基础
- 4:【课件】Transformer基础知识介绍
- 第1节: 卷积结构与Transformer架构的对比
- 5:【视频】CNN 与 Transformer 对比
- 第2节: 注意力机制
- 6:【视频】注意力机制基础
- 第3节: Transformer架构详解
- 7:【视频】 Transformer 基本原理
- 第4节: 本章总结
- 8:【视频】本章总结
- 第5节: 作业实践:Transformer核心代码实践
- 9:【视频】本章作业
- 10-1:作业说明文档
- 10-2:【作业】第一章
- 10-3:作业代码文件
- 第2章: Transformer在图像分类中的应用
- 第1节: 图像分类任务发展历程
- 第2节: Vision Transformer(ViT)详解
- 第3节: 基于ViT的改进模型及其创新思路
- 第4节: 本章总结
- 第5节: 作业实践:TNT核心代码实践
- 第3章: Transformer在目标检测中的应用
- 第1节: 目标检测任务介绍
- 第2节: 基于CNN的目标检测网络回顾
- 第3节: 详解 Transformer 在目标检测的开山之作 DETR
- 第4节: DERT 的改进模型 Deformable DETR
- 第5节: 本章总结
- 第6节: 作业实践:DETR核心代码实践
- 第4章: Transformer在图像分割中的应用
- 第1节: 图像分割任务介绍及其相关数据集
- 第2节: 基于CNN的图像分割网络回顾
- 第3节: 基于 Transformer 的语义分割 SETR
- 第4节: 详解 SegFormer
- 第5节: 本章总结
- 第6节: 作业实践:SegFormer核心代码实践
- 第5章: Transformer在多模态任务中的应用 (上)
- 第1节: 多模态任务介绍
- 第2节: 详解多模态模型 CLIP 及其扩展
- 第3节: 讲解视觉语言预训练模型 BLIP 和 BLIP2
- 第4节: 本章总结
- 第5节: 作业实践
- 第6章: Transformer在多模态任务中的应用 (下)
- 第1节: 多模态大模型LLaVA详解
- 第2节: 讲解多模态大模型MiniGPT-4
- 第3节: 详细讲解InstructBLIP
- 第4节: 本章总结
- 第5节: 作业实践
- 第7章: Transformer的缺点以及新模型结构
- 第1节: 探讨 Transformer 现存缺点
- 第2节: 介绍 Transformer的挑战者 Mamba 模型结构
- 第3节: Mamba结构在其他相关任务上的简单介绍
- 第4节: 本章总结
- 第5节: 作业实践
- 第8章: CV大模型发展及展望
- 第1节: CV基础大模型概览
- 第2节: CV大模型展望
- 第3节: 本章总结
- 第4节: 作业实践