• 学习时长

    8周/建议每周至少6小时

  • 答疑服务

    专属微信答疑群/讲师助教均参与

  • 作业批改

    课程配有作业/助教1V1批改

  • 课程有效期

    一年/告别拖延,温故知新

支持花呗分期

  • 1:开课仪式PPT
  • 2:【课件】Transformer in Vision课程介绍
  • 3:【视频】Transformer in Vision课程介绍
  • 第1章: Transformer 基础
  • 4:【课件】第一章讲义-Transformer基础知识介绍
  • 第1节: CNN与Transformer对比
  • 5:【视频】CNN 与 Transformer 对比
  • 第2节: 注意力机制基础
  • 6:【视频】注意力机制基础
  • 第3节: Transformer基本原理
  • 7:【视频】 Transformer 基本原理
  • 第4节: 本章总结
  • 8:【视频】本章总结
  • 第5节: 本章作业
  • 9:【视频】本章作业
  • 10-1:作业说明文档
  • 10-2:【作业】第一章
  • 10-3:作业代码文件
  • 10-4:作业思路讲解
  • 第2章: Transformer在图像分类中的应用
  • 11:【课件】第二章讲义-Transformer 在图像分类中的应用
  • 第1节: 图像分类数据集介绍
  • 12:【视频】图像分类数据集
  • 第2节: 基于CNN的图像分类模型
  • 13:【视频】基于CNN的图像分类
  • 第3节: 基于transformer的图像分类模型
  • 14:【视频】基于Transformer的图像分类算法
  • 15:【视频】ViT算法精讲
  • 16:【视频】TNT算法精讲
  • 17:【视频】CvT算法精讲
  • 第4节: 本章总结
  • 18:【视频】本章小结
  • 第5节: 本章作业
  • 19:【视频】本章作业
  • 20-1:作业说明文档
  • 20-2:【作业】第二章
  • 20-3:作业思路讲解
  • 第3章: Transformer在目标检测中的应用
  • 21:【课件】第三章讲义-Transformer 在目标检测中的应用
  • 第1节: 目标检测基本知识
  • 22:【视频】 目标检测基础
  • 第2节: CNN-based目标检测
  • 23:【视频】基于CNN目标检测概述
  • 24:【视频】两阶段目标检测
  • 25:【视频】一阶段目标检测
  • 第3节: Transformer-based目标检测
  • 26:【视频】基于Transformer的目标检测
  • 第4节: 本章总结
  • 27:【视频】总结
  • 第5节: 本章作业
  • 28:【视频】本章作业
  • 29-1:作业说明文档
  • 29-2:【作业】第三章
  • 29-3:作业思路讲解
  • 第4章: Transformer在图像分割中的应用
  • 30:【课件】第四章讲义-Transformer 在图像分割中的应用
  • 第1节: 图像分割任务介绍及其相关数据集
  • 31:【视频】 图像分割任务介绍及其相关数据集
  • 第2节: 基于CNN的图像分割方法
  • 32:【视频】基于CNN的图像分割方法
  • 第3节: 基于 Transformer 的语义分割
  • 33:【视频】基于 Transformer 的语义分割
  • 第4节: 本章总结
  • 34:【视频】总结
  • 第5节: 本章作业
  • 35:【视频】作业视频
  • 36-1:作业说明文档
  • 36-2:【作业】第四章
  • 36-3:第四章作业思路讲解
  • 第5章: Transformer在多模态任务中的应用 (上)
  • 37:【课件】第5章讲义-Transformer之多模态研发
  • 第1节: 预备知识
  • 38:【视频】预备知识
  • 第2节: 视觉语言预训练模型
  • 39:【视频】CLIP
  • 40:【视频】 BLIP
  • 41:【视频】 BLIP2
  • 第3节: 本章总结
  • 42:【视频】总结
  • 第6章: Transformer在多模态任务中的应用 (下)
  • 43:【课件】第6章-Transformer之多模态研发II_Final_Record_watermark
  • 第1节: 代表性工作
  • 44:LLaVA
  • 45:MiniGPT-4
  • 46:InstructBLIP
  • 第2节: 基于VLM的下游应用
  • 47:其他基于VLM的下游应用
  • 第3节: 总结
  • 48:【视频】总结
  • 第4节: 本章作业
  • 49:【视频】作业
  • 50-1:作业说明文档
  • 50-2:【作业】第六章
  • 第7章: Transformer的缺点以及新模型结构
  • 51:【课件】新网络架构Mamba-Record_watermark
  • 第1节: Mamba基础
  • 52:【视频】Mamba基础
  • 第2节: 基于Mamba的模型
  • 53:【视频】Vision Mamba (Vim)
  • 54:【视频】 Visual Mamba (VMamba)
  • 第3节: 其他Mamba相关模型
  • 55:【视频】其他Mamba相关模型
  • 第4节: 本章总结
  • 56:【视频】总结
  • 第5节: 本章作业
  • 57:【视频】本章作业
  • 58-1:作业说明文档
  • 58-2:第七章作业
  • 第8章: CV大模型发展及展望
  • 59:【课件】第8章讲义:Transformer基础模型及其展望
  • 第1节: 基于Transformer的基础模型
  • 60: 【视频】 分割一切的Segment Everything Model(SAM)
  • 61:【视频】 在视频里也能分割一切的SAM2
  • 62: 【视频】Segment Everything Everywhere All at Once(SEEM)
  • 第2节: 基础模型的趋势
  • 63:【视频】基础模型的趋势
  • 第3节: 本章总结
  • 64:【视频】本章总结
  • 第4节: 本章作业
  • 65:【视频】本章作业
  • 66-1:作业说明文档
  • 66-2:本章作业
  • 67-1:第一次直播答疑讲解回放
  • 67-2:视觉transformer第一次直播答疑问题汇总.xlsx

相关推荐

机器人与自动驾驶 环境感知 高级
自然语言处理 大模型 基础
计算机视觉 三维视觉 环境感知 进阶

未注册验证后自动登录,注册/登录则视为同意

《服务协议》《隐私协议》

请完善资料,让我们更好的为您服务!

+86  (手机号已绑定)

未注册验证后自动登录,注册/登录则视为同意

《服务协议》《隐私协议》