课程价格 :
¥599.00
剩余名额
0
-
学习时长
8周/建议每周8个小时
-
答疑服务
专属微信答疑群/讲师助教均参与
-
作业批改
课程配有作业/助教1V1批改
-
课程有效期
一年/告别拖延,温故知新
课程价格:
¥599.00
预约下一期 *课程已报满,可预约下一期
支持花呗分期
*课程已报满,可预约下一期
- 1-1:Ubuntu下环境配置手册 (参考文档)
- 1-2:【视频】如何获得免费的GPU服务器资源
- 第1章: CUDA C编程及GPU基本知识
- 第1节: GPU基本架构及特点
- 2-1:【课件】CUDA C编程及GPU基本知识
- 2-2:【视频】CPU与GPU的基础知识
- 第2节: CUDA C编程基本知识
- 3:【视频】CUDA编程的重要概念
- 第3节: 并行计算向量相加
- 4:【视频】并行计算向量相加
- 第4节: 实践
- 5-1:【代码】Demo I
- 5-2:【视频】实践向量相加
- 5-3:【作业】第一章
- 5-4:【作业讲解】作业1思路讲解
- 第2章: CUDA C编程:矩阵乘法
- 第1节: 为什么矩阵乘法适合GPU实现
- 6-1:【课件】CUDA C编程:矩阵乘法
- 6-2:【视频】为什么矩阵乘法适合GPU实现
- 第2节: 矩阵乘法的GPU基础实现
- 7:【视频】矩阵算法GPU实现
- 第3节: 矩阵乘法GPU进阶实现
- 8:【视频】矩阵乘法的GPU进阶实现
- 第4节: 代码实践
- 9-1:【代码】MatrixMultiple
- 9-2:【视频】CUDA矩阵乘法实践
- 第5节: 作业题目
- 10-1:【视频】作业题目
- 10-2:【作业】第二章
- 第3章: cuda stream 和 Event
- 第1节: CUDA Stream介绍
- 11-1:【课件】CUDA C编程:cuda stream and envet
- 11-2:【视频】CUDA Stream介绍
- 第2节: CUDA Stream为什么有效
- 12:【视频】CUDA Stream为什么有效
- 第3节: CUDA Stream 默认流的表现
- 13:【视频】CUDA Stream默认流的表现
- 第4节: CUDA Event
- 14:【视频】CUDA Event
- 第5节: CUDA 同步操作
- 15:【视频】CUDA 同步操作
- 第6节: NVVP工具演示
- 16:【视频】NVVP
- 第4章: cuDNN与cuBLAS
- 17:【资料】BERT学习资料
- 第1节: 课程回顾
- 第2节: cuBLAS
- 第3节: cuDNN
- 第4节: 实践
- 第5章: TensorRT介绍
- 第1节: TensorRT是什么
- 第2节: TensorRT整体工作流程与优化策略
- 第3节: TensorRT的组成与基本使用流程
- 第4节: TensorRT demo:SampleMNIST
- 第5节: TensorRT进阶
- 第6节: Demo演示
- 第7节: 作业实践
- 第6章: TensorRT plugin用法
- 第1节: Plugin介绍
- 第2节: Static Shape Plugin
- 第3节: Dynamic Shape Plugin
- 第4节: PluginCreator注册
- 第5节: 延伸:TensorRT如何debug
- 第6节: 实践作业
- 第7章: TensorRT量化加速
- 第1节: TRT FP16优化
- 第2节: TRT INT8量化算法
- 第3节: TRT大规模上线经验
- 第8章: TensorRT 转换 ONNX模型
- 第1节: ONNX 介绍
- 第2节: 背景知识
- 第3节: TRT转换模型的主要痛点
- 第4节: 实践
- 第5节: polygraphy
- 第9章: 模型推理经验
- 第1节: 转换方式比较
- 第2节: TRT如何测试并调优
- 第3节: CUDA与TRT的调试建议
- 第4节: 模型可以加速到什么程度