深度学习模型推理加速项目实践（百度文心大模型ERNIE） - 深蓝学院

学习时长

9周/建议每周至少6小时
答疑服务

专属微信答疑群/讲师助教均参与
作业批改

每章节设计作业/助教及时批改评优
课程有效期

一年/告别拖延，温故知新

课程价格：￥1599.00

预约下一期 *课程已报满，可预约下一期

*课程已报满，可预约下一期

预约下一期

1：【文档】百度文心开课仪式

第1章: TensorRT介绍
第1节: TensorRT是什么
2：【课件】TensorRT介绍
3：【视频】TensorRT是什么
第2节: TensorRT整体工作流程与优化策略
4：【视频】TensorRT整体工作流程与优化策略
第3节: TensorRT的组成与基本使用流程
5：【视频】TensorRT使用的基本流程
第4节: TensorRT DEMO：SampleMNIST
6：【视频】demo
第5节: TensorRT进阶
7：【视频】TensorRT进阶
第6节: DEMO演示
8：【视频】Demo演示

第2章: TensorRT转换ONNX模型
第1节: ONNX 介绍
9：【课件】 TensorRT 转换 ONNX模型 v2.0
10：【视频】ONNX介绍
第2节: 背景知识
11：【视频】背景知识 lower概念
第3节: TRT转换模型的主要痛点
12：【视频】TRT转换模型的主要痛点
第4节: onnx-parser & onnx-graphsurgen
13：【视频】onnx-parser & onnx-graphsurgen
第5节: 实践
14：【视频】实践上：Transformer模型优化解决不支持的算子
15：【视频】实践下：Transformer模型优化合并LayerNorm算子
第6节: polygraphy
16：【视频】 polygraphy

第3章: 模型框架与模型转换方式介绍
17：【课件】Ernie项目-模型框架与模型转换方式介绍
18：资料分享
第1节: 课程介绍和模型介绍
19：【视频】课程介绍和模型介绍
第2节: 转换方式对比
20：【视频】转换方式对比

第4章: 环境搭建
第1节: 加速节点介绍
21-1：【课件】Ernie项目-开始节点
21-2：【视频】加速节点介绍
21-3：代码
第2节: 环境和目录结构介绍
22：【视频】环境和目录结构介绍
第3节: 测试数据介绍
23：【视频】测试数据介绍
第4节: C++ infer与评价标准
24：【视频】 C++ infer与评价标准
第5节: 构建方式介绍
25：【视频】构建方式介绍
第6节: 开始节点实战
26-1：【视频】开始节点实战
26-2：L4 Project：环境搭建
第7节: 作业
27：【作业说明】
28：【作业】第四章

第5章: 第一阶段优化方法：性价比最高的推理加速优化
29：【课件】Ernie项目-第一阶段优化方法
第1节: 加速节点概况
30：【视频】加速节点概况
第2节: FP16优化
31：【视频】FP16优化
第3节: 合并LayerNorm算子
32：【视频】合并layernorm算子
第4节: 作业
33-1：作业描述
33-2：【作业】第五章

第6章: 第二阶段优化方法：CUDA Graph & 输入优化
34：【课件】L6 输入优化&CUDA Graph
第1节: 输入优化方法：减少数据传输次数&提高传输速度
35：【视频】减少传输次数&提高传输速度
第2节: 输入优化方法：batching与overlap
36：【视频】batching与overlap
第3节: 补充知识：CUDA stream
37-1：【课件】CUDA C编程：CUDA stream
37-2：【视频】CUDA Stream介绍
37-3：【视频】CUDA Stream为什么有效
37-4：【视频】CUDA Stream默认流的表现
第4节: 什么是CUDA Graph以及为什么要做
38-1：【课件】CUDA Graph
38-2：【视频】什么是CUDA Graph以及为什么要做
第5节: 如何做CUDA Graph
39：【视频】如何做CUDA Graph
第6节: CUDA Graph缺点及解决方案
40：【视频】CUDA Graph缺点及解决方案
第7节: 实战：输入优化与 CUDA Graph
41：L6 Project：输入优化与 CUDA Graph
第8节: 作业
42-1：【文档】作业说明
42-2：【作业】第六章

第7章: 第三阶段优化方法：大规模算子合并加速
43：【课件】Ernie项目算子合并
第1节: 为什么要做大规模算子合并
44：【视频】为什么要做大规模算子合并
第2节: 模型结构详解
45：【视频】模型结构讲解
第3节: 加速策略1：合并Encoder模块以及Input Embedding模块
46：【视频】合并Encoder模块以及Input Embedding模块
第4节: 加速策略2：加速Attention模块
47：【视频】加速Attention模块
第5节: 加速策略3：去除冗余计算等策略
48：【视频】去除冗余计算等策略

第8章: 终点：结合开源方案
第1节: 终点：结合开源方案
49：【课件】终点：结合开源方案
第2节: 基础版本开源代码
50：【视频】基础版本开源代码
第3节: 进阶fused版本
51：【视频】进阶fused版本

第9章: 进一步深度加速的方法探讨
52：【课件】Ernie项目-进阶节点
第1节: INT8 量化
53：【视频】INT8量化
第2节: VarLen减少零填充带来的GPU计算开销
54：【视频】var len变长
第3节: 稀疏剪枝等模型优化算法
55：【视频】稀疏剪枝等模型优化方法

+ 86

中国 +86
美国 +1
日本 +81
中国香港 +852
中国澳门 +853
中国台湾 +886
马来西亚 +60
澳大利亚 +61
加拿大 +1
英国 +44
新加坡 +65
德国 +49
俄罗斯 +7
埃及 +20
南非 +27
希腊 +30
荷兰 +31
比利时 +32
法国 +33
西班牙 +34
匈牙利 +36
意大利 +39
罗马尼亚 +40
瑞士 +41
奥地利 +43
丹麦 +45
瑞典 +46
挪威 +47
波兰 +48
秘鲁 +51
墨西哥 +52
古巴 +53
阿根廷 +54
巴西 +55
智利 +56
哥伦比亚 +57
委内瑞拉 +58
印度尼西亚 +62
菲律宾 +63
新西兰 +64
泰国 +66
哈萨克斯坦 +7
韩国 +82
越南 +84
土耳其 +90
印度 +91
巴基斯坦 +92
阿富汗 +93
斯里兰卡 +94
缅甸 +95
伊朗 +98
摩洛哥 +212
阿尔及利亚 +213
突尼斯 +216
利比亚 +218
冈比亚 +220
塞内加尔 +221
马里 +223
几内亚 +224
科特迪瓦 +225
布基纳法索 +226
尼日尔 +227
多哥 +228
贝宁 +229
毛里求斯 +230
利比里亚 +231
塞拉利昂 +232
加纳 +233
尼日利亚 +234
乍得 +235
中非共和国 +236
喀麦隆 +237
圣多美和普林西比 +239
加蓬 +241
刚果民主共和国 +243
安哥拉 +244
阿森松岛 +247
塞舌尔 +248
苏丹 +249
埃塞俄比亚 +251
索马里 +252
吉布提 +253
肯尼亚 +254
坦桑尼亚 +255
乌干达 +256
布隆迪 +257
莫桑比克 +258
赞比亚 +260
马达加斯加 +261
津巴布韦 +263
纳米比亚 +264
马拉维 +265
莱索托 +266
博茨瓦纳 +267
斯威士兰 +268
直布罗陀 +350
葡萄牙 +351
卢森堡 +352
爱尔兰 +353
冰岛 +354
阿尔巴尼亚 +355
马耳他 +356
塞浦路斯 +357
芬兰 +358
保加利亚 +359
立陶宛 +370
拉脱维亚 +371
爱沙尼亚 +372
摩尔多瓦 +373
亚美尼亚 +374
白俄罗斯 +375
安道尔共和国 +376
摩纳哥 +377
圣马力诺 +378
乌克兰 +380
斯洛文尼亚 +386
捷克 +420
斯洛伐克 +421
列支敦士登 +423
伯利兹 +501
瓜地马拉 +502
萨尔瓦多 +503
洪都拉斯 +504
尼加拉瓜 +505
哥斯达黎加 +506
巴拿马 +507
海地 +509
玻利维亚 +591
圭亚那 +592
厄瓜多尔 +593
法属圭亚那 +594
巴拉圭 +595
马提尼克 +596
苏里南 +597
乌拉圭 +598
文莱 +673
巴布亚新几内亚 +675
汤加 +676
所罗门群岛 +677
斐济 +679
库克群岛 +682
法属波利尼西亚 +689
柬埔寨 +855
老挝 +856
孟加拉国 +880
马尔代夫 +960
黎巴嫩 +961
约旦 +962
叙利亚 +963
伊拉克 +964
科威特 +965
沙特阿拉伯 +966
也门 +967
阿曼 +968
阿拉伯联合酋长国 +971
以色列 +972
巴林 +973
卡塔尔 +974
蒙古 +976
尼泊尔 +977
塔吉克斯坦 +992
土库曼斯坦 +993
阿塞拜疆 +994
格鲁吉亚 +995
吉尔吉斯斯坦 +996
乌兹别克斯坦 +998
巴哈马 +1242
巴巴多斯 +1246
安圭拉岛 +1264
安提瓜和巴布达 +1268
开曼群岛 +1345
百慕大群岛 +1441
格林纳达 +1473
蒙特塞拉特岛 +1664
关岛 +1671
毛里塔尼亚 +222
圣露西亚 +1758
波多黎各 +1787
多明尼加共和国 +1809
特立尼达和多巴哥 +1868
牙买加 +1876
塞尔维亚共和国 +381

获取验证码

账号密码登录

未注册验证后自动登录，注册/登录则视为同意

《服务协议》和《隐私协议》

未注册验证后自动登录，注册/登录则视为同意

《服务协议》和《隐私协议》

服务协议反馈建议联系邮箱：service@shenlanxueyuan.com

友情链接：

在线咨询

常见问题

证书查询

返回顶部

学习时长

答疑服务

作业批改

课程有效期

相关推荐