深度学习模型推理加速项目实践（Stable Diffusion） - 深蓝学院

学习时长

10周/建议每周至少6小时
答疑服务

专属微信答疑群/讲师助教均参与
作业批改

每章节设计作业/助教及时批改评优
课程有效期

一年/告别拖延，温故知新

课程价格：￥1599.00

已报满

1：开课仪式

第1章: TensorRT介绍
第1节: TensorRT是什么
2-1：【课件】TensorRT介绍
免费 2-2：【视频】TensorRT是什么预览
第2节: TensorRT整体工作流程与优化策略
免费 3：【视频】TensorRT整体工作流程与优化策略预览
第3节: TensorRT的组成与基本使用流程
免费 4：【视频】TensorRT使用的基本流程预览
第4节: TensorRT DEMO：SampleMNIST
免费 5：【视频】demo 预览
第5节: TensorRT进阶
免费 6：【视频】TensorRT进阶预览
第6节: DEMO演示
免费 7：【视频】Demo演示预览

第2章: TensorRT转换ONNX模型
第1节: ONNX 介绍
8-1：【课件】 TensorRT 转换 ONNX模型 v2.0
8-2：【视频】ONNX介绍
第2节: 背景知识
9：【视频】背景知识 lower概念
第3节: TRT转换模型的主要痛点
10：【视频】TRT转换模型的主要痛点
第4节: onnx-parser & onnx-graphsurgen
11：【视频】onnx-parser & onnx-graphsurgen
第5节: 实践
12-1：【视频】实践上：Transformer模型优化解决不支持的算子
12-2：【视频】实践下：Transformer模型优化合并LayerNorm算子
第6节: polygraphy
13：【视频】 polygraphy

第3章: 模型介绍与课程目标
14：【课件】模型介绍与课程目标
第1节: 大模型分类介绍
15：【视频】大模型分类
第2节: 模型介绍：ControlNet Stable Diffusion(CNSD)模型
16：【视频】 ControlNet Stable Diffusion模型简介
第3节: 课程内容及目标介绍
17：【视频】课程内容及目标介绍

第4章: 环境搭建、代码结构与评价标准
18：【课件】diffusion-背景和技术介绍
第1节: 环境搭建：手动搭建和docker两种方式
19：【视频】Docker环境搭建
第2节: 评价标准介绍：从速度和精度两个方面进行评估
20：【视频】模型推理评价标准
第3节: 4种模型转换方式类型与优缺点
21：【视频】转换方式介绍及其优缺点

第5章: 开始节点
22：【课件】L5 stable diffusion加速开始节点.pdf
第1节: 推理加速各节点安排
23：【视频】各优化节点介绍
第2节: 模型结构详细介绍：模型结构图、单步调试代码
24-1：【视频】如何快速了解模型结构
24-2：【视频】实操演示
第3节: diffusion类模型-PyTorch转TRT的工作流介绍
25：【视频】Pytorch模型转ONNX
第4节: TRT python API与TRT8.6的新API
26：【视频】ONNX模型转TensorRT
第5节: 实践
27-1：【说明】项目环境搭建
27-2：【视频】作业实践安排
27-3：【作业】第五章

第6章: 节点二 FP16 优化
28：【课件】节点二 fp16优化
第1节: FP16优化
29：【视频】为什么FP16是性价比最高的优化方法
第2节: 经验：TRT不同版本如何合并LayerNorm算子
30：【视频】FP16优化的经验分享
第3节: 实践：对CNSD模型进行FP16加速并评估
31-1：【课件】节点二 fp16 实战
31-2：【视频】实战内容概览
32-1：【视频】项目Profile
32-2：【视频】项目profile的意义
33：【视频】FP16溢出调试实践

第7章: 节点三 CUDA Graph 优化
34：【课件】节点三 cuda-graph v1.2
第1节: CUDA-graph：是什么，为什么，如何做
35-1：【视频】为什么要做CUDA Graph
35-2：【视频】如何在该项目中使用CUDA Graph
第2节: CUDA Graph的缺点及优化策略
36：【视频】解决变长输入的CUDA Graph策略
第3节: TensorRT8.6 新特性，BuildOptimalLevel 优化
37：【视频】BuildOptimalLevel优化
第4节: 实践：对CNSD模型进行CUDA Graph优化和尝试BuildOptimalLevel 优化
38-1：【视频】实践作业
38-2：【作业】第七章

第8章: 节点四 pipeline 优化
39：【课件】节点四 pipeline 优化
第1节: 本章内容概览
40：【视频】本章内容概览
第2节: 迭代次数优化与GroupNorm
41-1：【视频】迭代次数优化与GroupNorm
41-2：【视频】模型内部优化实践
第3节: 拼batch优化
42：【视频】拼batch优化
第4节: 实践作业
43-1：【视频】实践作业
43-2：【作业】第八章

第9章: TensorRT int8量化介绍
44-1：【课件】TensorRT INT8量化加速
44-2：【视频】TRT FP16优化
第1节: int8 量化原理
45-1：【视频】TRT INT8量化算法（上）
45-2：【视频】TensorRT INT8量化算法（下）
第2节: TensorRT 饱和量化算法介绍

第10章: 节点五 CNSD int8量化优化
第1节: 本章内容
46：【视频】内容概述
第2节: INT 8 是否值得做？
47：【视频】INT8值不值得做
第3节: 如何做INT8量化
48：【视频】如何做INT8量化：以ControlNet为例
第4节: 解决精度损失问题： smoothquant 算法
49：【视频】解决INT8量化误差的3种方法
第5节: 分析INT8误差
50-1：【课件】节点五 int8 量化-实践
50-2：【视频】分析INT8误差
50-3：【视频】解决INT8误差的方法
50-4：【视频】实践演示
第6节: 实践：对CNSD模型进行int8量化优化

第11章: 进阶节点：深度优化
51：【课件】进阶节点：深度优化
第1节: 本章内容介绍
52：【视频】内容概述
第2节: 模型结构详细分析
53-1：【视频】CNSD模型的结构解析
53-2：【视频】模型代码结构分析
第3节: 优化模型冗余计算
54：【视频】模型冗余计算的优化
第4节: 各个模块深度优化分析
55：【视频】深度优化碎碎念

+ 86

中国 +86
美国 +1
日本 +81
中国香港 +852
中国澳门 +853
中国台湾 +886
马来西亚 +60
澳大利亚 +61
加拿大 +1
英国 +44
新加坡 +65
德国 +49
俄罗斯 +7
埃及 +20
南非 +27
希腊 +30
荷兰 +31
比利时 +32
法国 +33
西班牙 +34
匈牙利 +36
意大利 +39
罗马尼亚 +40
瑞士 +41
奥地利 +43
丹麦 +45
瑞典 +46
挪威 +47
波兰 +48
秘鲁 +51
墨西哥 +52
古巴 +53
阿根廷 +54
巴西 +55
智利 +56
哥伦比亚 +57
委内瑞拉 +58
印度尼西亚 +62
菲律宾 +63
新西兰 +64
泰国 +66
哈萨克斯坦 +7
韩国 +82
越南 +84
土耳其 +90
印度 +91
巴基斯坦 +92
阿富汗 +93
斯里兰卡 +94
缅甸 +95
伊朗 +98
摩洛哥 +212
阿尔及利亚 +213
突尼斯 +216
利比亚 +218
冈比亚 +220
塞内加尔 +221
马里 +223
几内亚 +224
科特迪瓦 +225
布基纳法索 +226
尼日尔 +227
多哥 +228
贝宁 +229
毛里求斯 +230
利比里亚 +231
塞拉利昂 +232
加纳 +233
尼日利亚 +234
乍得 +235
中非共和国 +236
喀麦隆 +237
圣多美和普林西比 +239
加蓬 +241
刚果民主共和国 +243
安哥拉 +244
阿森松岛 +247
塞舌尔 +248
苏丹 +249
埃塞俄比亚 +251
索马里 +252
吉布提 +253
肯尼亚 +254
坦桑尼亚 +255
乌干达 +256
布隆迪 +257
莫桑比克 +258
赞比亚 +260
马达加斯加 +261
津巴布韦 +263
纳米比亚 +264
马拉维 +265
莱索托 +266
博茨瓦纳 +267
斯威士兰 +268
直布罗陀 +350
葡萄牙 +351
卢森堡 +352
爱尔兰 +353
冰岛 +354
阿尔巴尼亚 +355
马耳他 +356
塞浦路斯 +357
芬兰 +358
保加利亚 +359
立陶宛 +370
拉脱维亚 +371
爱沙尼亚 +372
摩尔多瓦 +373
亚美尼亚 +374
白俄罗斯 +375
安道尔共和国 +376
摩纳哥 +377
圣马力诺 +378
乌克兰 +380
斯洛文尼亚 +386
捷克 +420
斯洛伐克 +421
列支敦士登 +423
伯利兹 +501
瓜地马拉 +502
萨尔瓦多 +503
洪都拉斯 +504
尼加拉瓜 +505
哥斯达黎加 +506
巴拿马 +507
海地 +509
玻利维亚 +591
圭亚那 +592
厄瓜多尔 +593
法属圭亚那 +594
巴拉圭 +595
马提尼克 +596
苏里南 +597
乌拉圭 +598
文莱 +673
巴布亚新几内亚 +675
汤加 +676
所罗门群岛 +677
斐济 +679
库克群岛 +682
法属波利尼西亚 +689
柬埔寨 +855
老挝 +856
孟加拉国 +880
马尔代夫 +960
黎巴嫩 +961
约旦 +962
叙利亚 +963
伊拉克 +964
科威特 +965
沙特阿拉伯 +966
也门 +967
阿曼 +968
阿拉伯联合酋长国 +971
以色列 +972
巴林 +973
卡塔尔 +974
蒙古 +976
尼泊尔 +977
塔吉克斯坦 +992
土库曼斯坦 +993
阿塞拜疆 +994
格鲁吉亚 +995
吉尔吉斯斯坦 +996
乌兹别克斯坦 +998
巴哈马 +1242
巴巴多斯 +1246
安圭拉岛 +1264
安提瓜和巴布达 +1268
开曼群岛 +1345
百慕大群岛 +1441
格林纳达 +1473
蒙特塞拉特岛 +1664
关岛 +1671
毛里塔尼亚 +222
圣露西亚 +1758
波多黎各 +1787
多明尼加共和国 +1809
特立尼达和多巴哥 +1868
牙买加 +1876
塞尔维亚共和国 +381

获取验证码

账号密码登录

未注册验证后自动登录，注册/登录则视为同意

《服务协议》和《隐私协议》

未注册验证后自动登录，注册/登录则视为同意

《服务协议》和《隐私协议》

服务协议反馈建议联系邮箱：service@shenlanxueyuan.com

友情链接：

常见问题

证书查询

微信公众号

返回顶部

学习时长

答疑服务

作业批改

课程有效期

相关推荐