我的问答 - leowgyang的个人主页 - 深蓝学院 - 专注人工智能与自动驾驶的学习平台

leowgyang

暂无个性签名

毕业后一直在腾讯从事语音领域深度学习加速上线工作，现任腾讯高级研究员。

parse的入参能详细讲下并举例子吗？ for循环是为了做什么呢？
——来自《深度学习模型推理加速项目实践（百度文心大模型ERNIE）- 第四期》·11浏览

问题一

完整函数是：

irtual IBlobNameToTensor const * nvcaffeparser1::ICaffeParser::parse(char const * deploy,

char const * model,

nvinfer1::INetworkDefinition & network,

nvinfer1::DataType weightType

)

参数一共有四个，分别是

deploy：The plain text, prototxt file used to define the network definition.

model：The binaryproto Caffe model that contains the weights associated with the network.

network：Network in which the CaffeParser will fill the layers.

weight：TypeThe type to which the weights will transformed.

注：caffe格式的模型由两个文件组成，模型结构定义.prototxt和权值文件caffe.model

更详细见nv的文档：https://docs.nvidia.com/deeplearning/tensorrt/archives/tensorrt-861/api/c_api/classnvcaffeparser1_1_1_i_caffe_parser.html#aac5df66d796a4fa7ea91590cb0393681

问题二：

for 循环的目的是需要告诉TensorRT，需要将哪些模型中的Tensor设置为输出节点。

这么设计的原因，是因为在训练过程中，可能会有多个输出，但在推理时，不是所有的输出都是必要的。
关于本地无gpu电脑的nvvp安装
——来自《深度神经网络加速：cuDNN 与 TensorRT- 第三期》·17浏览

可以的。本地安装cuda的时候选择自定义。cuda安装包包括tookit，driver，sample等多个部分。

从中间找到nvvp的选项，只安装这个就可以了。
老师后面会讲用nsys工具做profile吗
——来自《深度神经网络加速：cuDNN 与 TensorRT- 第三期》·32浏览

后面会有关于使用nvvp进行profile的内容。

nsys是nvvp的升级版，是在比较新的cuda版本中推出的，

两个工具的大体用法差不多。

服务协议反馈建议联系邮箱：service@shenlanxueyuan.com

友情链接：

在线咨询

常见问题

证书查询

返回顶部