TensorRT全方位概览笔记
创始人
2024-04-27 03:08:55
0

TensorRT (基于8.2.3)

  • 1.简介
  • 1.export
    • 1.1 使用tensorrt API 搭建
    • 1.2 使用parser
    • 1.3 使用框架内 tensorrt 接口
    • 1.4 注意事项
  • 2.开发辅助工具
    • 2.1 trtexec
    • 2.2 Netron
    • 2.3 onnx-graphsurgeon
    • 2.4 polygraphy
    • 2.5 Nsight Systems
  • 3. plugin
    • 3.1 plugin
    • 3.2 使用
      • 3.3 类型
      • 3.4 结合使用parser 和 plugin
  • 4. 高级话题
    • 4.1 Dynamic shape 在min-max 跨度较大时性能下降
    • 4.2 重叠计算和数据拷贝时间,增加GPU利用率
    • 4.3 一个engine供多个线程使用
  • 仅用于个人视频笔记

1.简介

通过推理优化器(构建)和运行环境(运行)实现高效实现推理过程

更高吞吐量
更低延迟
C++/Python

构建期

模型解析/搭建
计算图优化
节点消除
精度
优选kernel / format
自定义plugin
显存优化

运行期

对象管理,内存管理,异常处理
序列化 / 反序列化

1.export

在这里插入图片描述

1.1 使用tensorrt API 搭建

在这里插入图片描述

1.2 使用parser

在这里插入图片描述

1.3 使用框架内 tensorrt 接口

某些框架的新版本已经把trt加入在子模块,比如tensorflow,pytorch,个人不用不太了解

1.4 注意事项

在这里插入图片描述

2.开发辅助工具

在这里插入图片描述

2.1 trtexec

工具转换
性能测试

2.2 Netron

网络结构可视化

2.3 onnx-graphsurgeon

功能:
修改计算图: 图属性,节点,张量,节点和张量的连接,权重
修改子图:添加,删除,替换,隔离
优化计算图:常量折叠,拓扑排序,去除无用层
目的:
手工修改网络
去除冗余节点
修改阻碍tensorrt融合的节点组
手工模块化节点组

2.4 polygraphy

功能:

2.5 Nsight Systems

在这里插入图片描述

3. plugin

3.1 plugin

在这里插入图片描述

3.2 使用

在这里插入图片描述
在这里插入图片描述
plugin不参与层融合

3.3 类型

在这里插入图片描述

3.4 结合使用parser 和 plugin

在这里插入图片描述

4. 高级话题

4.1 Dynamic shape 在min-max 跨度较大时性能下降

在这里插入图片描述

4.2 重叠计算和数据拷贝时间,增加GPU利用率

在这里插入图片描述

4.3 一个engine供多个线程使用

在这里插入图片描述

仅用于个人视频笔记

相关内容

热门资讯

保存时出现了1个错误,导致这篇... 当保存文章时出现错误时,可以通过以下步骤解决问题:查看错误信息:查看错误提示信息可以帮助我们了解具体...
汇川伺服电机位置控制模式参数配... 1. 基本控制参数设置 1)设置位置控制模式   2)绝对值位置线性模...
不能访问光猫的的管理页面 光猫是现代家庭宽带网络的重要组成部分,它可以提供高速稳定的网络连接。但是,有时候我们会遇到不能访问光...
表格中数据未显示 当表格中的数据未显示时,可能是由于以下几个原因导致的:HTML代码问题:检查表格的HTML代码是否正...
本地主机上的图像未显示 问题描述:在本地主机上显示图像时,图像未能正常显示。解决方法:以下是一些可能的解决方法,具体取决于问...
表格列调整大小出现问题 问题描述:表格列调整大小出现问题,无法正常调整列宽。解决方法:检查表格的布局方式是否正确。确保表格使...
不一致的条件格式 要解决不一致的条件格式问题,可以按照以下步骤进行:确定条件格式的规则:首先,需要明确条件格式的规则是...
Android|无法访问或保存... 这个问题可能是由于权限设置不正确导致的。您需要在应用程序清单文件中添加以下代码来请求适当的权限:此外...
【NI Multisim 14...   目录 序言 一、工具栏 🍊1.“标准”工具栏 🍊 2.视图工具...
银河麒麟V10SP1高级服务器... 银河麒麟高级服务器操作系统简介: 银河麒麟高级服务器操作系统V10是针对企业级关键业务...