随笔档案「2021年11月11日」：tensorRT（一）| tensorRT如何进行推理加速？（建议收藏） ... - AI大道理

2021年11月11日

tensorRT（一）| tensorRT如何进行推理加速？（建议收藏）

摘要：本文来自公众号“AI大道理”。深度学习模型在训练阶段，为了保证前后向传播，每次梯度的更新是很微小的，这时候需要相对较高的进度，一般来说需要float型，如FP32。模型在推断（Inference）的时候只有前向计算，无需回传，因此可以使用低精度技术，如FP16、INT8、甚至是Bit（0 阅读全文

posted @ 2021-11-11 19:19 AI大道理阅读(3893) 评论(0) 推荐(0)

tensorRT（一）| tensorRT如何进行推理加速？（建议收藏）

导航

公告