Tensorrt - 搜索 News

英伟达PyTorch优化神器TensorRT重磅更新！10亿参数大模型实时运行，GPT ...

【导读】12月2日，英伟达发布了最新的TensorRT 8.2版本，对10亿级参数模型进行了优化，让实时运行NLP应用成为可能。与原始PyTorch模型相比，TensorRT可以将T5、GPT-2的延迟降低9到21倍。众所周知，PyTorch和TensorFlow是两个非常受欢迎的深度学习框架。 12月2日，英伟达 ...

5 天

英伟达 Blackwell 架构与开源协同，推动 AI 推理成本降低 10 倍

在医疗领域，AI 初创公司 Sully.ai 报告称，通过将业务从专有闭源模型迁移到由 Baseten 托管、基于 Blackwell 的开源替代方案，推理成本下降了 90%。这一 10 倍的成本降低伴随着 65% ...

快科技

支持所有RTX显卡！NVIDIA TensorRT带来性能翻倍提升

快科技5月20日消息，NVIDIA宣布，TensorRT AI推理加速框架现已登陆GeForce RTX显卡，性能比DirectML直接翻倍。 TensorRT是NVIDIA推出的一种推理优化器，能够显著提升AI模型的运行效率，此次，NVIDIA将TensorRT引入RTX平台，使得所有RTX显卡的用户都能享受到更快的AI性能。

腾讯网

NVIDIA TensorRT持续发力，GeForce RTX GPU免费获2倍AI加速

在GeForce RTX 5060系列正式发布之后，NVIDIA在消费端第二条解禁的消息是TensorRT正式引入GeForce RTX平台，这意味着GeForce RTX用户也能获得经过优化的推理后端，从而获得更快的推理性能。没有错，个人PC运行AI的效率将会越来越高。通过TensorRT，现有的AI应用可以获得 ...

电子工程专辑

YOLOv5模型部署TensorRT之FP32、FP16、INT8推理

YOLOv5最新版本的6.x已经支持直接导出engine文件并部署到TensorRT上了。但是在TensorRT上推理想要速度快，必须转换为它自己的engine格式文件，参数engine就是这个作用。上面的命令行执行完成之后，就会得到onnx格式模型文件与engine格式模型文件。--device 0参数表示GPU 0 ...

快科技

NVIDIA RTX显卡AI推理提速5倍！RTX PC轻松在本地搞定大模型

快科技11月16日消息，正在举行的微软Iginte全球技术大会上，微软发布一系列AI相关的全新优化模型、开发工具资源，帮助开发者更深入地释放硬件性能，拓展AI场景。尤是对于当下在AI领域占据绝对主导地位的NVIDIA来说，微软这次送上了一份大礼包，无论是面向 ...

来自MSN

NVIDIA TensorRT登陆RTX显卡，AI推理性能翻倍提升在即！

NVIDIA近日宣布，其专为AI推理加速设计的TensorRT框架，现已扩展至GeForce RTX系列显卡。这一举措意味着RTX显卡用户将能够体验到前所未有的AI性能提升，相较于DirectML，性能表现直接翻倍。 TensorRT，作为NVIDIA推出的AI推理优化解决方案，一直以来都在提升AI模型运行 ...

腾讯网

NVIDIA DGX Spark评测：意想不到的小巧体积，技惊四座的AI能力

在去年的GTC 2025上，NVIDIA发布了一款迷你小主机，更确切点来说是桌面级AI超算：DGX Spark，它是CES 2025上Project ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果