英偉達推出TensorRT for RTX GeForce顯卡AI推理性能翻倍
5月20日,英偉達今日宣布推出NVIDIA TensorRT for RTX,全面支持Windows 11系統,為GeForce RTX全系顯卡提供高性能AI推理加速框架。據官方數據,該框架的推理速度可達微軟DirectML方案的兩倍,顯著提升生成式AI、視頻處理等應用的效率。該更新預計于6月通過英偉達開發者官網正式推送。
TensorRT for RTX通過深度優化RTX顯卡的Tensor Core和CUDA核心,實現了顯著的性能飛躍: 在流行的AI工作流工具ComfyUI中,推理性能較DirectML提升100%;其他AI應用的性能提升達1.5~1.7倍;支持即時GPU專屬優化,推理庫文件體積縮減至原有的1/8,節省存儲空間并加快加載速度。
英偉達強調,TensorRT for RTX原生兼容Windows ML框架,并通過ONNX Runtime與硬件廠商的AI執行層協同工作。當檢測到RTX顯卡時,Windows ML將自動調用TensorRT優化庫,無需開發者手動適配。這一設計解決了AI PC生態中“廣泛兼容性”與“極致性能”難以兼顧的痛點。
目前,英偉達已為超過150個AI開發工具包(SDK)提供支持,并計劃在本月新增5項ISV(獨立軟件供應商)集成,包括:
1. LM Studio:CUDA優化后性能提升30%;
2. Topaz Video AI:生成式AI視頻加速;
3. 嗶哩嗶哩:支持NVIDIA Broadcast特效;
4. AutoDesk VRED & Chaos Enscape:均新增DLSS 4支持,優化3D渲染效率。
英偉達在聲明中表示:“TensorRT for RTX的推出,讓開發者無需在硬件兼容性與性能之間妥協。RTX顯卡用戶將直接獲得專業級的AI加速體驗。”此舉進一步鞏固了英偉達在消費級GPU市場的技術優勢,同時也為即將到來的下一代AI應用鋪平道路。