英偉達Blackwell架構GB300芯片實測 4塊可完成16塊H100任務
8月27日,據科技媒體WccfTech報道,云服務提供商CoreWeave近日完成了一項基于DeepSeek R1推理模型的性能測試,結果顯示英偉達新一代Blackwell架構GB300芯片展現出顯著的性能突破。測試表明,僅需4塊GB300芯片即可完成原本需要16塊H100 GPU處理的推理任務,單卡吞吐量提升高達6倍,標志著AI計算效率實現代際跨越。
CoreWeave此次測試重點對比了Blackwell架構GB300 NVL72平臺與上一代H100 GPU的性能差異。得益于英偉達全面升級的芯片架構、大幅增強的內存系統及帶寬能力,GB300在運行DeepSeek R1等復雜推理模型時表現出色。該平臺支持最高37TB(可擴展至40TB)的內存容量和每秒130TB的內存帶寬,通過4路并行設計有效減少GPU間數據分割需求,并借助NVLink與NVSwitch高速互連技術顯著提升通信效率。
CoreWeave強調,此次性能提升不僅體現在理論算力(FLOPs)層面,更表現為整個系統架構在實際業務環境中的綜合優化。對于需部署大規模AI模型的企業用戶而言,GB300 NVL72平臺提供了更優的擴展性、更低的延遲表現和更高的能效比,有望幫助客戶以更低的成本、更快的速度落地AI服務。