英特爾全球首個全NPU支持的MLPerf Client基準測試成績公布
5月7日,英特爾宣布其成為全球首家在MLPerf Client v0.6基準測試中實現全NPU支持的企業,標志著客戶端AI性能評估邁入新階段。此次測試中,英特爾酷睿Ultra 200處理器憑借NPU(神經網絡處理單元)和內置Arc GPU的協同加速,在端側AI任務中展現出顯著優勢,性能超越競爭對手AMD。
MLPerf Client是由MLCommons聯盟(成員包括英特爾、AMD、微軟、英偉達、高通等)開發的權威AI基準測試工具。此次發布的v0.6版本首次突破傳統GPU中心化測試模式,新增針對專用NPU的標準化評估,為行業提供了更全面的AI性能衡量標準。
英特爾客戶端PC產品營銷副總裁兼總經理丹尼爾・羅杰斯(Daniel Rogers)表示:“我們很榮幸能夠引領行業,實現客戶端PC平臺的全NPU加速和領先GPU性能。這一成就不僅驗證了英特爾在AI硬件架構上的創新,也為未來PC的智能化體驗奠定了基礎。”
在基于Llama 2 7B大語言模型的測試中,英特爾酷睿Ultra 200處理器在以下關鍵指標中表現突出: NPU最快響應速度:首個詞元(token)生成僅需1.09秒(首token延遲),創下NPU性能新紀錄。NPU最高吞吐量:達到18.55 tokens/秒,遠超人類平均閱讀速度。GPU性能優勢:在首token生成速度上超越競品,展現多引擎協同的高效AI計算能力。