谷歌Gemini 2.5 Pro模型再升級:性能跑分刷新紀錄
6月6日,谷歌近日對其AI模型Gemini 2.5 Pro進行了新一輪更新,將其預覽版升級至06-05版本,并宣布該版本在多項AI基準測試中表現顯著提升。與此同時,谷歌還回應了此前用戶對模型性能波動的反饋,優化了生成內容的風格與結構,進一步提升了交互體驗。
根據谷歌官方數據,更新后的Gemini 2.5 Pro在多個AI評測基準中刷新了成績:LMArena Elo評分提升24分,顯示模型在語言理解與生成能力上的進步。WebDevArena Elo評分大幅上漲35分,達到1443分,谷歌稱這一成績已達到“業界領先水平”。在GPQA(通用問題回答基準)和Humanity's Last Exam等高難度測試中,新版模型也展現出更強的推理與問題解決能力。
此次更新距離谷歌3月底發布Gemini 2.5 Pro僅過去兩個多月,而輕量級版本Gemini 2.5 Flash也已在4月面向全球用戶開放體驗。盡管兩款模型仍處于預覽階段,但頻繁的迭代顯示出谷歌在AI賽道上的加速布局。
針對此前用戶反饋的“模型性能短暫下滑”問題,谷歌表示,新版Gemini 2.5 Pro已在創意生成和回答格式上進行了優化,使輸出內容更具結構性,同時提升了交互流暢度。