谷歌推出Gemini 2.5 Flash 主打低成本、高效率AI模型
4月10日,據報道,谷歌正式發布全新AI模型 Gemini 2.5 Flash,主打“高效能、低成本”,專為大批量、實時性應用場景優化,如客服對話、文檔解析等。該模型即將登陸谷歌AI開發平臺 Vertex AI,開發者可根據需求靈活調整速度、準確性和成本,以應對不同業務場景。
在AI大模型成本不斷攀升的背景下,Gemini 2.5 Flash 提供了更具性價比的選擇。谷歌表示,該模型針對“高容量、實時響應”場景優化,特別適合構建 智能客服、實時摘要工具 等應用,能夠在大規模部署時顯著降低成本。
與OpenAI的 GPT-3.5-turbo、DeepSeek的 R1 等推理優化模型類似,Gemini 2.5 Flash 在回答問題時可能稍慢于旗艦模型,但更注重 平衡速度與成本。谷歌在官方博客中強調:“開發者可以動態調整計算資源,根據查詢復雜度優化性能。”
除云端服務外,谷歌還宣布,從2024年第三季度開始,Gemini系列模型(包括2.5 Flash)將支持 本地化部署,通過 谷歌分布式云(GDC) 提供給對數據隱私要求嚴格的企業客戶。谷歌表示,正與 英偉達 合作,將Gemini適配至 Blackwell架構GPU,客戶可通過谷歌或其合作伙伴采購相關硬件。
目前,谷歌尚未發布Gemini 2.5 Flash的 安全性和技術報告,因此其具體能力邊界尚不明確。此前,谷歌曾表示,對于“實驗性”模型不會提供詳細報告,這可能影響部分企業對模型可靠性的評估。