谷歌 Gemini 2.5 Flash 混合推理 AI 模型上線 性能成本雙優(yōu)
4月18日,谷歌公司發(fā)布公告,宣布在 Google AI Studio 和 Vertex AI 中,以 Gemini API 的方式推出 Gemini 2.5 Flash Preview 預覽 AI 模型。用戶還可通過 Gemini 應用內的模型選擇器直接使用,并結合 Canvas 工具優(yōu)化文檔和代碼編輯。
據(jù)此前報道,Gemini 2.5 Flash 是一個混合推理模型,具備“動態(tài)且可控”的計算能力,開發(fā)者能夠根據(jù)查詢請求的復雜程度靈活調整處理時間。谷歌指出,Gemini 2.5 Flash 非常適合用于“高容量”和“實時”的應用場景,例如客戶服務和文檔解析。谷歌在其博客文章中提到:“這款工作型模型專門針對低延遲和降低成本進行了優(yōu)化,是響應式虛擬助手和實時總結工具的理想引擎”。
根據(jù)谷歌官方公布的定價,Gemini 2.5 Flash 模型每 100 萬 tokens 輸入為 0.15 美元,每 100 萬 tokens 輸出(不含推理)為 0.6 美元、每 100 萬 tokens 輸出(含推理)為 3.5 美元.作為首款全混合推理模型,開發(fā)者可根據(jù)需求開關推理功能,靈活調整響應質量、成本和延遲,與 Anthropic 和 Grok 的前沿模型相比,Gemini 2.5 Flash 成本更低但表現(xiàn)不俗。