谷歌推出Gemini 2.5 Flash 主打低成本、高效率AI模型

2025-04-10 09:28:22 | 棠糖 | 1689

4月10日，據報道，谷歌正式發布全新AI模型 Gemini 2.5 Flash，主打“高效能、低成本”，專為大批量、實時性應用場景優化，如客服對話、文檔解析等。該模型即將登陸谷歌AI開發平臺 Vertex AI，開發者可根據需求靈活調整速度、準確性和成本，以應對不同業務場景。

在AI大模型成本不斷攀升的背景下，Gemini 2.5 Flash 提供了更具性價比的選擇。谷歌表示，該模型針對“高容量、實時響應”場景優化，特別適合構建智能客服、實時摘要工具等應用，能夠在大規模部署時顯著降低成本。

與OpenAI的 GPT-3.5-turbo、DeepSeek的 R1 等推理優化模型類似，Gemini 2.5 Flash 在回答問題時可能稍慢于旗艦模型，但更注重平衡速度與成本。谷歌在官方博客中強調：“開發者可以動態調整計算資源，根據查詢復雜度優化性能。”

除云端服務外，谷歌還宣布，從2024年第三季度開始，Gemini系列模型（包括2.5 Flash）將支持本地化部署，通過谷歌分布式云（GDC）提供給對數據隱私要求嚴格的企業客戶。谷歌表示，正與英偉達合作，將Gemini適配至 Blackwell架構GPU，客戶可通過谷歌或其合作伙伴采購相關硬件。

目前，谷歌尚未發布Gemini 2.5 Flash的安全性和技術報告，因此其具體能力邊界尚不明確。此前，谷歌曾表示，對于“實驗性”模型不會提供詳細報告，這可能影響部分企業對模型可靠性的評估。

特別提醒：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其原創性以及文中陳述文字和內容未經本站證實，對本文以及其中全部或者部分內容、文字、圖片等內容的真實性、完整性、及時性本站不作任何保證或承諾，請自行核實相關內容。本站不承擔此類作品侵權行為的直接責任及連帶責任。如若本網有任何內容侵犯您的權益，請及時發送相關信息至bireading@163.com，本站將會在48小時內處理完畢。

最新資訊更多》

1 微軟推出首批自研AI模型：語音生成進入“秒級”時代
2 三星首款三折疊手機演示動畫曝光，支持反向充電、移動支付
3 OpenAI正式推出Realtime語音對話API，支持多語言切換與情感感知
4 Meta將為Horizon Worlds引入AI驅動的NPC
5 微軟宣布 2026 年 2 月 27 日停用 Win10 / Win11 版 Mobile Plans 應用
6 蘋果發布Xcode 26 Beta 7 深度集成GPT-5與Claude提升AI編程體驗
7 《戰地風云6》反作弊系統設“安全啟動”門檻，技術總監回應爭議
8 Epic游戲商城本周免費贈送《機械迷城》與《Make Way》
9 索尼PS6掌機規格曝光：搭載3nm APU或于2027年上市
10 云知聲2025年中期業績：營收同比增加20.2%，大模型收入飆漲457%
11 Leader懶人三筒標尺三烘款打造“嵌入不局改”新標準碾壓式再升級
12 小米澎湃OS 3發布重新定義重載場景流暢標準

谷歌推出Gemini 2.5 Flash 主打低成本、高效率AI模型

2025-04-10 09:28:22 瀏覽量： 1689 作者：棠糖

合作伙伴

關于我們
阿里云

京公網安備 11011302001633號

公眾號二維碼

京ICP備18051707號

京公網安備 11011302001633號