字節跳動發布豆包 1.5 深度思考模型 具備“看圖思考”能力
4月17日,在火山引擎 AI 創新巡展杭州站現場,字節跳動旗下火山引擎總裁譚待發布了最新的豆包 1.5·深度思考模型。譚待表示,豆包大模型使用量持續高速增長。截至 2025 年 3 月,豆包大模型日均 tokens 使用量超 12.7 萬億,較發布之初增長超 106 倍。
據介紹,該模型在數學、編程、科學推理等專業領域及創意寫作等通用任務中表現突出。數學推理 AIME 2024 測試得分追平 OpenAI o3-mini-high,編程競賽和科學推理測試成績也接近 o1。在創意寫作、人文知識問答等通用任務上,模型也展示出優秀的泛化能力,能勝任更廣泛的使用場景。
技術報告顯示,該模型采用 MoE 架構,總參數 200B,激活參數為 20B,低于業界同類模型參數規模的 50%,具備顯著的推理成本優勢。豆包模型 API 服務在保障高并發的同時,延遲低至 20 毫秒。
譚待在會上詳細介紹了豆包 1.5 深度思考模型的強大功能。該模型能夠結合視覺理解技術提供更多功能,例如根據照片分析地貌,或在旅行時輔助點餐、完成企業項目管理流程圖。
此外,豆包文生圖模型 Seedream3.0 也正式向企業開放。該模型已在即夢 AI、豆包產品上線,并在近期登上權威競技場 Artificial Analysis 文生圖榜單第一梯隊。Seedream3.0 支持 2K 分辨率直出,生圖結構準確性、小字生成與排版、美感、真實度等方面具有優勢。