阿里通義千問發(fā)布 Qwen3-Coder-Flash 模型
8 月 1 日,阿里通義千問 Qwen 昨日(7 月 31 日)發(fā)布公告,宣布推出 Qwen3-Coder-Flash(全稱 Qwen3-Coder-30B-A3B-Instruct)模型,在保持出色的性能和效率基礎(chǔ)上,改進(jìn)智能體編碼、智能體瀏覽器使用及其他基礎(chǔ)編碼任務(wù)性能。
官方介紹稱該模型具備卓越的智能體能力,在智能體編程 (Agentic Coding)、瀏覽器使用 (AgenticBrowser-Use)、工具調(diào)用 (Tool Use) 等領(lǐng)域,超越當(dāng)前頂級(jí)開源模型,僅略遜于頂配版 Qwen3-Coder-480B-A35B-Instruct, 及 ClaudeSonnet-4、GPT4.1 等領(lǐng)先閉源模型。
據(jù)報(bào)道,該模型是因果語言模型,總參數(shù)量為 30.5B,激活參數(shù)為 3.3B,共有 48 層,專家數(shù)為 128 個(gè),激活專家數(shù)為 8 個(gè),上下文長度原生支持 262144 個(gè) tokens,使用 Yarn 可擴(kuò)展到 100 萬個(gè) tokens。此模型僅支持非思考模式,不會(huì)在其輸出中生成 塊。
該模型針對(duì) Qwen Code、Cline、Roo Code、Kilo Code 等平臺(tái)優(yōu)化,并具有特別設(shè)計(jì)的函數(shù)調(diào)用格式,無縫函數(shù)調(diào)用和代理工作流程。