阿里通義千問更新 Qwen3-30B 非思考模型 AI 性能媲美 GPT-4o
7月30日,阿里通義千問在 X 平臺發布推文,宣布推出 Qwen3-30B-A3B 非思考模式的更新版本,命名為 Qwen3-30B-A3B-Instruct-2507。新模型主要提升指令跟隨、邏輯推理、文本理解、數學、科學、編程和工具使用等通用能力,官方表示在激活 3B 參數的情況下,性能接近 GPT-4o 和 Qwen3-235B-A22B Non-Thinking。
據報道,Qwen3-30B-A3B-Instruct-2507 模型的參數總量為 305 億,但激活參數為 33 億,非嵌入層數量為 299 億,網絡層數為 48 層,專家數為 128 個,激活專家數為 8 個,上下文長度原生支持 262144 個 tokens。
該模型僅支持非思考模式,在輸出中不會生成 <think></think> 塊。同時,不再需要指定 enable_thinking=False。官方表示新模型大幅增加了多種語言的長尾知識覆蓋,且在主觀和開放式任務中與用戶偏好更加一致,能夠提供更有幫助的回答和更高質量的文本生成。