阿里通義千問 Qwen3-4B-2507 雙料更新 手機(jī)也能輕松跑
8月7日,通義千問 Qwen 發(fā)布公告,宣布推出 Qwen3-4B-Instruct-2507 和 Qwen3-4B-Thinking-2507 兩個(gè)模型,大幅提升性能。官方表示,SLM(Small Language Models)對(duì) Agentic AI 的發(fā)展極具價(jià)值,“2507”版本的 Qwen3-4B 模型,體積小,性能強(qiáng),對(duì)手機(jī)等端側(cè)硬件部署尤為友好。
據(jù)報(bào)道,在非推理(non-thinking)領(lǐng)域,Qwen3-4B-Instruct-2507 顯著提升通用能力,目標(biāo)成為更全能的端側(cè)利器。該模型掌握更多語言和長(zhǎng)尾知識(shí),上下文理解擴(kuò)展至 256K,小模型也能處理長(zhǎng)文本。該模型通用能力超越了閉源的小尺寸模型 GPT-4.1-nano,性能接近等規(guī)模的 Qwen3-30B-A3B(non-thinking)。官方表示該模型更像一位高效的“執(zhí)行專家”,遵循指令、迅速響應(yīng),更適合用于內(nèi)容創(chuàng)作、工具調(diào)用等。
在推理(thinking)領(lǐng)域,Qwen3-4B-Thinking-2507 大幅提升了推理能力,AIME25 高達(dá) 81.3 分。Qwen3-4B-Thinking-2507 的推理表現(xiàn)可媲美中等模型 Qwen3-30B-Thinking,在聚焦數(shù)學(xué)能力的 AIME25 測(cè)評(píng)中,以 4B 參數(shù)量斬獲驚人的 81.3 分的好成績(jī)。官方表示該模型像一位嚴(yán)謹(jǐn)?shù)摹皩W(xué)術(shù)專家”,面對(duì)復(fù)雜問題逐步推理,完成任務(wù)更深入可靠。