阿里云通義千問 Qwen 3 旗艦版模型宣布更新:性能全面提升
7月22日,據報道,阿里云今天更新了旗艦版 Qwen3 模型,推出 Qwen3-235B-A22B-FP8 非思考模式(Non-thinking)的更新版本,命名為 Qwen3-235B-A22B-Instruct-2507-FP8。阿里云表示,在經過與社區溝通和深思熟慮后,決定停止使用混合思考模式,轉為分別訓練 Instruct 和 Thinking 模型,以獲得最佳質量。
據介紹,新的 Qwen3 模型通用能力顯著提升,包括指令遵循、邏輯推理、文本理解、數學、科學、編程及工具使用等方面,在 GQPA(知識)、AIME25(數學)、LiveCodeBench(編程)、Arena-Hard(人類偏好對齊)、BFCL(Agent 能力)等眾多測評中表現出色,超過 Kimi-K2、DeepSeek-V3 等頂級開源模型以及 Claude-Opus4-Non-thinking 等領先閉源模型。