DeepSeek V3迎來”小版本升級" 性能直逼V3.5
3月25日,深度求索公司近日低調推出了DeepSeek V3-0324版本更新。盡管官方將其稱為"小版本升級",但實測表現卻遠超預期,被開發者評價為"堪比V3.5級別"的重大提升。
在開發者Xeophon的個人基準測試中,新版模型在所有指標上均有大幅提升,成為該測試框架下表現最佳的非推理模型。測試顯示,該模型不僅能輕松應對4維空間超立方體等復雜數學問題,在編程任務上也展現出驚人實力——僅憑一句提示詞就能開發出完整的自適應產品著陸頁,性能被認為與Claude 3.7 Sonnet相當。
值得注意的是,雖然DeepSeek-V3-0324并非專門的推理模型,但在解題過程中展現出獨特的"啊哈時刻"(頓悟時刻)。在面對"讓7米長甘蔗通過2米高1米寬門"這類難題時,模型會自主回溯思考過程,甚至在中英文思維切換中找到突破口,最終給出合理解決方案。
新版模型依然采用671B參數的MoE架構,所有權重文件約688GB,與初代V3保持一致。目前模型已在官網、官方App(需關閉深度思考功能)和HuggingFace等平臺開放體驗,并繼續保持MIT開源協議免費提供。