OpenAI發布GPT-4.1系列模型 編程性能飆升40%
4月15日,人工智能領域的領導者OpenAI正式推出GPT-4.1系列模型,包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano三個版本。這一重大升級標志著AI技術在編程、長文本處理等專業領域取得突破性進展,為開發者提供了更強大、更經濟的工具選擇。
GPT-4.1系列在多項關鍵指標上展現出顯著優勢,編程能力飛躍:在SWE-bench Verified測試中得分54.6%,較GPT-4o提升21.4個百分點。處理效率提升:代碼生成速度提高40%,首次響應時間顯著優化。成本大幅降低:用戶查詢成本下降80%,API價格較GPT-4o便宜26%。知識更新至2024年6月,保持行業領先的信息時效性。
OpenAI此次推出的三個版本針對不同應用場景進行了專門優化:
1. GPT-4.1旗艦版:支持百萬tokens上下文窗口,在Video-MME長文本測試中創下72.0%的新紀錄
2. GPT-4.1 mini:性能媲美GPT-4o,延遲降低近半,成本減少83%
3. GPT-4.1 nano:最經濟高效的選擇,MMLU測試得分80.1%,特別適合分類和自動補全任務
早期采用者已經驗證了GPT-4.1的卓越性能,其中Windsurf測試顯示編程效率提升30%,減少50%不必要編輯,Thomson Reuters的法律AI助手CoCounsel實現多文檔審查準確率提升17%,在復雜任務處理和智能代理構建方面展現出獨特優勢。
隨著GPT-4.1的加入,OpenAI模型命名復雜性問題再次凸顯。公司CEO山姆・奧爾特曼此前已承認這一問題,并表示計劃通過未來的GPT-5進行品牌整合。按照規劃,GPT-4.5 Preview模型將于2025年7月前從API中逐步淘汰。