DeepSeek開源大模型V3.1 128K上下文窗口創(chuàng)行業(yè)新紀錄

2025-08-20 12:37:24 | 棠糖 | 1416

8月20日凌晨，國內人工智能企業(yè)深度求索（DeepSeek）在Hugging Face平臺正式開源新一代大語言模型DeepSeek-V3.1-Base。這款擁有6850億參數(shù)的巨型模型最引人注目的特性是其128K的超長上下文處理能力，標志著國產大模型在長文本理解領域取得重大突破。

據官方介紹，此次開源的Base版本與線上服務同步升級的V3.1版本保持核心能力一致。即日起用戶可通過官方網頁、移動應用及小程序體驗增強后的長文本處理功能，API接口則保持原有調用方式無需調整。這種"開源即商用"的部署模式，既為開發(fā)者社區(qū)提供了研究基礎，也確保了商業(yè)服務的連續(xù)性。

技術文檔顯示，128K的上下文長度相當于模型可一次性處理約10萬漢字的內容，較此前主流模型的32K長度實現(xiàn)四倍提升。這項突破使得模型能夠更好地理解長文檔、進行跨段落推理以及維持長對話的連貫性，在金融分析、法律文書處理等專業(yè)場景具有顯著應用價值。

特別提醒：本網信息來自于互聯(lián)網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其原創(chuàng)性以及文中陳述文字和內容未經本站證實，對本文以及其中全部或者部分內容、文字、圖片等內容的真實性、完整性、及時性本站不作任何保證或承諾，請自行核實相關內容。本站不承擔此類作品侵權行為的直接責任及連帶責任。如若本網有任何內容侵犯您的權益，請及時發(fā)送相關信息至bireading@163.com，本站將會在48小時內處理完畢。

最新資訊更多》

1 微軟推出首批自研AI模型：語音生成進入“秒級”時代
2 三星首款三折疊手機演示動畫曝光，支持反向充電、移動支付
3 OpenAI正式推出Realtime語音對話API，支持多語言切換與情感感知
4 Meta將為Horizon Worlds引入AI驅動的NPC
5 微軟宣布 2026 年 2 月 27 日停用 Win10 / Win11 版 Mobile Plans 應用
6 蘋果發(fā)布Xcode 26 Beta 7 深度集成GPT-5與Claude提升AI編程體驗
7 《戰(zhàn)地風云6》反作弊系統(tǒng)設“安全啟動”門檻，技術總監(jiān)回應爭議
8 Epic游戲商城本周免費贈送《機械迷城》與《Make Way》
9 索尼PS6掌機規(guī)格曝光：搭載3nm APU或于2027年上市
10 云知聲2025年中期業(yè)績：營收同比增加20.2%，大模型收入飆漲457%
11 Leader懶人三筒標尺三烘款打造“嵌入不局改”新標準碾壓式再升級
12 小米澎湃OS 3發(fā)布重新定義重載場景流暢標準

DeepSeek開源大模型V3.1 128K上下文窗口創(chuàng)行業(yè)新紀錄

2025-08-20 12:37:24 瀏覽量： 1416 作者：棠糖

合作伙伴

關于我們
阿里云

京公網安備 11011302001633號

公眾號二維碼

京ICP備18051707號

京公網安備 11011302001633號