專訪思必馳俞凱：專業(yè)化語言大模型是通用人工智能落地發(fā)展的核心

2023-06-27 18:26:00 | | 7

“大模型是人工智能的新時(shí)代。對(duì)話式的語言大模型是整個(gè)人工智能大模型進(jìn)一步突破的核心。而專業(yè)化的語言大模型，是真正的通用人工智能落地的發(fā)展的核心。”思必馳聯(lián)合創(chuàng)始人、首席科學(xué)家、上海交通大學(xué)教授俞凱在2023全球智博會(huì)上表示。

俞凱作為一名人工智能的從業(yè)者，更是一名研究者，他對(duì)目前大模型的行業(yè)發(fā)展和趨勢(shì)有著自己的見解。“在接受采訪時(shí)他表示，以GPT為代表的通用大模型是人工智能發(fā)展的一個(gè)集中式突破，包括對(duì)話智能技術(shù)、深度學(xué)習(xí)大模型技術(shù)、工程化能力以及大數(shù)據(jù)的整體突破。而基礎(chǔ)AI技術(shù)創(chuàng)新，必須最終走入產(chǎn)業(yè)，結(jié)合場(chǎng)景應(yīng)用才會(huì)變得有價(jià)值。”

通用模型助力產(chǎn)業(yè)迭代

以ChatGPT為代表的通用人工智能技術(shù)，通過數(shù)據(jù)和算力效能的變化，催生出海量的新商業(yè)模式。而數(shù)字人、個(gè)人助理、搜索引擎等應(yīng)用基于通用人工智能基礎(chǔ)架構(gòu)的變化，更引發(fā)了產(chǎn)業(yè)創(chuàng)新迭代，俞凱認(rèn)為其對(duì)產(chǎn)業(yè)的影響主要體現(xiàn)在以下四個(gè)方面。

首先，通用人工智能技術(shù)對(duì)搜索引擎產(chǎn)生了革命性變化。搜索引擎之前是通過篩選關(guān)鍵詞，推薦給用戶全部答案，讓用戶自行篩選模式。現(xiàn)在，更傾向于提出一個(gè)問題，搜索引擎能直接給出回答，而且這個(gè)答案可能比此前的關(guān)鍵詞搜索更加豐富、多元。在垂直領(lǐng)域，變化更巨大。比如文獻(xiàn)的搜索衍變成為直接給出更準(zhǔn)確、豐富的資料，給用戶提供了更得力的幫助。

其次，通用人工智能技術(shù)正在重塑辦公模式，僅僅輸入一句簡(jiǎn)短的文字，就能生成初稿；只要提供簡(jiǎn)要演示的信息、想要的風(fēng)格，點(diǎn)擊生成，一份排版精美、動(dòng)畫豐富的PPT就誕生了……當(dāng)辦公軟件得到人工智能的加持，人們的工作方式或許會(huì)從根本上發(fā)生變化。辦公效率將大幅提升，辦公場(chǎng)景從此改變。

再次，用戶可以應(yīng)用通用人工智能技術(shù)做內(nèi)容創(chuàng)作。無論是生成一篇文章，生成一個(gè)郵件，其高效、快速、多風(fēng)格的內(nèi)容為創(chuàng)新應(yīng)用拓展、創(chuàng)作成本降低等提供了有力支撐，大模型正在成為內(nèi)容生產(chǎn)的創(chuàng)新引擎。

最后，就是和物理世界的連接。因?yàn)橥ㄓ萌斯ぶ悄芗夹g(shù)可以生成代碼，而代碼是連接最基礎(chǔ)的物理設(shè)備的基本協(xié)議。當(dāng)只需要一句話就可以轉(zhuǎn)成代碼來操作系統(tǒng)，人工智能就變成了一個(gè)物理操作系統(tǒng)。

俞凱認(rèn)為，在技術(shù)的迭代發(fā)展上，ChatGPT本質(zhì)就是一個(gè)統(tǒng)計(jì)類的深度學(xué)習(xí)對(duì)話通用大模型。而思必馳應(yīng)該算是國(guó)內(nèi)最早一批去進(jìn)行統(tǒng)計(jì)類對(duì)話模型的產(chǎn)業(yè)化研究的公司之一，并且在任務(wù)型對(duì)話上也取得了實(shí)際的研究成績(jī)和應(yīng)用成績(jī)。俞凱表示，思必馳已有的語音和語義的通用基礎(chǔ)模型，已經(jīng)達(dá)到億級(jí)參數(shù)。在通用基礎(chǔ)模型技術(shù)方面，目前思必馳使用千塊GPU卡量級(jí)的超算資源，并正在整合擴(kuò)展資源，在已有算法研究和數(shù)據(jù)積累的基礎(chǔ)上，將億級(jí)參數(shù)模型擴(kuò)展到百億以上量級(jí)。

伴隨人工智能技術(shù)發(fā)展的，便一直是“AI有所為、有所不為”的討論。俞凱表示，技術(shù)本身是中性的，關(guān)鍵是運(yùn)用技術(shù)的人，應(yīng)該向善、不作惡。生成式AI面臨的兩大挑戰(zhàn)，一是數(shù)據(jù)合規(guī)，包括數(shù)據(jù)來源合規(guī)、數(shù)據(jù)處理合規(guī)、數(shù)據(jù)生成合規(guī)；二是應(yīng)用邊際，包括需要從人員管理上、工程化實(shí)現(xiàn)、場(chǎng)景領(lǐng)域上去規(guī)范應(yīng)用邊界，如何更好地“協(xié)助人類”而不是“替代人類”，甚至是淪為deep fake的幫兇。

涌現(xiàn)能力加速落地發(fā)展

基于語言大模型的通用對(duì)話系統(tǒng)的出現(xiàn)產(chǎn)生了巨大的轉(zhuǎn)變，在深度學(xué)習(xí)時(shí)代，產(chǎn)生了很多的之前沒有的能力，叫做涌現(xiàn)能力。俞凱表示：“所有涌現(xiàn)能力的產(chǎn)生，一定不是自然而然的，它的涌現(xiàn)能力的產(chǎn)生，‘大’很重要，具有產(chǎn)生新可能，甚至于無窮無盡的可能性，也是大模型‘涌現(xiàn)’的前提條件。”

專訪思必馳俞凱：專業(yè)化語言大模型是通用人工智能落地發(fā)展的核心

涌現(xiàn)能力的背后，則進(jìn)一步隱含著三個(gè)非常重要的技術(shù)：情景學(xué)習(xí)、思維鏈和指令學(xué)習(xí)。情景學(xué)習(xí)深刻改變了傳統(tǒng)機(jī)器學(xué)習(xí)的范式，只需要通過一系列精心設(shè)計(jì)的提示語句，對(duì)任務(wù)進(jìn)行詳細(xì)描述，然后再輔以一些情景例子，就能夠讓模型參考著既定例子完成特定任務(wù)。

指令學(xué)習(xí)則使模型能夠理解并執(zhí)行各種自然語言指令，將任務(wù)指令化以便機(jī)器理解。人類只需要在少量的任務(wù)上進(jìn)行指令化，在經(jīng)歷大概40多個(gè)任務(wù)指令化之后，對(duì)模型進(jìn)行適度微調(diào)，就很容易泛化到上百、上千種任務(wù)，即使它從來沒有見過。而思維鏈則使得模型具有了推理的能力，讓本來模型不會(huì)解的一個(gè)個(gè)復(fù)雜問題，分解成很多簡(jiǎn)單問題，然后通過逐一解決簡(jiǎn)單問題，最終使得復(fù)雜問題迎刃而解。

AI技術(shù)更不能單靠底層原始創(chuàng)新來推動(dòng)發(fā)展，其落地應(yīng)用需要結(jié)合行業(yè)認(rèn)知和客戶需求輸出整體性、結(jié)果導(dǎo)向性的實(shí)用解決方案。采訪的最后，俞凱說：“希望所有的產(chǎn)業(yè)伙伴和研究伙伴和我們一起共創(chuàng)大模型未來的生態(tài)。讓深度學(xué)習(xí)的下一代大模型可以在促進(jìn)數(shù)字經(jīng)濟(jì)發(fā)展方面發(fā)揮重要作用。”

思必馳將于7月12日在蘇州舉辦DFM- 2 大模型及創(chuàng)新技術(shù)應(yīng)用成果發(fā)布會(huì)，發(fā)布屬于自己的東風(fēng)大模型。在發(fā)布會(huì)上，思必馳也會(huì)詳細(xì)解讀DFM- 2 在行業(yè)落地的應(yīng)用情況，而這款大模型表現(xiàn)如何，我們也拭目以待。

本文系鉍讀原創(chuàng)稿件，版權(quán)屬鉍讀所有，未經(jīng)授權(quán)不得轉(zhuǎn)載，已經(jīng)協(xié)議授權(quán)的媒體下載使用時(shí)須注明稿件來源：鉍讀，違者將依法追究責(zé)任。