專訪思必馳俞凱:專業(yè)化語言大模型是通用人工智能落地發(fā)展的核心
“大模型是人工智能的新時(shí)代。對(duì)話式的語言大模型是整個(gè)人工智能大模型進(jìn)一步突破的核心。而專業(yè)化的語言大模型,是真正的通用人工智能落地的發(fā)展的核心。”思必馳聯(lián)合創(chuàng)始人、首席科學(xué)家、上海交通大學(xué)教授俞凱在2023全球智博會(huì)上表示。
俞凱作為一名人工智能的從業(yè)者,更是一名研究者,他對(duì)目前大模型的行業(yè)發(fā)展和趨勢(shì)有著自己的見解。“在接受采訪時(shí)他表示,以GPT為代表的通用大模型是人工智能發(fā)展的一個(gè)集中式突破,包括對(duì)話智能技術(shù)、深度學(xué)習(xí)大模型技術(shù)、工程化能力以及大數(shù)據(jù)的整體突破。而基礎(chǔ)AI技術(shù)創(chuàng)新,必須最終走入產(chǎn)業(yè),結(jié)合場(chǎng)景應(yīng)用才會(huì)變得有價(jià)值。”
通用模型 助力產(chǎn)業(yè)迭代
以ChatGPT為代表的通用人工智能技術(shù),通過數(shù)據(jù)和算力效能的變化,催生出海量的新商業(yè)模式。而數(shù)字人、個(gè)人助理、搜索引擎等應(yīng)用基于通用人工智能基礎(chǔ)架構(gòu)的變化,更引發(fā)了產(chǎn)業(yè)創(chuàng)新迭代,俞凱認(rèn)為其對(duì)產(chǎn)業(yè)的影響主要體現(xiàn)在以下四個(gè)方面。
首先,通用人工智能技術(shù)對(duì)搜索引擎產(chǎn)生了革命性變化。搜索引擎之前是通過篩選關(guān)鍵詞,推薦給用戶全部答案,讓用戶自行篩選模式。現(xiàn)在,更傾向于提出一個(gè)問題,搜索引擎能直接給出回答,而且這個(gè)答案可能比此前的關(guān)鍵詞搜索更加豐富、多元。在垂直領(lǐng)域,變化更巨大。比如文獻(xiàn)的搜索衍變成為直接給出更準(zhǔn)確、豐富的資料,給用戶提供了更得力的幫助。
其次,通用人工智能技術(shù)正在重塑辦公模式,僅僅輸入一句簡(jiǎn)短的文字,就能生成初稿;只要提供簡(jiǎn)要演示的信息、想要的風(fēng)格,點(diǎn)擊生成,一份排版精美、動(dòng)畫豐富的PPT就誕生了……當(dāng)辦公軟件得到人工智能的加持,人們的工作方式或許會(huì)從根本上發(fā)生變化。辦公效率將大幅提升,辦公場(chǎng)景從此改變。
再次,用戶可以應(yīng)用通用人工智能技術(shù)做內(nèi)容創(chuàng)作。無論是生成一篇文章,生成一個(gè)郵件,其高效、快速、多風(fēng)格的內(nèi)容為創(chuàng)新應(yīng)用拓展、創(chuàng)作成本降低等提供了有力支撐,大模型正在成為內(nèi)容生產(chǎn)的創(chuàng)新引擎。
最后,就是和物理世界的連接。因?yàn)橥ㄓ萌斯ぶ悄芗夹g(shù)可以生成代碼,而代碼是連接最基礎(chǔ)的物理設(shè)備的基本協(xié)議。當(dāng)只需要一句話就可以轉(zhuǎn)成代碼來操作系統(tǒng),人工智能就變成了一個(gè)物理操作系統(tǒng)。
俞凱認(rèn)為,在技術(shù)的迭代發(fā)展上,ChatGPT本質(zhì)就是一個(gè)統(tǒng)計(jì)類的深度學(xué)習(xí)對(duì)話通用大模型。而思必馳應(yīng)該算是國(guó)內(nèi)最早一批去進(jìn)行統(tǒng)計(jì)類對(duì)話模型的產(chǎn)業(yè)化研究的公司之一,并且在任務(wù)型對(duì)話上也取得了實(shí)際的研究成績(jī)和應(yīng)用成績(jī)。俞凱表示,思必馳已有的語音和語義的通用基礎(chǔ)模型,已經(jīng)達(dá)到億級(jí)參數(shù)。在通用基礎(chǔ)模型技術(shù)方面,目前思必馳使用千塊GPU卡量級(jí)的超算資源,并正在整合擴(kuò)展資源,在已有算法研究和數(shù)據(jù)積累的基礎(chǔ)上,將億級(jí)參數(shù)模型擴(kuò)展到百億以上量級(jí)。
伴隨人工智能技術(shù)發(fā)展的,便一直是“AI有所為、有所不為”的討論。俞凱表示,技術(shù)本身是中性的,關(guān)鍵是運(yùn)用技術(shù)的人,應(yīng)該向善、不作惡。生成式AI面臨的兩大挑戰(zhàn),一是數(shù)據(jù)合規(guī),包括數(shù)據(jù)來源合規(guī)、數(shù)據(jù)處理合規(guī)、數(shù)據(jù)生成合規(guī);二是應(yīng)用邊際,包括需要從人員管理上、工程化實(shí)現(xiàn)、場(chǎng)景領(lǐng)域上去規(guī)范應(yīng)用邊界,如何更好地“協(xié)助人類”而不是“替代人類”,甚至是淪為deep fake的幫兇。
涌現(xiàn)能力 加速落地發(fā)展
基于語言大模型的通用對(duì)話系統(tǒng)的出現(xiàn)產(chǎn)生了巨大的轉(zhuǎn)變,在深度學(xué)習(xí)時(shí)代,產(chǎn)生了很多的之前沒有的能力,叫做涌現(xiàn)能力。俞凱表示:“所有涌現(xiàn)能力的產(chǎn)生,一定不是自然而然的,它的涌現(xiàn)能力的產(chǎn)生,‘大’很重要,具有產(chǎn)生新可能,甚至于無窮無盡的可能性,也是大模型‘涌現(xiàn)’的前提條件。”