云知聲黃偉:深耕人工智能11年 未來持續升級山海大模型能力
“云知聲還將持續升級山海大模型能力,目標是年內通用能力比肩ChatGPT,并在醫療、物聯、教育等多個垂直領域能力超越GPT4。”云知聲創始人、CEO黃偉表示。
一路走來,云知聲的基因血統中體現了變與不變的因素。云知聲一直在順應時代的變化,進行自我革新。同時,云知聲也一直堅持將技術投入作為重要的戰略方向。日前,云知聲宣布推出山海大模型,并發布一系列面向不同行業需求的應用產品。山海大模型能力如何?而云知聲為什么要做大模型,云知聲創始人、CEO黃偉對鉍讀做了一些介紹。
什么是山海大模型?
山海大模型是云知聲AGI技術架構升級的結果。云知聲以山海大模型為基礎,打造MaaS 模式的AI 2.0解決方案。山海大模型擁有十大核心能力。其中包括語言生成、語言理解、知識問答、邏輯推理、代碼能力、數學能力、安全合規能力七項通用能力及插件擴展、領域增強、企業定制三項行業落地能力,云知聲通過語音輸入、實時互動的方式進行講解演示。
作為生成式AI最具代表性的能力,語言生成是山海大模型的基礎能力之一。山海大模型不僅可以生成各種流暢、連貫的文本,包括新聞、作文、小說、郵件、古詩和對聯等各種文案,還可以通過多語種、多文體和多風格的方式支持各種語言生成任務,包括創作、摘要、翻譯。此外,還支持多種約束條件下的可控文本生成。
黃偉認為,在過去的一段時間,人工智能的能力處于 AI1.0 時代,只是做一個分類的任務,很難去為客戶創造一個充分的價值。在大模型引領的 AI 2.0 時代,為人工智能帶來了新的能力,可以打造更多新的產品,滿足客戶更多的需求,例如醫療、營銷、溝通等,能夠創造更多的商業機會。
這一次,在通用能力基礎上,云知聲還發布多款基于山海大模型打造的面向不同場景需求的行業應用,從效率、成本、體驗等多角度,為千行百業的智慧升級按下加速鍵。黃偉表示,山海大模型技術架構就是通用大模型,并針對知識密度高的領域,通過數據訓練、訓練數據、微調等方式,做一些專業的加強。山海大模型增強物聯、醫療等行業能力,為客戶提供更智能、更靈活的解決方案,打開更大的 AI 技術產業化商業空間。
為什么堅持做人工智能?
云知聲從2012年入局深度學習,到后來搭建AI全棧能力,山海大模型代表的AGI技術升級,已經是云知聲成立11年來的第三次技術大升級。2022年底,當ChatGPT火出圈外,云知聲就已經意識到U+X戰略期待已久的AGI時代到來了。于是,迅速調動研發團隊,在Atlas智算平臺、DCML模型工廠基礎上,繼續擴充算力,攻關工程優化和數據優選。在短短幾個月時間里,云知聲就完成了算力擴容、算法驗證、并行加速、數據優選等工作,實現GPT為核心的架構升級,成功發布山海大模型,邁向通往AGI的新征程。
據官方介紹,云知聲以智能語音識別、自然語言理解、知識圖譜等全棧 AI 技術為核心,打造云服務和AI芯片,并基于云芯一體化平臺,面向智慧物聯與智慧醫療兩大領域提供以對話式AI技術為基礎的產品服務與綜合解決方案。
據黃偉介紹,在通用數據方面,目前云知聲差不多接近200p的算力,全部都是一些最新的GPU的算力。而面對專業領域,想要打造大模型,必然需要行業的數據,但并不是只有數據就夠了。針對這個問題,黃偉表示,山海大模型,可以讓云知聲用新的能力去打造新的產品,去更好的去滿足客戶的需求。
例如在醫療領域進行增強的過程中,不僅需要一些行業的數據,還加入了大量的專輯、病案、教材,以及云知聲在為醫療服務中積累的千萬級的標準的醫療數據,并背靠國內最大的醫療知識數據圖譜,才實現了山海大模型在MedQA評測能力中超越GPT-4的結果。
對于未來,黃偉也有自己的思考。他表示:“我們希望產品真正的能夠更好的服務客戶,接下來會把基于大模型的車載產品方案,物聯方案落地,對于目前已經在使用的客戶還會做一個快速升級,讓使用更貼心。”