OpenAI升級(jí)ChatGPT 多模態(tài)AI實(shí)現(xiàn)文本圖像無縫創(chuàng)作
3月26日,人工智能技術(shù)迎來重大突破。OpenAI于本周二宣布,其ChatGPT聊天機(jī)器人已升級(jí)為多模態(tài)AI系統(tǒng),不僅能處理文本,還能根據(jù)復(fù)雜指令生成高質(zhì)量圖像,甚至整合語音、視頻等交互方式。
此次升級(jí)讓ChatGPT的創(chuàng)作能力大幅提升。例如,用戶只需描述一個(gè)四宮格漫畫的情節(jié),包括角色設(shè)定和對(duì)話內(nèi)容,AI就能迅速生成符合要求的完整漫畫圖像。相比此前版本,新版ChatGPT能更精準(zhǔn)地理解并融合多樣化概念,實(shí)現(xiàn)更富創(chuàng)意的視覺表達(dá)。
這一技術(shù)突破源于OpenAI最新模型GPT-4o的支持,它不僅強(qiáng)化了文本生成能力,還整合了圖像、語音和視頻處理功能,使AI能更自然地與用戶互動(dòng)。
值得注意的是,OpenAI此次并未采用傳統(tǒng)的獨(dú)立模塊設(shè)計(jì),而是將文本與圖像生成技術(shù)深度融合。研究員加布里埃爾·吳(Gabriel Goh)表示:“我們不再將文本和圖像視為獨(dú)立任務(wù),而是讓AI協(xié)同學(xué)習(xí),從而更靈活地應(yīng)對(duì)復(fù)雜需求。” 在實(shí)際測試中,新版ChatGPT已能處理傳統(tǒng)AI難以完成的創(chuàng)意任務(wù),例如生成“三角形車輪的自行車”等非常規(guī)圖像。
OpenAI表示,該功能已向所有用戶開放,包括免費(fèi)用戶和訂閱ChatGPT Plus(20美元/月)、ChatGPT Pro(200美元/月)的付費(fèi)用戶。此次升級(jí)標(biāo)志著AI技術(shù)正從單一功能向全能型助手加速演進(jìn)。