谷歌Gemini上線Veo 3 AI視頻生成功能 照片秒變8秒帶音頻短視頻
7月11日,谷歌宣布其AI助手Gemini正式接入Veo 3模型,推出全新“圖像轉視頻”功能。用戶只需上傳一張照片,即可生成一段8秒鐘的短視頻,并可添加背景音樂、環(huán)境音效甚至語音對白,讓靜態(tài)圖片“活”起來。目前,該功能已面向部分地區(qū)的AI Ultra和AI Pro訂閱用戶開放,網頁版率先上線,移動端將于本周逐步推送。
根據谷歌介紹,用戶只需在Gemini的提示欄中選擇“視頻”工具,上傳照片并輸入提示詞(如“海浪拍打岸邊”“小狗搖尾巴”),AI便會根據描述生成動態(tài)效果。此外,用戶還能進一步添加音頻指令,例如對白(“嗨,今天天氣真好!”)或音效(鳥鳴、風聲),系統將確保畫面與聲音精準同步。最終生成的視頻為720p分辨率、16:9橫屏MP4格式,適合社交媒體分享。
谷歌舉例稱,這項技術可讓日常物品動起來(如漂浮的茶杯)、賦予繪畫作品生命力,或為風景照添加動態(tài)元素(如飄動的云層)。不過,所有生成視頻均會附帶明顯的AI水印,并嵌入谷歌的SynthID隱形數字水印,以標識內容來源。
據報道,Veo是谷歌旗下DeepMind團隊開發(fā)的視頻生成模型,此次升級至Veo 3后,畫面流暢度和音頻同步能力顯著提升。盡管目前視頻長度限制為8秒,但其生成速度和易用性已優(yōu)于多數同類產品。谷歌強調,該功能旨在幫助用戶快速創(chuàng)作創(chuàng)意內容,而非替代專業(yè)視頻制作。
目前,圖像轉視頻功能僅向付費訂閱用戶開放(AI Ultra/Pro),免費版Gemini暫不支持。谷歌未透露后續(xù)是否會擴大開放范圍,但表示將根據反饋優(yōu)化生成效果。