谷歌DeepMind推出本地化機(jī)器人AI模型 可獨(dú)立完成高精度任務(wù)
6月25日,谷歌DeepMind宣布推出Gemini Robotics On-Device,這是一款可在機(jī)器人設(shè)備本地運(yùn)行的AI模型,無需依賴云端即可執(zhí)行復(fù)雜任務(wù),如系鞋帶、疊衣服、打開拉鏈等高難度操作。該技術(shù)基于視覺-語言-動作(VLA)架構(gòu),旨在提升機(jī)器人的自主性和響應(yīng)速度,適用于醫(yī)療、家庭服務(wù)等網(wǎng)絡(luò)不穩(wěn)定的場景。
傳統(tǒng)機(jī)器人AI通常依賴云端計(jì)算,而Gemini Robotics On-Device直接在設(shè)備端處理數(shù)據(jù),大幅降低延遲,確保任務(wù)執(zhí)行的實(shí)時(shí)性。谷歌表示,該模型尤其適合手術(shù)輔助機(jī)器人、工業(yè)機(jī)械臂等對穩(wěn)定性要求極高的場景。
該AI支持雙機(jī)械臂協(xié)同操作,可完成精細(xì)動作,如系鞋帶、整理衣物等。目前適配的機(jī)器人包括: ALOHA(開源機(jī)器人平臺)、Franka FR3(工業(yè)協(xié)作機(jī)械臂)、Apollo(人形機(jī)器人)。DeepMind強(qiáng)調(diào),該模型不僅能執(zhí)行預(yù)設(shè)任務(wù),還能通過少量演示(50-100次)學(xué)習(xí)新技能,適應(yīng)不同場景需求。
谷歌同步推出Gemini Robotics SDK,開發(fā)者可利用該工具包訓(xùn)練機(jī)器人執(zhí)行定制任務(wù),并借助MuJoCo物理模擬器進(jìn)行測試。此外,系統(tǒng)內(nèi)置多重安全機(jī)制:Live API 實(shí)時(shí)檢測語義安全,防止錯誤操作、底層安全控制器 限制力度與速度,避免意外傷害、開放語義安全基準(zhǔn)測試框架,供開發(fā)者優(yōu)化模型。
DeepMind機(jī)器人項(xiàng)目負(fù)責(zé)人Carolina Parada表示,該模型借鑒了Gemini多模態(tài)AI的世界理解能力,能像生成文本、代碼一樣“生成”機(jī)器人動作。目前,該技術(shù)僅向可信測試計(jì)劃的開發(fā)者開放,基于Gemini 2.0架構(gòu)(未采用最新的2.5版本),未來或逐步向更廣泛領(lǐng)域推廣。