阿里云通義千問發布Qwen-Image-Edit 圖像編輯AI邁入精準可控新時代
8月19日,阿里云旗下通義千問團隊正式推出Qwen-Image-Edit圖像編輯模型,標志著AI圖像處理技術從生成向精準編輯的重要跨越。這款基于20B參數Qwen-Image模型進一步訓練的創新產品,成功實現了對圖像內容從語義到像素級別的雙重控制。
Qwen-Image-Edit的創新之處在于其獨特的雙通道處理架構。通過同時接入Qwen2.5-VL模型和VAE編碼器,該技術既能理解圖像的深層語義,又能精確控制視覺外觀表現。這種雙重能力使其不僅可以完成IP形象創作、物體旋轉等需要保持語義一致的高階編輯,還能實現文字修改、元素增減等要求局部精確控制的低階操作。特別是在文字編輯方面,模型能夠精準保持原有字體風格,支持中英文雙語的無縫修改。
從官方展示的案例來看,該技術已具備豐富的實用價值。在創意設計領域,可以快速生成MBTI十六型人格表情包等IP衍生內容;在商業攝影后期,能輕松完成人物背景替換、服裝調整等復雜操作;對于平面設計行業,則提供了直接修改海報文字的便捷工具。更令人印象深刻的是其"鏈式編輯"能力,通過分步驟漸進修正,最終實現了《蘭亭集序》書法作品的精準修復,展現出處理復雜文化內容的潛力。