欧美三级不卡/成人97视频/四虎成人精品永久免费av九九 /国产一区二区精品91 - 成人三级在线播放

阿里通義千問首個圖像生成基礎模型 Qwen-Image 開源 支持中文高保真輸出

2025-08-05 11:06:52   |   唐薇   |   1147

8月5日,阿里通義千問團隊今日宣布開源 Qwen-Image,這是一個 20B 的 MMDiT 模型,也是通義千問系列中首個圖像生成基礎模型,其在復雜文本渲染和精確圖像編輯方面取得了顯著進展。

通義千問團隊在多個公開基準上對 Qwen-Image 進行了全面評估,包括用于通用圖像生成的 GenEval、DPG 和 OneIG-Bench,以及用于圖像編輯的 GEdit、ImgEdit 和 GSO。

Qwen-Image 的主要特性包括:

文本渲染能力:Qwen-Image 在復雜文本渲染方面表現出色,支持多行布局、段落級文本生成以及細粒度細節呈現。無論是英語還是中文,均能實現高保真輸出。

一致性的圖像編輯能力:通過增強的多任務訓練范式,Qwen-Image 在編輯過程中能保持編輯的一致性。

跨基準性能表現:在多個公開基準測試中的評估表明,Qwen-Image 在各類生成與編輯任務中均獲得 SOTA。

Qwen-Image 在所有基準測試中均取得了最先進的性能。此外,在用于文本渲染的 LongText-Bench、ChineseWord 和 TextCraft 上的結果表明,Qwen-Image 在文本渲染方面表現尤為出色,特別是在中文文本渲染上,大幅領先現有的最先進模型。

除了文本處理,Qwen-Image 在通用圖像生成方面支持多種藝術風格。從照片級寫實場景到印象派繪畫,從動漫風格到極簡設計,該模型能夠靈活響應各種創意提示。在圖像編輯方面,Qwen-Image 支持風格遷移、增刪改、細節增強、文字編輯,人物姿態調整等多種操作。這讓普通用戶也能實現專業級的圖像編輯。

特別提醒:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字、圖片等內容的真實性、完整性、及時性本站不作任何保證或承諾,請自行核實相關內容。本站不承擔此類作品侵權行為的直接責任及連帶責任。如若本網有任何內容侵犯您的權益,請及時發送相關信息至bireading@163.com,本站將會在48小時內處理完畢。

阿里通義千問首個圖像生成基礎模型 Qwen-Image 開源 支持中文高保真輸出

2025-08-05 11:06:52 瀏覽量: 1147 作者: 唐薇

8月5日,阿里通義千問團隊今日宣布開源 Qwen-Image,這是一個 20B 的 MMDiT 模型,也是通義千問系列中首個圖像生成基礎模型,其在復雜文本渲染和精確圖像編輯方面取得了顯著進展。

通義千問團隊在多個公開基準上對 Qwen-Image 進行了全面評估,包括用于通用圖像生成的 GenEval、DPG 和 OneIG-Bench,以及用于圖像編輯的 GEdit、ImgEdit 和 GSO。

Qwen-Image 的主要特性包括:

文本渲染能力:Qwen-Image 在復雜文本渲染方面表現出色,支持多行布局、段落級文本生成以及細粒度細節呈現。無論是英語還是中文,均能實現高保真輸出。

一致性的圖像編輯能力:通過增強的多任務訓練范式,Qwen-Image 在編輯過程中能保持編輯的一致性。

跨基準性能表現:在多個公開基準測試中的評估表明,Qwen-Image 在各類生成與編輯任務中均獲得 SOTA。

Qwen-Image 在所有基準測試中均取得了最先進的性能。此外,在用于文本渲染的 LongText-Bench、ChineseWord 和 TextCraft 上的結果表明,Qwen-Image 在文本渲染方面表現尤為出色,特別是在中文文本渲染上,大幅領先現有的最先進模型。

除了文本處理,Qwen-Image 在通用圖像生成方面支持多種藝術風格。從照片級寫實場景到印象派繪畫,從動漫風格到極簡設計,該模型能夠靈活響應各種創意提示。在圖像編輯方面,Qwen-Image 支持風格遷移、增刪改、細節增強、文字編輯,人物姿態調整等多種操作。這讓普通用戶也能實現專業級的圖像編輯。

,

Copyright ©2018 鉍讀網 All Rights Reserved.

京ICP備18051707號

京公網安備 11011302001633號