阿里開源Qwen3-Embedding系列模型:多語言文本檢索能力行業領先
6月6日,阿里正式開源Qwen3-Embedding系列模型,包含Embedding(文本表征)和Reranker(排序)兩大模塊,專為文本檢索、語義匹配等任務優化。該系列基于Qwen3基礎模型訓練,在多項基準測試中表現卓越,尤其在多語言支持方面達到行業領先水平。
阿里官方數據顯示,Qwen3-Embedding系列在多語言文本表征任務中表現突出:8B參數版本在權威評測MTEB(Massive Text Embedding Benchmark)多語言榜單中排名第一(得分70.58),超越多家商業API服務。Reranker排序模型在文本檢索任務中顯著提升結果相關性,適用于搜索、推薦等場景。提供0.6B、2B、8B三種參數規模,開發者可根據算力需求靈活選擇。
此次開源延續了阿里通義千問(Qwen)系列的技術路線,降低企業部署AI檢索能力的門檻。隨著大模型競爭進入垂直化階段,高效的Embedding與Reranker技術將成為搜索、知識庫等場景的核心基礎設施。
目前,模型代碼及權重已公開,開發者可通過阿里官方GitHub倉庫獲取。業界預計,該系列將推動多語言檢索技術的進一步普及。