
大家好,我是 Ai 學(xué)習(xí)的老章

昨天阿里開源家族迎來兩個新成員——Qwen3-Embedding
和 Qwen3-Reranker
,專為文本表征、檢索和排序任務(wù)設(shè)計,都基于 Qwen3
模型構(gòu)建。
看了測評,Qwen3-Embedding-8B
目前是 MTEB 多語言排行榜榜首,我最期待的是Qwen3-Embedding-0.6B,模型文件不足 1.2GB,Q4 量化版只有 639MB!
Qwen3-Reranker
也很能打,我準(zhǔn)備替換掉目前正在使用的 BGE-reranker-v2-m3
了。
下面咱們一起看看這兩個新模型
關(guān)于 Qwen3-Embedding 和 Qwen3-Reranker 的一切
知識庫
Embedding
和 Reranker
都是應(yīng)用于知識庫的兩個核心技術(shù)。
知識庫是一個結(jié)構(gòu)化或非結(jié)構(gòu)化的信息存儲系統(tǒng),用于存儲、組織和檢索領(lǐng)域特定或通用知識,結(jié)合大模型技術(shù)(如語義搜索和生成模型)來提升檢索效率和回答質(zhì)量。簡單說,就是給大模型外掛了新知識。
說起知識庫,大家更熟悉的技術(shù)是 RAG
,它通過結(jié)合檢索模型和生成模型,先從知識庫檢索相關(guān)信息,再由生成模型(如大語言模型)基于檢索結(jié)果生成自然語言回答,從而減少大模型的幻覺,提高回答的準(zhǔn)確性和上下文相關(guān)性,特別適合知識庫問答場景。
RAG
基本工作流程包括:
- 文檔處理:將原始文檔進行分塊、清洗和標(biāo)準(zhǔn)化處理
- 索引構(gòu)建:構(gòu)建高效的向量索引以支持快速檢索
- 檢索:根據(jù)用戶查詢,從索引中檢索相關(guān)文檔
- 重排序:對檢索結(jié)果進行精確排序,確保最相關(guān)的文檔排在前面
- 生成回答:基于檢索到的相關(guān)文檔,生成準(zhǔn)確的回答

事實上 RAG 目前已經(jīng)從上面最簡單的技術(shù)架構(gòu)發(fā)展出各種變體

Qwen3-Embedding
對應(yīng) 向量化環(huán)節(jié)
- 定義:將文本、圖像或其他數(shù)據(jù)轉(zhuǎn)化為高維向量表示,捕捉其語義內(nèi)容。嵌入模型通過深度學(xué)習(xí)生成這些向量,使語義相似的文本在向量空間中距離較近。
- 作用:支持語義搜索,允許知識庫根據(jù)查詢內(nèi)容的語義(而非僅關(guān)鍵詞)返回相關(guān)結(jié)果。例如,查詢“如何優(yōu)化數(shù)據(jù)庫”可以匹配包含“數(shù)據(jù)庫性能提升”的文檔。

Qwen3-Reranker
對應(yīng)重排序環(huán)節(jié)
- 檢索:從知識庫中初步篩選與查詢相關(guān)的文檔,通?;谇度胂蛄康南嗨贫龋ㄈ缬嘞蚁嗨贫龋?/span>
- 重排序(Reranking):對初步檢索結(jié)果進行精細排序,使用交叉編碼器(cross-encoder)計算查詢與文檔的相關(guān)性得分,進一步提升結(jié)果精準(zhǔn)度。
- 作用:結(jié)合“粗篩(Embedding)+ 精排(Reranking)”的流程,確保返回最相關(guān)的知識片段。

Qwen3-Embedding
Qwen3-Embedding
提供 0.6B、4B 和 8B 三種參數(shù)規(guī)模,滿足不同場景的性能與效率需求。
官方還放出了這三種參數(shù)模型的 GGUF 量化版
https://www./collections/Qwen3-Embedding-3edc3762d50f48Qwen3-Embedding
功能特點:
- 支持自定義最終嵌入的維度和指令感知(根據(jù)不同的任務(wù)定制輸入指令,官方測試:使用指令通常比不使用指令能提高 1% 到 5% 的性能)
- 支持 119 種語言,具備強大的多語言、跨語言和代碼檢索能力,適用于文檔檢索、RAG(檢索增強生成)、分類、情感分析、代碼搜索等任務(wù)。
性能方面:
8B 參數(shù)的 Embedding 模型在 MTEB 多語言排行榜上位列第一(得分 70.58)
4B 參數(shù)版就已經(jīng)超越目前特能打的 gemini-embedding-exp-03-07
了
而我目前使用的是 BGE-M3,也打不過Qwen3-Embedding-0.6B
了
這太誘人了,我看外面的評價,有人在測試把量化版放到 Raspberry Pi、手機端運行了
不過部署上,目前僅支持 transformers 的樣子,vllm 報錯了,應(yīng)該需要更新
Qwen3-Reranker
Qwen3-Embedding
也提供 0.6B、4B 和 8B 三種參數(shù)規(guī)模
https://www./collections/Qwen3-Reranker-6316e71b146c4f測評:
| | | | | | | |
---|
Jina-multilingual-reranker-v2-base | | | | | | | |
gte-multilingual-reranker-base | | | | | | | |
| | | | | | | |
Qwen3-Reranker-0.6B | | | | | | | |
Qwen3-Reranker-4B | | | | | | | |
Qwen3-Reranker-8B | | | | | | | |
Qwen3-Reranker
模型在文本檢索場景中顯著提升搜索相關(guān)性,尤其在 MTEB-R、CMTEB-R、MMTEB-R 和 MTEB-Code 等檢索子集上表現(xiàn)優(yōu)異
Qwen3-Reranker-0.6B
就已經(jīng)傲視群雄了
我用 vllm 部署了 4B 版,正在測試

下載,部署代碼
pip install modelscope
mkldir Qwen3-Reranker-4B
cd Qwen3-Reranker-4B
modelscope download Qwem/Qwen3-Reranker-4B --local_dir .
vllm serve . --served-model-name Qwen3-Reranker-4B --port 8001
制作不易,如果這篇文章覺得對你有用,可否點個關(guān)注。給我個三連擊:點贊、轉(zhuǎn)發(fā)和在看。若可以再給我加個??,謝謝你看我的文章,我們下篇再見!
搭建完美的寫作環(huán)境:工具篇(12 章)圖解機器學(xué)習(xí) - 中文版(72 張 PNG)ChatGPT、大模型系列研究報告(50 個 PDF)108 頁 PDF 小冊子:搭建機器學(xué)習(xí)開發(fā)環(huán)境及 Python 基礎(chǔ) 116 頁 PDF 小冊子:機器學(xué)習(xí)中的概率論、統(tǒng)計學(xué)、線性代數(shù) 史上最全!371 張速查表,涵蓋 AI、ChatGPT、Python、R、深度學(xué)習(xí)、機器學(xué)習(xí)等