通用embedding模型和通用reranker模型,观测调研
调研Qwen3-Embedding和Qwen3-Reranker
现在有一个的问答库,包括150个QA-pair,用10个query去同时检索问答库的300个question+answer
Embedding模型,query-question的匹配分数 普遍高于 query-answer的匹配分数。比如对于10个query,检索结果里,9个排第一的结果是question
Reranker模型,query-answer的匹配分数 普遍高于 query-question的匹配分数。比如对于10个query,检索结果里,9个排第一的结果是answer
所以,通用Embedding模型不太适合query-Doc的检索,
所以现在出了 由doc生成question,用生成的question和query匹配的方法,
或者query生成answer,用生成的answer和doc匹配的方法