RAG面试内容整理-3. 向量检索原理与常用库(ANN、FAISS、Milvus 等)
向量检索利用向量空间的相似度来查找相关内容,是近年来兴起的检索技术核心。其基础是在语义嵌入(embedding)模型的支持下,将文本、图像等数据表示为高维向量,以便通过向量相似度(如余弦相似度或欧氏距离)找到内容上的邻近项。由于直接精确计算所有向量之间的距离在大规模下计算开销巨大,实际系统通常采用近似最近邻搜索(Approximate Nearest Neighbor, ANN)算法,在保证结果精度接近的同时显著加速检索。常见的ANN算法包括基于向量量化的、基于图的和基于树的多种方法,如球树/ KD-树(适用于低维但高维效果差)、LSH(局部敏感哈希)和<