用SSD实现AI RAG性能升级,铠侠发布AiSAQ新版本
铠侠AiSAQ 软件于2025年1月首次发布,采用针对固态硬盘优化的ANNS(近似最近邻搜索)算法,无需将索引数据存储在 DRAM 中。铠侠AiSAQ 技术直接在固态硬盘上进行向量搜索,降低了对主机内存的需求,因而向量数据库得以扩展,基本上摆脱了有限 DRAM 容量带来的限制。
当系统中的固态硬盘容量固定时,要提升搜索性能(每秒查询次数),每个向量需要占用更多的固态硬盘空间,从而导致向量数减少。反之,若要增加向量数,就必须减少每个向量的空间占用,但这会导致性能下降。二者的最佳平衡点取决于具体的工作负载。为了找到合适的平衡点,铠侠AiSAQ 软件引入了灵活的配置选项。新版软件使管理员可以针对 RAG 系统中各种不同的工作负载灵活选择最佳平衡点。此次更新使 铠侠AiSAQ 技术成为理想的、基于固态硬盘的 ANNS 解决方案,它不仅适用于 RAG 应用,也适用于离线语义搜索等其他向量密集型应用。
面对日益增长的可扩展 AI 服务需求,对于 RAG 系统所需的高吞吐量和低延迟,固态硬盘提供了一种替代 DRAM 的实用方案。铠侠AiSAQ 软件能够高效地满足这些需求,实现大规模生成式 AI,而不受有限存储资源的限制。
铠侠AiSAQ 软件的开源发布旨在推动以固态硬盘为核心的可扩展 AI 架构的发展,进一步彰显了铠侠对 AI 社区的承诺。
请通过以下链接下载 铠侠AiSAQ 开源软件。
https://github.com/kioxia-jp/aisaq-diskann