当前位置: 首页 > java >正文

用SSD实现AI RAG性能升级,铠侠发布AiSAQ新版本

铠侠AiSAQ 软件于2025年1月首次发布,采用针对固态硬盘优化的ANNS(近似最近邻搜索)算法,无需将索引数据存储在 DRAM 中。铠侠AiSAQ 技术直接在固态硬盘上进行向量搜索,降低了对主机内存的需求,因而向量数据库得以扩展,基本上摆脱了有限 DRAM 容量带来的限制。

当系统中的固态硬盘容量固定时,要提升搜索性能(每秒查询次数),每个向量需要占用更多的固态硬盘空间,从而导致向量数减少。反之,若要增加向量数,就必须减少每个向量的空间占用,但这会导致性能下降。二者的最佳平衡点取决于具体的工作负载。为了找到合适的平衡点,铠侠AiSAQ 软件引入了灵活的配置选项。新版软件使管理员可以针对 RAG 系统中各种不同的工作负载灵活选择最佳平衡点。此次更新使 铠侠AiSAQ 技术成为理想的、基于固态硬盘的 ANNS 解决方案,它不仅适用于 RAG 应用,也适用于离线语义搜索等其他向量密集型应用。

面对日益增长的可扩展 AI 服务需求,对于 RAG 系统所需的高吞吐量和低延迟,固态硬盘提供了一种替代 DRAM 的实用方案。铠侠AiSAQ 软件能够高效地满足这些需求,实现大规模生成式 AI,而不受有限存储资源的限制。

铠侠AiSAQ 软件的开源发布旨在推动以固态硬盘为核心的可扩展 AI 架构的发展,进一步彰显了铠侠对 AI 社区的承诺。

请通过以下链接下载 铠侠AiSAQ 开源软件。

https://github.com/kioxia-jp/aisaq-diskann 

http://www.xdnf.cn/news/16244.html

相关文章:

  • Ubuntu22 上,用C++ gSoap 创建一个简单的webservice
  • 【硬件-笔试面试题】硬件/电子工程师,笔试面试题-24,(知识点:二极管基础知识,单向导电性)
  • 【09】C#入门到精通——C# 结构体对齐 与 常用数据 对应关系
  • CF每日5题(1500-1600)
  • node.js中的path模块
  • 技嘉z370主板开启vtx
  • windows11通过wsl安装Ubuntu到D盘,安装docker及宝塔面板
  • 【STM32】FreeRTOS 任务的删除(三)
  • 《 java 随想录》| 数组
  • Java学习日记_廖万忠
  • 支持OCR和AI解释的Web PDF阅读器:解决大文档阅读难题
  • uni-appDay02
  • #来昇腾学AI 【十天成长计划】大模型LLM Prompt初级班
  • Java学习----工厂方法模式
  • 深入理解 eMMC RPMB 与 OP-TEE 在 Linux 系统中的应用开发
  • day62-可观测性建设-全链路监控zabbix+grafana
  • 爬虫算法原理解析
  • Windows环境下 Go项目迁移至Ubuntu(WSL) 以部署filebeat为例
  • MinIO 版本管理实践指南(附完整 Go 示例)
  • MySQL深度理解-MySQL索引优化
  • 二分查找----5.寻找旋转排序数组中的最小值
  • Android Activity与Fragment生命周期变化
  • 谈谈ArrayList与Vector的理解?
  • NOTEPAD!NPCommand函数分析之comdlg32!GetSaveFileNameW--windows记事本源代码分析
  • TechGPT3部署
  • 【STM32】FreeRTOS 任务的创建(二)
  • 深入理解大语言模型生成参数:temperature、top\_k、top\_p 等全解析
  • EasyExcel 模板导出数据 + 自定义策略(合并单元格)
  • vue 项目中 components 和 views 包下的组件功能区别对比,示例演示
  • AudioLLM 开源项目了解学习