当前位置: 首页 > news >正文

Elasticsearch 是 NVIDIA Enterprise AI Factory 验证设计中推荐的向量数据库

作者:来自 Elastic Aditya Tripathi, Hemant Malik

Elastic 现已与 NVIDIA Enterprise AI Factory 验证设计集成,为用户提供推荐的本地向量数据库。该验证设计为企业构建和部署本地 AI Factory 提供了框架。

用于多模态检索增强生成(RAG)场景的 Elasticsearch 向量数据库

Elasticsearch:适用于 NVIDIA AI Factory 的企业级向量数据库

验证设计结合了 NVIDIA 加速计算与 AI 软件,优化了 AI 模型部署、多模态数据提取以及使用 Elasticsearch 的嵌入生成 —— 一个经过大规模验证的向量数据库,可用于存储和搜索所有 AI 数据。客户可以在 NVIDIA AI Factory 上使用 Elasticsearch,通过验证设计构建 agentic AI 应用。

与 Elasticsearch 搭配的 NVIDIA Enterprise AI Factory 验证设计,帮助企业通过完整的预构建蓝图加速 AI 应用。

但这项合作还有更多亮点 —— 想想 GPU 加速的向量搜索!

接下来是什么?

Elastic 将使用 NVIDIA cuVS —— 一个开源 GPU 加速向量搜索库 —— 创建新的 Elasticsearch 插件,在两个关键领域引入 GPU 加速:

  1. 索引构建时间:借助 NVIDIA GPU,可以减少在 Elasticsearch 中构建和更新向量索引所需的时间。
  2. 查询性能:通过 GPU 加速执行 kNN 向量搜索,目标是实现更低的延迟和更高的吞吐量,以支持 Elasticsearch 中的实时 AI 应用。

这次与 NVIDIA 的 GPU 加速合作将建立在 Elastic 团队之前的优化基础之上,包括 CPU SIMD、BBQ(更优的二进制量化)和更快的过滤式 HNSW,使 Elasticsearch 成为用户首选的向量数据库。敬请关注 Elasticsearch Labs 的更多更新。

本帖中描述的任何功能或功能发布的时间安排,完全由 Elastic 自行决定。当前尚未提供的任何功能或功能,可能不会按时发布,甚至可能永远不会发布。

在本文中,我们可能使用或提及了第三方生成式 AI 工具,这些工具由其各自所有者拥有和运营。Elastic 无法控制这些第三方工具,对其内容、运行或使用不承担任何责任,也不对因你使用这些工具而可能造成的任何损失或损害承担责任。在使用 AI 工具处理个人、敏感或机密信息时,请务必谨慎。你提交的任何数据都可能被用于 AI 训练或其他用途。无法保证你提供的信息会被安全或保密地处理。在使用任何生成式 AI 工具之前,你应熟悉其隐私政策和使用条款。

Elastic、Elasticsearch 及相关标志是 Elasticsearch N.V. 在美国和其他国家/地区的商标、徽标或注册商标。所有其他公司和产品名称均为其各自所有者的商标、徽标或注册商标。

原文:Elasticsearch is a recommended vector database in the NVIDIA Enterprise AI Factory validated design | Elastic Blog

http://www.xdnf.cn/news/1162045.html

相关文章:

  • 数据结构堆的实现(C语言)
  • Web3.0 能为你带来哪些实质性的 改变与突破
  • Vue 脚手架——render函数
  • 【算法笔记】树状数组
  • Linux学习之Linux系统权限
  • 《C++》函数内联,auto关键字
  • 用基础模型构建应用(第十章)AI Engineering: Building Applications with Foundation Models学习笔记
  • 探索无广告音乐世界:MusicFree 免费播放器
  • 海康威视视觉算法岗位30问及详解
  • BERT 的“池化策略”
  • 【NLP舆情分析】基于python微博舆情分析可视化系统(flask+pandas+echarts) 视频教程 - 主页布局实现
  • Three.js 立方体贴图(CubeMap)完全指南:从加载到应用
  • 大模型高效适配:软提示调优 Prompt Tuning
  • Python高效入门指南
  • 深入详解随机森林在放射治疗计划优化中的应用及实现细节
  • 部署 Zabbix 企业级分布式监控
  • Levels checking (filtering) in logging module
  • 大腾智能国产3D CAD软件正式上架华为云云商店
  • Pytorch01:深度学习中的专业名词及基本介绍
  • Linux的磁盘存储管理实操——(中)——逻辑卷管理实战
  • JavaScript的引入方式和基础语法的快速入门与学习
  • 【Linux】重生之从零开始学习运维之Mysql安装
  • Linux下SPI设备驱动开发
  • 管理项目环境和在环境中使用conda或pip里如何查看库版本———Linux命令行操作
  • 装饰器模式分析
  • Android Studio 的 Gradle 究竟是什么?
  • 在 Conda 中删除环境及所有安装的库
  • ElasticSearch:不停机更新索引类型(未验证)
  • 【iOS】锁[特殊字符]
  • 归并排序:优雅的分治排序算法(C语言实现)