当前位置: 首页 > ai >正文

使用 硅基流动+Doris+DeepSeek搭建RAG知识库(保姆级教程)

使用用硅基流动+Doris+DeepSeek搭建RAG知识库(保姆级教程)

什么是RAG?

检索增强生成(Retrieval-Augmented Generation)是一种将知识库检索与大语言模型生成相结合的技术架构。

通过Doris实时检索业务知识,DeepSeek进行语义理解,硅基流动提供弹性算力,实现以下优势:

  1. 解决大模型知识时效性瓶颈(如DeepSeek默认知识截止至2024年7月)
  2. 突破企业私有数据壁垒(支持导入内部文档、代码库等非公开资料)
  3. 降低幻觉现象(回答基于检索到的权威内容)

硅基流动

硅基流动是专为AI应用设计的弹性算力平台,提供:

  1. 多模态模型API调用(支持嵌入式部署)
  2. 分布式GPU资源调度
  3. 企业级数据隐私保护
  4. 动态流量负载均衡(应对突发高并发场景)

硅基流动官网 提供2000万免费Token及华为云昇腾算力支持,显著降低企业AI落地成本.
硅基流动 注册即赠送14元额度,约2000万免费Token,方便测试。

二、环境搭建(手把手教学)

Doris集群部署

硬件配置推荐

生产环境最低配置(三节点集群示例)

# 生产环境最低配置(三节点集群示例)
节点类型 | CPU  | 内存  | 磁盘  
---------------------------------
FE       | 8| 16GB | 200GB SSD  
BE       | 16| 64GB | 2TB NVMe 

快速安装流程

#使用Docker部署(开发测试环境)
git clone https://github.com/apache/doris  
cd doris/docker 
./build.sh  --tag latest --build-arg FROM=ubuntu:18.04 
./run.sh  --image apache/doris:latest 

关键配置调优

-- 创建知识库专用数据库 
CREATE DATABASE rag_db;
-- 建表语句(支持向量检索)
CREATE TABLE doc_store (id BIGINT,content TEXT,embedding ARRAY<FLOAT>,file_path VARCHAR(255)
) ENGINE=olap 
DUPLICATE KEY(id)
PARTITION BY RANGE(id)()
DISTRIBUTED BY HASH(id) BUCKETS 10;

2.2 Python环境准备

# 创建虚拟环境 
conda create -n rag python=3.8 
conda activate rag # 安装核心依赖库
pip install pymysql sqlalchemy markdown numpy 
pip install siliconflow-sdk --extra-index-url https://pypi.siliconflow.com  

知识库构建实战

Markdown文档处理

import os 
from markdown import markdown def process_markdown(folder_path):docs = []for root, _, files in os.walk(folder_path): for file in files:if file.endswith(".md"): path = os.path.join(root,  file)with open(path, 'r') as f:html = markdown(f.read()) docs.append({ 'content': html,'path': path })return docs 

数据入库Doris

from sqlalchemy import create_engine def load_to_doris(docs):engine = create_engine('mysql+pymysql://user:pass@fe_host:9030/rag_db')for idx, doc in enumerate(docs):# 生成向量嵌入(示例伪代码)embedding = siliconflow.embed(doc['content'])   engine.execute(f""" INSERT INTO doc_store VALUES ({idx}, '{doc['content']}', [{','.join(map(str, embedding))}], '{doc['path']}')""")

#智能问答系统开发

检索增强流程设计

用户提问 Doris 硅基流动 DeepSeek 用户 语义向量检索 Top5相关文档 增强Prompt生成 结构化答案 用户提问 Doris 硅基流动 DeepSeek 用户

4.2 核心调用代码

from siliconflow import AISession def rag_query(question):# 语义检索 query_embed = siliconflow.embed(question) results = doris_search(query_embed)  # Doris向量查询 # 增强提示 context = "\n".join([r.content for r in results[:3]])prompt = f"基于以下知识:\n{context}\n请回答:{question}"# 调用DeepSeek with AISession(api_key="硅基流动key密钥") as ai:response = ai.generate( model="deepseek-r1-32b",prompt=prompt,temperature=0.3 )return response.text  

密钥登录 硅基流动官网 获取
在这里插入图片描述

避坑指南

  1. 向量维度对齐:确保硅基流动的嵌入维度与Doris表结构定义一致
  2. 分词策略优化:中文文档建议采用jieba+同义词词典预处理
  3. 并发控制:硅基流动API默认QPS=5,需申请企业级配额
  4. 数据安全:敏感文档建议启用Doris的透明加密功能
  5. 源码获取:访问硅基流动开发者平台 获取完整项目模板
http://www.xdnf.cn/news/1818.html

相关文章:

  • XBIT以创新技术引领币圈十大APP,开启数字货币交易新时代
  • SpringBoot 学习
  • 基于STM32的大棚温度环境调控系统设计方案
  • 2015-2023 各省 GDP 数据,用QuickBI 进行数据可视化——堆叠图!
  • 基于HTML+CSS实现的动态导航引导页技术解析
  • 聚客AI手把手实战:用LlamaIndex+代码实现亿级数据的智能问答系统
  • 【C++指南】告别C字符串陷阱:如何实现封装string?
  • 深入浅出Sentinel:分布式系统的流量防卫兵
  • 5.3 Dify:低代码平台,适用于企业快速部署合规AI应用
  • Linux系统中命令设定临时IP
  • 四步完成机房3D建模仿真:小白也能快速上手
  • 提示js方法未定义,但是确实<textarea>标签未闭合。
  • 2025研究生论文阅读器推荐:提升学术效率的最佳工具
  • 电子病历高质量语料库构建方法与架构项目(数据遗忘篇)
  • DeepSeek+Cline:开启自动化编程新纪元
  • 矫平机进阶解析:技术细节、行业案例与未来创新
  • 算法设计与分析7(贪心算法)
  • 企业为何要禁止“片断引用开源软件代码”?一文看透!
  • python编程相关的单词
  • ConcurrentHashMap原理
  • 数据结构之排序
  • 声呐系统概述
  • Android Privacy Sandbox实战:零基础开发企业级广告系统(附完整代码+GDPR合规+联邦学习全攻略)
  • 【AI生成】无人平台与自组网融合技术在电网中的应用研究
  • SiSi Coin全球共识社区开创Meme币新纪元,通缩机制与社区自治引领Web3未来
  • QuickLookv3.7.3(官方版)文件快速预览工具软件下载及安装教程
  • vue入门
  • [ESP-IDF]:esp32-camera 使用指南 ESP32S3-OV2640 用例测试
  • 初一试后担忧
  • 《梦的第七章》开荒秘籍:必练 SSR 角色与培养优先级全解析