当前位置: 首页 > news >正文

【AI知识库云研发部署】RAGFlow + DeepSeek

gpu

安装screen:yum install screen

配置ollama

下载官方安装脚本并执行: curl -fsSL  https://ollama.com/install.sh  | sh

通过screen后台运行ollama:screen -S ollama

在screen会话中启动服务:

export OLLAMA_KEEP_ALIVE=-1
export OLLAMA_HOST=0.0.0.0:11434 
export OLLAMA_NUM_PARALLEL=16
export OLLAMA_ORIGINS=*
ollama serve

通过ollama拉取模型

ollama pull deepseek-r1:8b
ollama pull bge-m3

结束所有ollama进程:pkill -f ollama

安装cmakeyum install cmake

wget https://huggingface.co/klnstpr/bge-reranker-v2-m3-Q8_0-GGUF/resolve/main/bge-reranker-v2-m3-q8_0.gguf

git clone  https://github.com/ggerganov/llama.cpp

TencentOS 3需要修改ggml/src/CMakeLists.txt才能编译:

find / -type f -path "*/ggml/src/CMakeLists.txt" 2>/dev/null
vim ggml/src/CMakeLists.txt

在llama.capp文件夹下
cmake -B build -DGGML_CUDA=ON
cmake --build build --config Release -j16
cd build/bin
screen -S llama.cpp
注意路径是否正确:
./llama-server -m /data/workspace/bge-reranker-v2-m3-q8_0.gguf --port 11435 --reranking --pooling rank -ngl 25 --host 0.0.0.0 -ub 16384

cpu

在云服务器 CVM (cpu版)中,克隆 RAGFlow 知识库:git clone https://github.com/infiniflow/ragflow.git   根据README.md安装

这里用cvm没用云研发的原因是云研发已经是容器环境了,不支持docker in docker

安装后从本地浏览器直接访问cvm,比如我的cvm是9.34.5.10,则访问http:/9.34.5.10

同样的添加其他几个,添加完成后如图:

到这一步基本完成了,回到主页开始上传文档,然后开始rag问答

注意等待文档解析完成

由于用的模型很拉垮,这里会很慢,耐心等待

http://www.xdnf.cn/news/310825.html

相关文章:

  • 第九节:图像处理基础-图像几何变换 (缩放、旋转、平移、翻转)
  • 1999-2023年各数据/研发经费内部支出数据/RD经费内部支出数据
  • JavaScript性能优化实战:深入探讨性能瓶颈与优化技巧
  • NAND Flash存储器的错误管理导览
  • 超短波跳频电台靶标设备 智能超短波通信模拟系统技术解析“
  • Chat_TTSV3 本地版 Chat_TTS—UI本地版 免费分享
  • 算法每日一题 | 入门-顺序结构-三角形面积
  • 从单机到生产:Kubernetes 部署方案全解析
  • 删除排序链表中的重复元素:三种解法详解
  • 电子电器架构 --- 网关转发时延解析
  • PostgreSQL存储过程“多态“实现:同一方法名支持不同参数
  • 亚马逊Q1财报公布!营收增长9%至1557亿美元
  • QT Sqlite数据库-教程03 插入数据-下
  • 信息论05:信息论中的条件熵——从不确定性量化到机器学习实战
  • opencv实战:银行卡卡号识别
  • 效率提升利器:解锁图片处理新姿势
  • MySQL的内置函数与复杂查询
  • 【Python面向对象编程】类与对象的深度探索指南
  • Python训练打卡Day17
  • 让混乱的讨论变成有效产出的智能助手
  • 51单片机入门教程——AT24C02(I2C 总线)
  • QGIS分割平行四边形
  • ctfshow web入门 web52
  • 汽车行业EDI教程【北美X12标准】——X12转换配置
  • Fluent UDF底层实现逻辑解析及示例
  • 养生融入生活,畅享健康人生
  • 7.9/Q1,Charls最新文章解读
  • PySide6使用资源文件
  • 6GHz频段受限:WiFi 7部署的“最后一公里”难题如何破局
  • 白平衡色温坐标系下自适应计算白点权重的方法