当前位置: 首页 > news >正文

通义千问-langchain使用构建(三)

目录

  • 序言
  • docker 部署xinference
    • 1WSL环境docker安装
    • 2拉取镜像运行容器
    • 3使用的界面
  • 本地跑chatchat
    • 1rag踩坑
    • 2使用的界面
      • 2.1配置个前置条件然后对话
      • 2.2rag对话
  • 结论

序言

在前两天的基础上,将xinference调整为wsl环境,docker部署。
然后langchain chatchat 还是本地虚拟环境直接跑。
以及简单在这个chatchat框架里上传了一个文本文件,询问大模型文件内容。
还行,跑起来了,坑也是不少

docker 部署xinference

1WSL环境docker安装

参考这个链接内容配置下wsl的docker环境,以及配置下国内私人dockerhub镜像源。
【现在竟然没有公司或者学校配置的dockerhub镜像了,奇怪,真奇怪。不配置就要梯子】
参考链接1:https://blog.csdn.net/wylszwr/article/details/147671490

这里有个坑,C盘如果空间不够,wsl最好迁移到D盘,因为大模型挺占空间的。

2拉取镜像运行容器

参考下面这个链接操作一下就好了,然后配置的端口,回头更新在chatchat的yaml文件就行。
【1050ti的显卡,cuda和torch这些版本适配有些麻烦,所以我就拉去的cpu版本镜像。
docker pull xprobe/xinference:latest-cpu】
参考链接2:https://inference.readthedocs.io/zh-cn/latest/getting_started/using_docker_image.html

3使用的界面

加载模型界面
就运行这里lunch模型,要等一会儿
在这里插入图片描述
这个运行这里就能看到已经下载到本地的模型了。
语言模型: 就是正常对话的。
嵌入模型embedding模型: 就是把上传的文本材料,解析成向量,搞到知识库的。
重排序rerank模型: 目前简单理解为嵌入模型的升级版(250517)。
参考链接3:https://blog.csdn.net/2401_84033492/article/details/144546055
图像模型: 简单理解为画图的。
音频模型: 简单理解为听声音,转换为声音的。
视频模型: 生成视频的。
在这里插入图片描述

本地跑chatchat

和上一篇的调整没啥区别。
就是yaml文件要更新。
【我看有人不建议chatchat在docker跑。我不搞是因为wsl搞docker compose插件有点繁琐】

1rag踩坑

有个问题就是上传文件半天没反应,参考这个降httpx版本就好了。
参考链接:https://blog.csdn.net/ddyzqddwb/article/details/144347702

2使用的界面

2.1配置个前置条件然后对话

在这里插入图片描述

2.2rag对话

往上找了个诗经的txt传上去,然后用模型阅读。只是一部分,全是文言文,我自己看着是挺头大的。
在这里插入图片描述
上传的文言文材料。
在这里插入图片描述

结论

windows机器。
wsl环境。
docker跑xinference
本地python环境跑了chatchat
实现大模型的管理加载,以及简单的知识库构建与rag管理。
这就是这次的内容。

http://www.xdnf.cn/news/500059.html

相关文章:

  • 2025年渗透测试面试题总结-百度面经(题目+回答)
  • YOLO (You Only Look Once)版本历程学习
  • Java泛型详解
  • Vue百日学习计划Day21-23天详细计划-Gemini版
  • Elasticsearch 官网阅读之 Term-level Queries
  • 关于软件测试开发的一些有趣的知识
  • ElasticSearch 8.x新特性面试题
  • 【论文阅读】针对BEV感知的攻击
  • python:gimp 与 blender 两个软件如何协作?
  • 5.27本日总结
  • JSP链接MySQL8.0(Eclipse+Tomcat9.0+MySQL8.0)
  • markdown 文档编辑软件 MarkText 使用教程
  • QT软件安装
  • 项目复习(1)
  • 刷leetcodehot100返航版--二叉树
  • JavaScript【7】BOM模型
  • MODBUS RTU通信协议详解与调试指南
  • 利用人工智能优化求职流程:开发一个智能求职助手
  • 【软考 程序流程图的测试方法】McCabe度量法计算环路复杂度
  • ubuntu安装google chrome
  • AtomicInteger
  • Axure制作可视化大屏动态滚动列表教程
  • 2025 年九江市第二十三届中职学校技能大赛 (网络安全)赛项竞赛样题
  • Seata源码—5.全局事务的创建与返回处理一
  • 由浮点数x的位级表示求其整型值
  • MySQL UPDATE 执行流程全解析
  • 【开源Agent框架】Suna架构设计深度解析与应用实践
  • Spring源码之解决循环依赖 三级缓存
  • UDP--DDR--SFP,FPGA实现之模块梳理及AXI读写DDR读写上板测试
  • 【离散化 线段树】P3740 [HAOI2014] 贴海报|普及+