当前位置: 首页 > web >正文

AGI大模型(32):LangChain实现RAG

1 LangChain文档加载模块

1.1 加载本地PDF文件

(1)安装依赖

pip install pypdf -i https://pypi.tuna.tsinghua.edu.cn/simple

(2)代码实现

from langchain_community.document_loaders import PyPDFLoader
from dotenv import load_dotenvload_dotenv()loader = PyPDFLoader("P020230320547157228048.pdf")
pages = loader.load_and_split()print(len(pages))print(f"第0页:\n{pages[0]}") ## 也可通过 pages[0].page_content只获取本页内容

(3)结果如下

1.2 加载在线的PDF文件

http://www.xdnf.cn/news/8077.html

相关文章:

  • NSSCTF-[陇剑杯 2021]webshell(问6)
  • 关于如何在Springboot项目中通过excel批量导入数据
  • Flask vs. Django:如何选择最适合你的 Web 框架?
  • 基于Scikit-learn与Flask的医疗AI糖尿病预测系统开发实战
  • 蓝桥杯 3. 涂色
  • OceanBase数据库全面指南(基础入门篇)
  • C# 实现轻量化数据库SQLite在工业中上的应用
  • TensorFlow深度学习实战(17)——主成分分析详解
  • 鞋服行业数据防泄露——企业解决方案
  • NFS服务器实验
  • 深入了解linux系统—— 文件系统
  • 物联网、云计算技术加持,助推楼宇自控系统实现智能高效管理
  • 机器学习与深度学习算法:从决策树到 GAN 的原理与 PyTorch 实现
  • 数智读书笔记系列033《软件设计的哲学(第2版)》:复杂性管理的艺术
  • Qt C++图书管理系统
  • 在Linux debian12系统上使用go语言以及excelize库处理excel数据
  • CQF预备知识:一、微积分 —— 1.2.2 函数f(x)的类型详解
  • 【力扣题目分享】二叉树专题(C++)
  • Spring开发系统时如何实现上传和下载文件
  • Java转Go日记(五十四):gin路由
  • P1833 樱花
  • 端口号详解(技术向)
  • Java之函数式接口、lambda表达式、stream流操作、Optional容器、方法引用
  • 企业级调度器LVS
  • Java读写分离实战
  • Java SpringBoot 项目中 Redis 存储 Session 具体实现步骤
  • Java阻塞队列(BlockingQueue)的使用:ArrayBlockingQueue类、LinkedBlockingQueue类
  • JVM参数详解与实战案例指南(AI)
  • BurpSuite学习安装
  • MobaXterm 解除只能保存14个session会话限制