当前位置: 首页 > backend >正文

【Datawhale AI夏令营】基于多模态RAG的企业财报问答系统

文章目录

    • 学习资源
    • 数据处理流程
    • 整体架构流程

学习资源

学习者手册:https://www.datawhale.cn/activity/359/learn/206/4495

数据处理流程

原始PDF财报
多模态解析
模态拆分
文本内容
表格数据
图像/图表
文本分块
表格结构化
图像特征提取
文本嵌入
表格描述生成
图像嵌入
向量数据库

整体架构流程

数据处理流水线
文本/表格/图像向量
文本提取器
PDF解析器
表格识别器
图表检测器
文本分块
表格转结构化数据
图表描述生成
文本嵌入模型
表格描述模型
图像嵌入模型
向量数据库
用户界面
查询处理器
多模态检索引擎
向量数据库
多模态生成模型
响应生成
http://www.xdnf.cn/news/17339.html

相关文章:

  • Vue3 生命周期
  • Go语言实战案例:表单提交数据解析
  • 多模态RAG赛题实战--Datawhale AI夏令营
  • 39.【.NET8 实战--孢子记账--从单体到微服务--转向微服务】--扩展功能--调整发布脚本
  • 通过 Docker 运行 Prometheus 入门
  • C# 通过第三方库INIFileParser管理INI配置文件
  • 2025年渗透测试面试题总结-09(题目+回答)
  • 实战:MyBatis 中 db.properties 的正确配置与最佳实践
  • RAGFoundry:面向检索增强生成的模块化增强框架
  • 五、RuoYi-Cloud-Plus 前端项目部署以及如何改后端请求地址。
  • 【CTF】PHP反序列化基础知识与解题步骤
  • Java 大视界 -- Java 大数据在智能医疗手术机器人操作数据记录与性能评估中的应用(390)
  • 深入剖析Spring MVC核心原理:从请求到响应的魔法解密
  • Java-线程线程的创建方式
  • 【线性代数】线性方程组与矩阵——(3)线性方程组解的结构
  • kubectl get node k8s-node01 -o yaml | grep taint -B 5 -A 5
  • 电子电气架构 --- 48V车载供电架构
  • 第16届蓝桥杯Scratch选拔赛初级及中级(STEMA)2024年11月24日真题
  • 阿里Qwen-Image本地部署详细指南
  • SAP在越南投资1.75亿美元建设研发中心
  • 多线程(四) --- 线程安全问题
  • JS逆向实战案例之----【通姆】252个webpack模块自吐
  • jQuery 零基础学习第一天
  • 进阶向:Python编写网页爬虫抓取数据
  • PG靶机 - Shiftdel
  • 日语学习-日语知识点小记-构建基础-JLPT-N3阶段(15):文法+单词第5回
  • 99-基于Python的京东手机数据分析及预测系统
  • 母线电压采样芯片的四大类——汽车级选型对比表
  • git查看单个文件的所有修改记录
  • 105-基于Flask的珍爱网相亲数据可视化分析系统