当前位置: 首页 > backend >正文

基于Dify实现对Excel的数据分析

       在dify部署完成后,大家就可以基于此进行各种应用场景建设,目前dify支持聊天助手(包括对话工作流)、工作流、agent等模式的场景建设,我们在日常工作中经常会遇到各种各样的数据清洗、格式转换处理、数据统计成图等数据分析工作,本次主要基于对话工作流模式对Excel文件、csv文件进行解析处理,并进行成图等数据分析工作。主要用到的插件有LLM节点,文档提取器、参数提取器、自定义代码节点、echart插件等。实现解析Excel数据,经过上述不同节点的处理分析流程,最终实现数据统计图展示。具体如下,供大家参考学习。

一、数据准备

准备一个Excel文件,内容可以是产品月度销售数据或者油气田月度产量数据等。如下图。

二、工作流程设计

总体工作流程图如下。

1.文档提取器
输入变量就是开始节点的文件。
2.LLM节点,提示词设计见下图。

3.参数提取器
输入变量为LLM节点的输出变量text。提取参数和任务指令见下图。

4.自定义代码(Exl2Echart)代码,代码需要在sandbox容器中执行,目前主要支持python和nodejs代码,记得安装相应的依赖库。本文中的csv和json库都是默认安装的。代码详见下方

import csv
import json
def main(csv_string):# 将CSV字符串分割成行lines = csv_string.strip().split('\n')# 使用csv模块读取数据reader = csv.reader(lines)# 将所有行转换为列表data = [row for row in reader]# 将数字字符串转换为浮点数for row in data[1:]:  # 跳过标题行,即第一行# 将第二列及之后的所有列的数据类型调整为数字类型(这里是float)for i in range(1, len(row)):try:row[i] = float(row[i])except ValueError:pass# 创建完整的ECharts配置echarts_config = {"legend": {},"tooltip": {},"dataset": {"source": data},"xAxis": [{"type": "category", "gridIndex": 0},{"type": "category", "gridIndex": 1}],"yAxis": [{"gridIndex": 0},{"gridIndex": 1}],"grid": [{"bottom": "55%"},{"top": "55%"}],"series": [# 第一个网格中的柱状图系列,注意要根据数据进行删减{"type": "bar", "seriesLayoutBy": "row"},{"type": "bar", "seriesLayoutBy": "row"},{"type": "bar", "seriesLayoutBy": "row"},{"type": "bar", "seriesLayoutBy": "row"},{"type": "bar", "seriesLayoutBy": "row"},{"type": "bar", "seriesLayoutBy": "row"},# 第二个网格中的折线图系列,注意要根据数据进行删减{"type": "line", "xAxisIndex": 1, "yAxisIndex": 1},{"type": "line", "xAxisIndex": 1, "yAxisIndex": 1},{"type": "line", "xAxisIndex": 1, "yAxisIndex": 1},{"type": "line", "xAxisIndex": 1, "yAxisIndex": 1},{"type": "line", "xAxisIndex": 1, "yAxisIndex": 1}]}# 生成输出文件,这里是echart要求的格式输出output = "```echarts\n" + json.dumps(echarts_config, indent=2, ensure_ascii=False) + "\n```"return {"output": output}

5.结束节点,设置回复内容为Exl2Echart节点的输出变量。

三、应用效果演示

运行工作流选择文件后启动对话,在对话框中输入“请分析Excel数据”,即可实现如下效果。编写完成的应用可以嵌入到任意一个应用系统的任何位置,实现对Excel数据的分析工作流。具体效果见下图。

http://www.xdnf.cn/news/5389.html

相关文章:

  • 嵌入式硬件篇---陀螺仪|PID
  • Linux之进程概念
  • 电源架构与太阳能充电器电路设计分析
  • OpenWrt开发第8篇:树莓派开发板做无线接入点
  • langchain 接入国内搜索api——百度AI搜索
  • Qt 样式表:全面解析与应用指南
  • LeetCode 高频题实战:如何优雅地序列化和反序列化字符串数组?
  • 理解 Token 索引 vs 字符位置
  • C++23 新特性:深入解析 std::views::join_with(P2441R2)
  • 深入解析 Vision Transformer (ViT) 与其在计算机视觉中的应用
  • 效率办公新工具:PDF Reader Pro V5.0功能解析与使用体验
  • NHANES稀有指标推荐:MedHi
  • M. Moving Both Hands(反向图+Dijkstra)
  • 视频编解码学习10之成像技术原理
  • 华为配置篇-RSTP/MSTP实验
  • 股指期货的保证金交易和资金门槛是多少?
  • 《Go小技巧易错点100例》第三十三篇
  • Redis--常见数据类型List列表
  • 思维链框架:LLMChain,OpenAI,PromptTemplate
  • 游戏引擎学习第274天:基于弹簧的动态动画
  • 【MySQL】表空间结构 - 从何为表空间到段页详解
  • 【质量管理】什么是过程?
  • Qt 窗口部件(2)输入部件详解
  • 深入解析STM32中断机制:从原理到外部中断实战
  • 力扣70题解
  • 二叉搜索树讲解
  • [思维模式-25]:《本质思考力》-6- 马克思主义哲学的五对基本哲学范畴,以及在计算机领域的体现
  • 用c语言实现——一个交互式的中序线索二叉树系统,支持用户动态构建、线索化、遍历和查询功能
  • 理性地倾听与表达:检索算法的语言学改进
  • 《P1226 【模板】快速幂》