当前位置: 首页 > news >正文

【全网首发】解决coze工作流批量上传excel数据文档数据重复的问题

注意:目前方法将基于前一章批量数据库导入的修改!!!!请先阅读上篇文章的操作。抄袭注明来源

背景

上一节说的方法可以批量导入文件到数据库,但是无法解决已经上传的条目更新问题。简单来说,不会覆盖原始数据,只会在数据库后面增加新的条目,并没有达到更新数据的目的,只能说上一篇文章解决了运营阶段智能体能够和数据后台的连接,是一把钥匙。那么本文解决的就是更新的问题【在原始条目上】

思想来源

你需要注意的是,经过我不断测试下来,字节的这个SQL自定义采用的是Oracle的方式,普通的REPLACE等操作指令不认,会报SQL语句语法错误的问题。其次,如果你采用MERGE等操作手段,你会发现SQL语句过于繁琐,对大批量数据写入数据库不友好,插件难以制作。因此,本人不得已采用了一种方式,那就是先删除原始节点再上传,同时,我更新了插件代码,同步生成对应的DEL语句指令

插件2.0代码

from runtime import Args
#注意下面的 read_excels根据自己设置的插件名称会有调整。
from typings.test.test import Input, Output
import requests
import io
import pandas as pd
import re
def remove_apostrophe(input_str: str) -> str:"""移除字符串中的英文单引号"""return input_str.replace("'", "’")def handler(args: Args[Input])->Output:# 文档地址 urlurl = args.input.file_link# 数据库表明database_table = args.input.database_table# 数据库表字段名(注意:文档的表头名字必须与数据库表字段名相同)database_table_list = args.input.database_table_listresponse = requests.get(url)values_list = []del_list = []s = ""m = ""if response.status_code == 200:df = pd.read_excel(io.BytesIO(response.content))for index, row in df.iloc[0:].iterrows():for i in database_table_list:res = row[i]if i == "product_name":res = remove_apostrophe(row[i])if i == "erp_code":del_list.append(str(res))  # 直接添加完整的ERP代码s = f"{s}'{res}',"values_list.append(f"({s[:-1]})")s = ""for i in database_table_list:m = f"{m}{i},"del_content = f"DELETE FROM {database_table} WHERE erp_code IN ({', '.join(f"'{x}'" for x in del_list)});"content = f"INSERT INTO {database_table} ({m[:-1]}) VALUES {', '.join(values_list)};"else:content = f"无法从网址获取文件,状态码:{response.status_code}"del_content = f"无法从网址获取文件,状态码:{response.status_code}"return {"insert_output1":content, "del_output2":del_content}

工作流2.0修改部分展示(完整请私信我)

在这里插入图片描述

效果展示

在这里插入图片描述
都维持在20条,没有机械式的简单增加
在这里插入图片描述

http://www.xdnf.cn/news/478567.html

相关文章:

  • 图像分割(0)初步认识
  • 高光谱遥感图像处理之数据分类的fcm算法
  • K8s CoreDNS 核心知识点总结
  • 捌拾伍- 量子傅里叶变换 (3)
  • 【目标检测】RT-DETR
  • 智脑进化:神经网络如何从单层感知机迈向深度学习新纪元
  • 动态规划(2):问题建模与状态设计
  • 求职困境:开发、AI、运维、自动化
  • 序列dp常见思路总结
  • RabbitMQ 消息模式实战:从简单队列到复杂路由(四)
  • 卡顿检测与 Choreographer 原理
  • Java大师成长计划之第24天:Spring生态与微服务架构之分布式配置与API网关
  • window 显示驱动开发-使用有保证的协定 DMA 缓冲区模型
  • 论信息系统项目的范围管理
  • 后端框架(3):Spring(2)
  • Gitee DevOps:中国企业数字化转型的“本土化加速器“
  • Ubuntu 更改 Nginx 版本
  • PCIE接收端检测机制分析
  • 源码:处理文件格式和字符集的相关代码(3-3)
  • Qt图表绘制(QtCharts)- 性能优化(13)
  • 关于Redisson分布式锁的用法
  • TRTC实时对话式AI解决方案,助力人机语音交互极致体验
  • Python 编程技巧 @ 玩转 For 循环
  • Linux `ps` 命令深度解析与高阶应用指南
  • 简单介绍C++中线性代数运算库Eigen
  • 【未完】【GNN笔记】EvolveGCN:Evolving Graph Convolutional Networks for Dynamics Graphs
  • sqli-labs靶场29-31关(http参数污染)
  • ECPF 简介
  • python爬虫实战训练
  • vscode debug node + 前端