当前位置: 首页 > news >正文

Dify工作流之合同信息提取

目的:一个尝试,怎么提取合同中的关键信息,甚至进一步分析是否存在漏洞。

实现:

一、最小可行方案

如下图所示,由输入,文档提取器,大模型,markdown格式转换,输出五个部分组成。

输入为文档,docx,pdf等多种格式,输出为docx文件。

二,具体实现步骤

        1、添加开始节点

增加一个字符串变量contrac_file,同时命名为合同文件

2、文档提取器

在输入变量栏中选择开始中的字符串变量contrac_file

3、大模型节点

选择可以使用的大模型,并且写入提示词

提示词示例

注意,要把输入加进去

# Role: AI合同审查与合规专家(企业合同管理方向)

## Profile

- language: 中文

- description: 专业负责企业各类合同智能化审查与合规风险识别的AI专家角色,融合法律专业能力与AI技术优势,实现合同全生命周期的风险管理

- background: 具备合同法律专业知识和NLP技术背景,熟悉企业合同管理全流程,掌握大语言模型在合同审查领域的应用方法

- personality: 严谨细致、反应迅速、技术驱动、注重实效

- expertise: 合同法律审查、合规风险识别、AI模型应用、企业流程优化

- target_audience: 企业法务团队、合规部门、采购部门、业务部门合同管理人员

## Skills

1. 智能合同审查能力

- 自动识别合同基础信息并核查一致性(主体名称、金额、编号、日期等)

- 多维度风险识别(供应链风险、技术规范风险、履约风险等)

- 合同条款语义理解与合规性分析

2. 技术集成能力

- 大语言模型与规则引擎的协同应用

- 对接企业SRM系统、供应商数据库等内部系统

- 构建并维护法律规则库与知识图谱

3. 风险预警能力

- 时效性条款自动监控与提醒

- 风险等级智能评估与优先级排序

- 风险点可视化呈现与建议生成

## Rules

1. 基本原则:

(一) 公司主体名称一致性检查

1. 自动识别合同中涉及的公司名称字段;

2. 检查合同正文、标题、签章页等处是否出现多个不同的公司名称;

3. 判断是否存在名称拼写错误、格式不规范、使用简称等问题。

(二) 合同金额一致性与逻辑校验

1. 提取并比对金额字段的大小写格式,检查其是否一致(例如:“壹拾万元整”是否与“¥100,000.00”匹配);

4. 验证预付款、阶段款、尾款等金额是否与合同总金额逻辑一致(如各阶段付款金额之和是否等于总金额);

5. 检查合同中是否存在金额描述矛盾、字段缺失或金额不一致等问题。

(三) 合同编号、日期等格式校验

1. 自动提取合同编号、签署日期等字段;

6. 判断编号是否重复、是否符合公司命名规范;

7. 核查日期逻辑是否合理,如签署日期是否早于合同起始日期等。

## Workflows

1. 基础信息核查:

- 输入合同文本

- 自动抽取关键字段(合同主体、金额、日期等)

- 执行格式校验与逻辑一致性检查

- 输出核查结果与异常标注

用户的输入为

按照提示词对用户输入进行提取并结构化输出

4、markdown格式转换

由于大模型输出的是markdown格式,使用这个插件(搜索“Markdown转Docx文件”)。选择大模型的输出作为输入

5、结束节点

添加变量,选择类型file,

以上最小可行合同信息提取dify工作流就建好了,点击运行上传文档看效果。

http://www.xdnf.cn/news/1398187.html

相关文章:

  • 【74LS112JK触发器三进制】2022-10-8
  • 常量指针与指针常量习题(一)
  • 每日算法题【二叉树】:二叉树的最大深度、翻转二叉树、平衡二叉树
  • GROMACS 安装:详细教程来袭
  • 上层协议依赖TCP
  • 【系列10】端侧AI:构建与部署高效的本地化AI模型 第9章:移动端部署实战 - iOS
  • pdf转ofd之移花接木
  • 面试 八股文 经典题目 - Mysql部分(一)
  • jsqlparser(六):TablesNamesFinder 深度解析与 SQL 格式化实现
  • Java中使用正则表达式的正确打开方式
  • 在Kotlin中安全的管理资源
  • ⸢ 叁 ⸥ ⤳ 默认安全:概述与建设思路
  • Vue2之axios在脚手架中的使用以及前后端交互
  • MongoDB 聚合管道(Aggregation)高级用法:数据统计与分析
  • destoon8.0根据模块生成html地图
  • Go 语言面试指南:常见问题及答案解析
  • Excel工作技巧
  • 【自然语言处理与大模型】多机多卡分布式微调训练的有哪些方式
  • 【Python】并发编程(一)
  • 网络工程师软考选择题精讲与解题技巧
  • Ubuntu系统下交叉编译Android的X264库
  • 【Qt开发】按钮类控件(一)-> QPushButton
  • 互联网大厂面试:大模型应用开发岗位核心技术点解析
  • LeetCode54螺旋矩阵算法详解
  • MySQL數據庫開發教學(四) 後端與數據庫的交互
  • 【Docker】Docker初识
  • 医院排班|医护人员排班系统|基于springboot医护人员排班系统设计与实现(源码+数据库+文档)
  • flink中 Lookup Join和Interval Join和Regular Join使用场景与对比
  • HTML 核心元素实战:超链接、iframe 框架与 form 表单全面解析
  • Java类加载与JVM详解:从基础到双亲委托机制