当前位置: 首页 > web >正文

vanna+deepseek+chainlit 实现自然语言转SQL的精度调优

先说目前遇到的问题吧,单表数据SQL 生成准确度是可以的,但是复杂SQL以及多表联查时,生成的SQL就一言难尽了。

目前的解决方案:

一、数据训练后台

创建后台来管理三类训练数据,DDL 、SQL、DOC文档。

使用三个集合,来分别管理这三类数据

添加训练SQL:

二、前端与用户交互,询问是否将本次对话加入到训练库中

前端与用户交互,询问是否将本次对话加入到训练库中,如果确认,则给用户回显当前训练库中相似度最高的前3条SQL供用户预览,然后二次确认是否需要将本次对话加入到训练库中

三、对于复杂SQL 如多表查询

对于复杂SQL 如多表查询,生产SQL,主要是基于训练的SQL生成。

用户提问,然后对于训练库数据召回。

  • ≥99.5%相似度:直接使用训练库中的SQL
  • 80%-99.5%相似度:基于已有SQL让大模型微调
  • <80%相似度:正常生成流程(DDL+SQL+DOC交给大模型生成)

后续我会把源码放出来。。。

http://www.xdnf.cn/news/12521.html

相关文章:

  • 一种全新的非对称加密算法
  • 豪斯多夫距离 (Hausdorff Distance)在机器人轨迹规划中的应用
  • Kubernetes指标实现有效的集群监控和优化
  • 免费批量图片格式转换工具
  • usbutils工具的使用帮助
  • 【时时三省】(C语言基础)局部变量和全局变量
  • CSDN文章下载到本地的完整指南
  • 88.实现查看收藏功能的前端实现
  • 43道Java多线程高频题整理(附答案背诵版)
  • [蓝桥杯]解谜游戏
  • Tongweb配置跳过扫描应用jar的配置指引(by lqw)
  • 大模型如何革新用户价值、内容匹配与ROI预估
  • C语言字符数组初始化的5种方法(附带实例)
  • 鲲鹏麒麟服务器自制Nacos镜像并部署
  • Linux系统:ELF文件的定义与加载以及动静态链接
  • C++——红黑树
  • 三类 Telegram 账号的风控差异分析与使用建议
  • GWO-LSSVM-Adaboost灰狼算法GWO优化最小二乘支持向量机LSSVM分类预测!
  • python fbx sdk
  • 更新雅可比矩阵的非线性部分笔记
  • 和芯 SL6341 (内置FLASH) 国产USB 3.0HUB芯片 替代 GL3510 VL817
  • 区块链技术相关
  • mybatis中判断等于字符串的条件怎么写
  • ingress-nginx 开启 Prometheus 监控 + Grafana 查看指标
  • 《从零掌握MIPI CSI-2: 协议精解与FPGA摄像头开发实战》-- CSI-2 协议详细解析 (一)
  • Python爬虫实战:研究mechanize库相关技术
  • 深入解析JVM工作原理:从字节码到机器指令的全过程
  • 四叉树在空间结构建模中的应用
  • 车载以太网数据流量抓取手段全解析
  • 深度学习环境配置指南:基于Anaconda与PyCharm的全流程操作