当前位置: 首页 > news >正文

自训练NL-SQL模型

使用T5小模型在笔记本上训练 nature language to SQL/自然语言 转SQL
实测通过。

本文介绍了如何在笔记本上使用T5小模型训练自然语言转SQL的任务。主要内容包括:1) 创建Python 3.9环境并安装必要的依赖包;2) 通过Hugging Face镜像下载wikisql数据集和T5-small模型;3) 实现数据预处理函数,将自然语言问题转换为SQL查询语句;4) 优化训练过程,包括截断条件和批量处理以提高内存效率。实验表明,该方法在有限计算资源下可行,适合个人开发者和小规模项目尝试。

##############################################

创建环境 建议用python3.9

##############################################

#list all conda environment
conda env list

#deactive 现有环境
conda deactivate
conda remove --name py312_test --all

#创建一个新环境
conda create -n py39_test python=3.9
conda activate py39_test

#requirment.txt 见文章最下方

##############################################

开始安装

##############################################
#pip
pip install torch transformers pandas datasets

#curl
curl -I https://hf-mirror.com/datasets/Salesforce/wikisql

先尝试从wiki下载SQL set

import os
os.environ[“HF_ENDPOINT”] = “https://hf-mirror.com”

from datasets import load_dataset

指定版本(如 “refs/convert/parquet” 是官方维护的稳定分支)

dataset = load_dataset(
“Salesforce/wikisql”,
trust_remote_code=True,
revision=“refs/convert/parquet”
) # dataset 保存在 C:\Users\ASUS.cache\huggingface\datasets
print(dataset[“train”][0]) # 查看数据结构

install torch

pip uninstall numpy -y
pip install numpy1.26.0 -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install torch
2.1.0 --extra-index-url https://download.pytorch.org/whl/cpu -i https://pypi.tuna.tsinghua.edu.cn/simple

import numpy as np
print(f"NumPy 版本: {np.version}“) # 应输出 1.26.0
import torch
print(f"PyTorch 版本: {torch.version}”) # 输出 2.1.0+cpu
print(f"是否为 CPU 版本: {not torch.cuda.is_available()}") # 输出 True(无 GPU 时)

#install sentencepiece
pip install sentence

http://www.xdnf.cn/news/636805.html

相关文章:

  • IS-IS报文
  • [特殊字符] UI-Trans:字节跳动发布的多模态 UI 转换大模型工具,重塑界面智能化未来
  • 以前端的角度理解 Kubernetes(K8s)
  • C++复习核心精华
  • Docker镜像与容器深度解析:从概念到实践的全面对比
  • PTA刷题笔记(难度预警!!!有详解)
  • 区块链可投会议CCF C--APSEC 2025 截止7.13 附录用率
  • leetcode 131. Palindrome Partitioning
  • Oracle 19c TFA工具的安装与使用详解
  • 【辰辉创聚生物】FGF信号通路相关蛋白:解码生命调控的关键枢纽
  • 第三十一天打卡
  • 医学写作供应商管理全流程优化
  • Github 今日热点 完全本地化的自主AI助手,无需API或云端依赖
  • 【JSON 】全面掌握JSON的相关知识
  • 上海医日健集团物联网专利技术领跑智慧药房赛道
  • C++编程单例模式详细解释---模拟一个网络配置管理器,负责管理和分发网络连接参数
  • 【OCCT+ImGUI系列】010-BRepMesh-网格化IncrementalMesh
  • 文本特征提取
  • GO 语言进阶之 进程 OS与 编码,数据格式转换
  • 【Leetcode 每日一题】2131. 连接两字母单词得到的最长回文串
  • 39.组合总和
  • leetcode560-和为k的子数组
  • arxml文件
  • JVM 的类加载机制
  • 进程管理(第二、三、四章)
  • 【车用永磁同步电机随机开关频率控制策略:高频谐波抑制的工程实践】
  • Python入门手册:条件判断
  • 云原生安全之网络IP协议:从基础到实践指南
  • mysql都有哪些锁?
  • 历年北京理工大学保研上机真题