当前位置: 首页 > news >正文

excel大表导入数据库

前文介绍了数据量较小的excel表导入数据库的方法,在数据量较大的情况下就不太适合了,一个是因为mysql命令的执行串长度有限制,二是node-xlsx这个模块加载excel文件是整个文件全部加载到内存,在excel文件较大和可用内存受限的场景就不适合了。我们可以考虑流式读取excel数据,分批次导入数据到数据库。以下是以每批500条记录的示例:

const XLSX = require('xlsx-extract').XLSX;const mysql = require("mysql2/promise"); const localpool= mysql.createPool({host:"127.0.0.1",port:3306,user:"demouser",password:"XXXXXX",database:"demodb",jsonStrings: true,waitForConnections: true,connectionLimit: 4,enableKeepAlive: true, keepAliveInitialDelay: 5000,});const batchsize=500;let count=0;
let frist=true;
let batarr=[];
let fieldnames="";
let fieldcounts=0;new XLSX().extract(process.argv.slice(2)[0], {sheet_id:1}).on('row', function (row) {if (frist) { frist=false; fieldcounts=row.length; fieldnames=row.join(); }else {for (let j=row.length;j<fieldcounts;j++) row.push("");batarr.push(row);if (batarr.length==batchsize) { let addrecs = "insert into demodb.demotable("+fieldnames+") values ?"; localpool.query(addrecs,[batarr]).then(([results])=>{ console.log(results); batarr=[];}).catch(err=>{console.log(err);});}}}).on('error', function (err) {console.error('error', err);}).on('end', function (err) {if (batarr.length>0) { let addrecs = "insert into demodb.demotable("+fieldnames+") values ?"; localpool.query(addrecs,[batarr]).then(([results])=>{ console.log(results); }).catch(err=>{console.log(err);});}});

xlsx-extract这个模块读取行数据时,中间的空白单元会解析成undefined,但是最后一个有值的单元后就截止了,为了和数据库里的字段数保持一致,要将剩余的字段赋值下,示例中赋值为空字符串。
这样可以导入excel大文件进数据库。
其实这样导入数据效率比直接将csv或json文件直接导入mysql效率要低很多,不过有时候转的csv文件或者json文件导入mysql会出现报错情况,需要检查字段值,数据量较大时检查会很麻烦,所以这样导入数据也是不得已的办法。

http://www.xdnf.cn/news/375607.html

相关文章:

  • comfyu BiRefNet-General模型下载及存放地方
  • JS正则表达式介绍(JavaScript正则表达式)
  • 《Python星球日记》 第51天:神经网络基础
  • 边缘计算从专家到小白
  • iperf3的介绍与舒勇
  • Kubernetes 生产实战(十五):生产环境敏感信息纳入Secret管理指南
  • MLOps 详解
  • 汇编语言的温度魔法:单总线温度采集与显示的奇幻之旅
  • Java动态代理超详细解析:三步+内存图(堆栈分析)
  • 批量统计PDF页数,统计图像属性
  • dify插件接入fastmcp示例
  • Flink 实时数据一致性与 Exactly-Once 语义保障实战
  • Linux架构篇、第四章_ELK与EFK-7.17.9的日志管理
  • 深入解析Vue3中ref与reactive的区别及源码实现
  • PPT图表怎么制作?说5款自己使用过的PPT图表制作工具
  • 《Python星球日记》 第55天:迁移学习与预训练模型
  • Linux系统管理与编程16:PXE自动化安装部署centos7.9操作系统
  • 计算机设计大赛山东省赛区软件开发赛道线上答辩复盘
  • 基于STM32的甲醛检测
  • 金丝猴食品:智能中枢AI-COP构建全链路数智化运营体系
  • 如何快速分享服务器上的文件
  • SemanticSplitterNodeParser 和 Sentence-BERT 的区别和联系是什么
  • Spring Security 深度解析:打造坚不可摧的用户认证与授权系统
  • 双同步坐标锁相环DDSRF-PLL原理说明
  • 基于 Q-learning 的城市场景无人机三维路径规划算法研究,可以自定义地图,提供完整MATLAB代码
  • Pytorch应用 小记 第一回:基于ResNet网络的图像定位
  • LSP里氏替换原则
  • tmux + ttyd 原理
  • FHE 之 面向小白的引导(Bootstrapping)
  • ISP(Image Signal Processor)处理流程及不同域划分