当前位置: 首页 > news >正文

如何用python脚本把一个表格有4万多条数据分为两个文件表,每个2万条数据?

环境:

python3.10

Win10专业版

问题描述:

如何用python脚本把一个表格有4万多条数据分为两个文件表,每个2万条数据?

在这里插入图片描述

解决方案:

你想用 Python 脚本把一个包含 4 万多条数据的表格(假设是 CSV 或 Excel 格式)拆分成两个文件,每个文件约 2 万条数据。下面给你一个示例脚本,支持 CSV 和 Excel,方便你根据实际文件格式做调整。


示例代码(以 CSV 为例)

假设输入文件是 input.csv,输出拆分成 output_part1.csvoutput_part2.csv

import csvinput_file = 'input.csv'
output_file_1 = 'output_part1.csv'
output_file_2 = 'output_part2.csv'# 读取所有数据
with open(input_file, newline='', encoding='utf-8') as f_in:reader = csv.reader(f_in)header = next(reader)  # 读取表头rows = list(reader)# 计算拆分点
split_index = 20000# 分割数据
part1 = rows[:split_index]
part2 = rows[split_index:]# 写入第一个文件
with open(output_file_1, 'w', newline='', encoding='utf-8') as f_out1:writer = csv.writer(f_out1)writer.writerow(header)writer.writerows(part1)# 写入第二个文件
with open(output_file_2, 'w', newline='', encoding='utf-8') as f_out2:writer = csv.writer(f_out2)writer.writerow(header)writer.writerows(part2)print(f"拆分完成:{len(part1)} 条数据写入 {output_file_1}{len(part2)} 条写入 {output_file_2}")

如果是 Excel 文件(例如 .xlsx

需要先安装 openpyxl

pip install openpyxl

示例代码:

import openpyxlinput_file = 'input.xlsx'
output_file_1 = 'output_part1.xlsx'
output_file_2 = 'output_part2.xlsx'wb = openpyxl.load_workbook(input_file)
ws = wb.active# 读取所有行数据(包含表头)
rows = list(ws.values)
header = rows[0]
data_rows = rows[1:]split_index = 20000
part1 = data_rows[:split_index]
part2 = data_rows[split_index:]def save_excel(filename, header, data):wb_new = openpyxl.Workbook()ws_new = wb_new.activews_new.append(header)for row in data:ws_new.append(row)wb_new.save(filename)save_excel(output_file_1, header, part1)
save_excel(output_file_2, header, part2)print(f"拆分完成:{len(part1)} 条数据写入 {output_file_1}{len(part2)} 条写入 {output_file_2}")

在这里插入图片描述

使用说明

  1. 修改 input_file 为你的文件名。
  2. 确认文件格式后,选择合适的脚本(CSV 或 Excel)。
  3. 运行脚本即可拆分。

http://www.xdnf.cn/news/204571.html

相关文章:

  • stm32wb55rg (4) 启用usart串口
  • PDM是什么?PDM有什么用?怎么选PDM?2025制造PDM/PLM系统盘点(4000字)
  • 针对信息过载问题的解决方案
  • 【Prometheus-MySQL Exporter安装配置指南,开机自启】
  • uni-app中使用RenderJs 使用原生js
  • 抱佛脚之学SSMSpringMVC数据绑定
  • 微服务学习笔记
  • 时序数据库 TDengine × Perspective:你需要的可视化“加速器”
  • OpenGL ES 3.0 第二章总结:你好,三角形(Hello Triangle)
  • AlDente Pro for Mac电脑 充电限制保护工具 安装教程【简单,轻松上手】
  • 您好,当前系统不允许绑定该店,具体原因您可咨询系统服务商,我们将尽力为您解决
  • DevExpressWinForms-TreeList-设置不可编辑
  • 大数据学习(115)-hive与impala
  • JAVA-使用Apache POI导出数据到Excel,并把每条数据的图片打包成zip附件项
  • 排序算法详解笔记(二)
  • AI大模型:(二)1.4 Qwen2.5-Omni全模态大模型部署
  • 数据结构入门:详解顺序表的实现与操作
  • 前端——CSS1
  • C#里嵌入lua脚本的例子
  • 【3D基础】顶点法线与平面法线在光照与PBR中的区别与影响
  • 基于Spring Boot 3.0、ShardingSphere、PostgreSQL或达梦数据库的分库分表
  • k8s集群环境部署业务系统
  • leetcode 2516. 每种字符至少取 K 个
  • 【网络原理】从零开始深入理解HTTP的报文格式(一)
  • 人工智能数学基础(三):微积分初步
  • 基于tabula对pdf中的excel进行识别并转换成word(三)
  • UE调试相关
  • AI遇见端动态神经网络:Cephalon(联邦学习+多模态编码)认知框架构建
  • 基于SpringAI实现简易聊天对话
  • 学习记录:DAY20