Python操作Excel文件全攻略:xls/xlsx处理从入门到精通
引言:为何选择Python处理Excel?
在数据驱动的时代,Excel文件(.xls/.xlsx)仍是职场与科研中不可或缺的数据载体。Python凭借其丰富的生态库,能够高效完成Excel文件的读写、修改及自动化处理。本文将带你系统掌握Python操作Excel的核心技能,从基础工具选择到高级技巧,助你成为数据处理高手!
一、工具选型:三大核心库对比
1. Pandas:数据分析首选
- 适用场景:快速读写、数据清洗、统计分析。
- 优势:
- 一行代码读取Excel:
df = pd.read_excel('file.xlsx')
- 支持筛选、分组、合并等复杂操作。
- 输出结果可直接保存为Excel:
df.to_excel('output.xlsx')
- 一行代码读取Excel:
- 注意:需安装依赖库:
pip install pandas openpyxl # 推荐引擎组合 pip install xlrd==1.2.0 # 仅限读取旧版.xls
2. Openpyxl:精细操作专家
- 适用场景:修改现有文件、处理公式/图表、设置单元格格式。
- 核心功能:
from openpyxl import load_workbook wb = load_workbook('data.xlsx') ws = wb['Sheet1'] ws['A1'] = '新标题' # 修改单元格 ws.append(['Tom', 25]) # 追加行数据 wb.save('modified.xlsx') # 保存修改
- 进阶技巧:
- 批量设置样式:通过
Font
、PatternFill
等类定义格式。 - 插入行列:
ws.insert_rows(2)
在第2行前插入空行。
- 批量设置样式:通过
3. Xlrd/Xlwt:旧版.xls专属方案
- 限制说明:
- Xlrd 2.0+ 移除.xlsx支持,需固定版本:
pip install xlrd
- Xlrd 2.0+ 移除.xlsx支持,需固定版本: