当前位置: 首页 > backend >正文

Python中使用pandas

使用Pandas进行数据处理和分析

Pandas是Python中最流行的数据处理和分析库之一。下面我将介绍Pandas的基本使用方法。

安装Pandas

pip install pandas

基本数据结构

1. Series - 一维数组

import pandas as pd# 创建Series
s = pd.Series([1, 3, 5, 7, 9])
print(s)

2. DataFrame - 二维表格

# 创建DataFrame
data = {'Name': ['Alice', 'Bob', 'Charlie'],'Age': [25, 30, 35],'City': ['New York', 'London', 'Paris']
}
df = pd.DataFrame(data)
print(df)

数据读取与写入

读取CSV文件

df = pd.read_csv('data.csv')

写入CSV文件

df.to_csv('output.csv', index=False)

读取Excel文件

df = pd.read_excel('data.xlsx', sheet_name='Sheet1')

写入Excel文件

df.to_excel('output.xlsx', sheet_name='Sheet1', index=False)

数据查看与选择

查看数据

df.head()      # 查看前5行
df.tail(3)     # 查看后3行
df.info()      # 查看数据信息
df.describe()  # 统计摘要

选择数据

# 选择列
df['Name']       # 选择单列
df[['Name', 'Age']]  # 选择多列# 选择行
df.iloc[0]       # 按位置选择第一行
df.loc[0]        # 按索引选择
df[df['Age'] > 30]  # 条件选择

数据操作

添加/删除列

# 添加列
df['Salary'] = [50000, 60000, 70000]# 删除列
df = df.drop('City', axis=1)

排序

df.sort_values('Age', ascending=False)

分组聚合

df.groupby('City')['Age'].mean()

处理缺失值

df.dropna()      # 删除缺失值
df.fillna(0)     # 填充缺失值

数据合并

# 连接两个DataFrame
df1 = pd.DataFrame({'A': ['A0', 'A1'], 'B': ['B0', 'B1']})
df2 = pd.DataFrame({'A': ['A2', 'A3'], 'B': ['B2', 'B3']})
result = pd.concat([df1, df2])

时间序列处理

# 创建时间序列
dates = pd.date_range('20230101', periods=6)
df = pd.DataFrame({'Date': dates, 'Value': [1, 2, 3, 4, 5, 6]})# 设置日期为索引
df.set_index('Date', inplace=True)# 按时间筛选
df['2023-01-01':'2023-01-03']

这只是Pandas功能的冰山一角。Pandas还提供了许多高级功能,如数据透视表、窗口函数、数据可视化集成等。

http://www.xdnf.cn/news/10627.html

相关文章:

  • C++ list代码练习、set基础概念、set对象创建、set大小操作
  • SQL 窗口函数深度解析:ROW_NUMBER 实战指南
  • volatile,synchronized,原子操作实现原理,缓存一致性协议
  • LabVIEW准分子激光器智能控制系统
  • 35.x64汇编写法(二)
  • Elasticsearch 读写流程深度解析
  • JAVA中的注解和泛型
  • 用 Whisper 打破沉默:AI 语音技术如何重塑无障碍沟通方式?
  • Mybatis框架各配置文件主要内容详解(二)
  • 神经网络与深度学习(第二章)
  • 数字化转型全场景安全解析:从产品到管理的防线构建与实施要点
  • 由浅入深一文详解同余原理
  • 【Android】MT6835 + MT6631 WiFi进入Meta模式出现WiFi_HQA_OpenAdapter failed
  • Higress项目解析(二):Proxy-Wasm Go SDK
  • 车载诊断架构 --- DTC消抖参数(Trip Counter DTCConfirmLimit )
  • 12.1 GUI 事件处理
  • nssctf第二题[SWPUCTF 2021 新生赛]简简单单的逻辑
  • BiliNote部署实践
  • CRC 原理概述
  • NodeJS全栈WEB3面试题——P5全栈集成与 DApp 构建
  • 04powerbi-度量值-筛选引擎CALCULATE()
  • HTTP、WebSocket、SSE 对比
  • hadoop伪分布式配置(单机)
  • 迈向分布式智能:解析MCP到A2A的通信范式迁移
  • 大数据学习(127)-hive日期函数
  • ACTF2025-web-eznote-wp
  • 详解一下RabbitMQ中的channel.Publish
  • 端到端的导航技术NeuPAN论文讲解
  • 从0开始学习R语言--Day15--非参数检验
  • Pytorch知识点2