当前位置: 首页 > ds >正文

深度学习中主要库的使用:(一)pandas,读取 excel 文件,支持主流的 .xlsx/.xls 格式

pandas

其中的 pd.read_excel() 函数可以读取 excel 文件,支持主流的 .xlsx/.xls 格式。

想要读取 .xlsx 文件就需要再安装 openpyxl 库,想要读取 .xls 文件就需要再安装 xlrd 库。

import pandas as pdfile_path = 'test1.xlsx'
data = pd.read_excel(path, engine='openpyxl')
print(data)

读取的结果是一个 DataFrame 对象,DataFramepandas 中用于处理表格数据的主要数据结构,它具有丰富的属性和方法,具体如下:

1)常用属性

  1. data.shape

    返回一个元组,表示 DataFrame 的维度(行数和列数)。

  2. data.columns

    返回一个 Index 对象,包含 DataFrame 的列标签。

  3. data.index

    返回一个 Index 对象,包含 DataFrame 的行标签。

  4. data.dtypes

    返回一个 Series,显示每列的数据类型。

  5. data.size

    返回 DataFrame 中元素的总数(行数乘以列数)。

  6. data.ndim

    返回 DataFrame 的维度数(通常是 2)。

  7. data.empty

    返回一个布尔值,指示 DataFrame 是否为空。

2)常用方法

  1. data.head(n)

    返回前 n 行数据(默认是 5 行)。

  2. data.tail(n)

    返回后 n 行数据(默认是 5 行)。

  3. data.describe()

    返回数值列的统计摘要(如计数、均值、标准差、最小值、四分位数、最大值)。

  4. data.info()

    打印 DataFrame 的简要摘要,包括行数、列数、列类型和非空值计数。

  5. data.isnull()

    返回一个布尔型 DataFrame,指示每个元素是否为 NaN

  6. data.dropna()

    删除包含 NaN 的行。

  7. data.fillna(value)

    用指定的值填充 NaN

  8. data.groupby(column)

    按指定列对 DataFrame 进行分组。

  9. data.pivot_table(values, index, columns)

    创建一个数据透视表。

  10. data.apply(func)

    沿 DataFrame 的轴应用函数。

3)示例

import pandas as pdfile_path = 'test1.xlsx'
data = pd.read_excel(file_path, engine='openpyxl')# 打印形状
print("Shape:", data.shape)
print("----------------------------")
# 打印列标签
print("Columns:", data.columns)
print("----------------------------")
# 打印前两行
print("Head:\n", data.head(2))# -------------------------------------------------------------------------------------------------------------------------
# 输出为:
Shape: (159, 6)
Columns: Index(['frame', 'point number', 'x', 'y', 'z', 'intensity'], dtype='object')
Head:frame  point number         x         y         z  intensity
0      0             0  1.507812 -0.339844  0.164062  22.174839
1      0             1  1.621094 -0.537109 -0.193359  27.379873

http://www.xdnf.cn/news/17391.html

相关文章:

  • 【Zephyr】02_从零教你开发芯片级ADC驱动(HAL层篇)
  • IIS7.5下的https无法绑定主机头,显示灰色如何处理?
  • 基于 MATLAB 的 QPSK 调制、解调、通过高斯信道的误码率计算,并绘制误码率图和眼图、星座图
  • Numpy科学计算与数据分析:Numpy数学函数入门与实践
  • web前端结合Microsoft Office Online 在线预览,vue实现(PPT、Word、Excel、PDF等)
  • nlp-句法分析
  • 从配置到远程访问:如何用群晖NAS FTP+ Cpolar搭建稳定文件传输通道
  • 云平台运维工具 ——AWS 原生工具
  • 利用DeepSeek用两种方法编写go语言zstd实用程序
  • 软件加密工具-DSProtector使用说明
  • 关键字 - 第二讲
  • SpringBoot的优缺点
  • DNS查询过程?CDN是什么,有什么作用?
  • 嵌入式系统学习Day14(C语言中指针的拓展)
  • 音乐创作新潮流!豆包 + 蘑兔 A
  • macOS 彻底卸载 Python 的完整指南
  • RWA项目实战指南:流程设计到技术落地的完整路径
  • 硬件学习笔记--74 电泳与电镀的对比介绍
  • 「iOS」————持久化
  • 安卓Handler和Looper的学习记录
  • 13-netty基础-手写rpc-消费方生成代理-05
  • 30-Hive SQL-DML-Load加载数据
  • 上位机知识篇---蜂窝通信
  • 基于MATLAB实现支持向量机(SVM)分类
  • 目标检测数据集 - 高架视角道路车辆检测数据集下载「包含VOC、COCO、YOLO三种格式」
  • 医疗人效管理新标杆:盖雅工场如何赋能健康服务企业提质增效
  • 从“炼金术”到“工程学”:深度学习十年范式变迁与未来十年路线图
  • 板块三章节4——iSCSI 服务器(待更新)
  • vscode中创建python虚拟环境的方法
  • Rust爬虫与代理池技术解析