当前位置：首页 > ops >正文

[Python] struct.unpack() 用法详解

ops 2025/7/7 0:07:14

`struct.unpack()`用法详解

文章目录

`struct.unpack()`用法详解
- - 一、函数语法
  - 二、格式字符串详解
  - 三、使用示例
  - - 示例 1：解析整数和浮点数
    - 示例 2：解析字符串
    - 示例 3：解析混合类型
    - 示例 4：跳过填充字节
    - 示例 5：解析数组
  - 四、关键注意事项
  - 五、常见错误

struct.unpack() 是 Python 中用于将二进制数据（字节序列）解析为 Python 数据类型的函数，通常与 struct.pack() 配对使用。它根据指定的格式字符串（format string）解析字节流，并返回一个包含解析结果的元组。

一、函数语法

struct.unpack(format, buffer)

format：格式字符串，定义数据的解析规则（字节顺序、数据类型、数量等）。
buffer：包含二进制数据的缓冲区（如 bytes、bytearray 或支持缓冲协议的对象）。

返回值：包含解析后数据的元组。

二、格式字符串详解

格式字符串由两部分组成：

字节顺序/对齐字符（可选）：

字符含义大小端
@ 本地顺序（默认）系统依赖
= 本地标准大小系统依赖
< 小端（Little-Endian）低位在前
> 大端（Big-Endian）高位在前
! 网络顺序（大端） RFC 标准

字符	含义	大小端
`@`	本地顺序（默认）	系统依赖
`=`	本地标准大小	系统依赖
`<`	小端（Little-Endian）	低位在前
`>`	大端（Big-Endian）	高位在前
`!`	网络顺序（大端）	RFC 标准

数据类型字符（必选）：

字符	C 类型	Python 类型	字节数
`x`	填充字节	跳过字节	1
`c`	`char`	`bytes` (长度1)	1
`b`	`signed char`	`int`	1
`B`	`unsigned char`	`int`	1
`?`	`_Bool`	`bool`	1
`h`	`short`	`int`	2
`H`	`unsigned short`	`int`	2
`i`	`int`	`int`	4
`I`	`unsigned int`	`int`	4
`l`	`long`	`int`	4
`L`	`unsigned long`	`int`	4
`q`	`long long`	`int`	8
`Q`	`unsigned long long`	`int`	8
`f`	`float`	`float`	4
`d`	`double`	`float`	8
`s`	`char[]`	`bytes`	长度见下文
`p`	Pascal 字符串	`bytes`	1+长度
`P`	`void*`	`int`	系统依赖

特殊用法：

s：需指定长度，如 10s 表示解析 10 字节的字符串。
数字前缀：3I 表示连续解析 3 个无符号整数。

三、使用示例

示例 1：解析整数和浮点数

import struct# 二进制数据：小端顺序 (<) + int (i) + float (f)
buffer = b'\x01\x00\x00\x00\xcd\xcc\x8c@'
data = struct.unpack('<if', buffer)  # 解析1个int和1个floatprint(data)  # 输出: (1, 7.000000476837158)

示例 2：解析字符串

# 数据：大端 (>) + 4字节字符串 (4s)
buffer = b'ABCD'
data = struct.unpack('>4s', buffer)print(data)  # 输出: (b'ABCD',)

示例 3：解析混合类型

# 数据：小端 (<) + short (h) + 3字节字符串 (3s) + float (f)
buffer = b'\x01\x00XYZ\x00\x00\x80?'
data = struct.unpack('<h3sf', buffer)print(data)  # 输出: (1, b'XYZ', 1.0)

示例 4：跳过填充字节

# 格式: 小端 (<) + char (c) + 填充1字节 (x) + int (i)
buffer = b'A\x00\x02\x00\x00\x00'
data = struct.unpack('<cx i', buffer)print(data)  # 输出: (b'A', 2)

示例 5：解析数组

# 解析3个连续的 unsigned short (H)
buffer = b'\x01\x00\x02\x00\x03\x00'
data = struct.unpack('<3H', buffer)print(data)  # 输出: (1, 2, 3)

四、关键注意事项

缓冲区长度必须匹配
使用 struct.calcsize(format) 验证格式字符串所需的字节数：

fmt = '<2i f'
buffer = b'\x00' * struct.calcsize(fmt)  # 创建匹配长度的缓冲区

字节顺序至关重要
大端/小端错误会导致解析数值异常：

# 错误示例：大端数据用小端解析
buffer = b'\x00\x00\x00\x01'  # 大端表示的整数 1
struct.unpack('<I', buffer)   # 错误！解析为 16777216 (0x01000000)

字符串处理
s 类型返回 bytes 对象，需用 .decode() 转为字符串：

data = struct.unpack('5s', b'Hello')[0]
print(data.decode('utf-8'))  # 输出: 'Hello'

内存对齐问题
默认格式 @ 会按本地对齐方式插入填充字节。使用 = 或标准顺序（</>）避免对齐。

五、常见错误

struct.error: unpack requires a buffer of X bytes
缓冲区长度与格式字符串不匹配。
解析指针类型 (P)
结果依赖平台（32/64位），通常应避免使用。

通过合理设计格式字符串，struct.unpack() 可高效处理二进制协议（如网络数据、文件格式）。

研究学习不易，点赞易。
工作生活不易，收藏易，点收藏不迷茫：）

查看全文

http://www.xdnf.cn/news/10813.html

在 Linux 上安装 Nmap 工具

CSRF攻击与防御

现代密码学介绍

前端开发处理‘流式数据’与‘非流式数据’，在接收完整与非完整性数据时应该如何渲染和使用

【产品研究】安克创新公司产品研究

推荐算法八股

STM32外部中断（EXTI）以及旋转编码器的简介

【深度学习-Day 22】框架入门：告别数据瓶颈 - 掌握PyTorch Dataset、DataLoader与TensorFlow tf.data实战

MongoTemplate常用api学习

[手写系列]从0到1开发并上线Edge浏览器插件

AJ-Report

深拷贝与浅拷贝的区别？如何手写实现一个深拷贝？

英语写作中“不少于（小于）”no less than替代no fewer than的用法

【文献精读】Explaining grokking through circuit efficiency

virtualbox安装扩展工具以支持共享文件夹

Foundation Models for Generalist Geospatial Artificial Intelligence论文阅读

RTOS：初始化新任务（含源码复杂点解读）

MyBatis相关面试题

dvwa7——SQL Injection

CentOS 7镜像源替换

豆包的图片生成功能基于其底层AI模型，结合了多模态大模型和图像生成技术，其核心逻辑主要包括以下几个部分：

mac下通过anaconda安装Python

你的台式机PCIe插槽到底是几条lane

电脑硬盘分几个区好

50天50个小项目 (Vue3 + Tailwindcss V4) ✨ | Dad Jokes（冷笑话卡片）

VueScan：全能扫描，高清输出

《Linux C编程实战》笔记：多路复用

vue3：Table组件动态的字段(列)权限、显示隐藏和左侧固定

Oracle中的循环——FOR循环、WHILE循环和LOOP循环

免费批量文件重命名软件

struct.unpack()用法详解