当前位置: 首页 > ops >正文

[Python] struct.unpack() 用法详解

struct.unpack()用法详解

文章目录

  • `struct.unpack()`用法详解
      • 一、函数语法
      • 二、格式字符串详解
      • 三、使用示例
        • 示例 1:解析整数和浮点数
        • 示例 2:解析字符串
        • 示例 3:解析混合类型
        • 示例 4:跳过填充字节
        • 示例 5:解析数组
      • 四、关键注意事项
      • 五、常见错误


struct.unpack() 是 Python 中用于将二进制数据(字节序列)解析为 Python 数据类型的函数,通常与 struct.pack() 配对使用。它根据指定的格式字符串(format string)解析字节流,并返回一个包含解析结果的元组。


一、函数语法

struct.unpack(format, buffer)
  • format:格式字符串,定义数据的解析规则(字节顺序、数据类型、数量等)。
  • buffer:包含二进制数据的缓冲区(如 bytesbytearray 或支持缓冲协议的对象)。

返回值:包含解析后数据的元组。


二、格式字符串详解

格式字符串由两部分组成:

  1. 字节顺序/对齐字符(可选):

    字符含义大小端
    @本地顺序(默认)系统依赖
    =本地标准大小系统依赖
    <小端(Little-Endian)低位在前
    >大端(Big-Endian)高位在前
    !网络顺序(大端)RFC 标准
  2. 数据类型字符(必选):

    字符C 类型Python 类型字节数
    x填充字节跳过字节1
    ccharbytes (长度1)1
    bsigned charint1
    Bunsigned charint1
    ?_Boolbool1
    hshortint2
    Hunsigned shortint2
    iintint4
    Iunsigned intint4
    llongint4
    Lunsigned longint4
    qlong longint8
    Qunsigned long longint8
    ffloatfloat4
    ddoublefloat8
    schar[]bytes长度见下文
    pPascal 字符串bytes1+长度
    Pvoid*int系统依赖

    特殊用法

    • s:需指定长度,如 10s 表示解析 10 字节的字符串。
    • 数字前缀:3I 表示连续解析 3 个无符号整数。

三、使用示例

示例 1:解析整数和浮点数
import struct# 二进制数据:小端顺序 (<) + int (i) + float (f)
buffer = b'\x01\x00\x00\x00\xcd\xcc\x8c@'
data = struct.unpack('<if', buffer)  # 解析1个int和1个floatprint(data)  # 输出: (1, 7.000000476837158)
示例 2:解析字符串
# 数据:大端 (>) + 4字节字符串 (4s)
buffer = b'ABCD'
data = struct.unpack('>4s', buffer)print(data)  # 输出: (b'ABCD',)
示例 3:解析混合类型
# 数据:小端 (<) + short (h) + 3字节字符串 (3s) + float (f)
buffer = b'\x01\x00XYZ\x00\x00\x80?'
data = struct.unpack('<h3sf', buffer)print(data)  # 输出: (1, b'XYZ', 1.0)
示例 4:跳过填充字节
# 格式: 小端 (<) + char (c) + 填充1字节 (x) + int (i)
buffer = b'A\x00\x02\x00\x00\x00'
data = struct.unpack('<cx i', buffer)print(data)  # 输出: (b'A', 2)
示例 5:解析数组
# 解析3个连续的 unsigned short (H)
buffer = b'\x01\x00\x02\x00\x03\x00'
data = struct.unpack('<3H', buffer)print(data)  # 输出: (1, 2, 3)

四、关键注意事项

  1. 缓冲区长度必须匹配
    使用 struct.calcsize(format) 验证格式字符串所需的字节数:

    fmt = '<2i f'
    buffer = b'\x00' * struct.calcsize(fmt)  # 创建匹配长度的缓冲区
    
  2. 字节顺序至关重要
    大端/小端错误会导致解析数值异常:

    # 错误示例:大端数据用小端解析
    buffer = b'\x00\x00\x00\x01'  # 大端表示的整数 1
    struct.unpack('<I', buffer)   # 错误!解析为 16777216 (0x01000000)
    
  3. 字符串处理
    s 类型返回 bytes 对象,需用 .decode() 转为字符串:

    data = struct.unpack('5s', b'Hello')[0]
    print(data.decode('utf-8'))  # 输出: 'Hello'
    
  4. 内存对齐问题
    默认格式 @ 会按本地对齐方式插入填充字节。使用 = 或标准顺序(</>)避免对齐。


五、常见错误

  • struct.error: unpack requires a buffer of X bytes
    缓冲区长度与格式字符串不匹配。
  • 解析指针类型 (P)
    结果依赖平台(32/64位),通常应避免使用。

通过合理设计格式字符串,struct.unpack() 可高效处理二进制协议(如网络数据、文件格式)。


研究学习不易,点赞易。
工作生活不易,收藏易,点收藏不迷茫 :)


http://www.xdnf.cn/news/10813.html

相关文章:

  • 在 Linux 上安装 Nmap 工具
  • CSRF攻击与防御
  • 现代密码学介绍
  • 前端开发处理‘流式数据’与‘非流式数据’,在接收完整与非完整性数据时应该如何渲染和使用
  • 【产品研究】安克创新公司产品研究
  • 推荐算法八股
  • STM32外部中断(EXTI)以及旋转编码器的简介
  • 【深度学习-Day 22】框架入门:告别数据瓶颈 - 掌握PyTorch Dataset、DataLoader与TensorFlow tf.data实战
  • MongoTemplate常用api学习
  • [手写系列]从0到1开发并上线Edge浏览器插件
  • AJ-Report
  • 深拷贝与浅拷贝的区别?如何手写实现一个深拷贝?
  • 英语写作中“不少于(小于)”no less than替代no fewer than的用法
  • 【文献精读】Explaining grokking through circuit efficiency
  • virtualbox安装扩展工具以支持共享文件夹
  • Foundation Models for Generalist Geospatial Artificial Intelligence论文阅读
  • RTOS:初始化新任务(含源码复杂点解读)
  • MyBatis相关面试题
  • dvwa7——SQL Injection
  • CentOS 7镜像源替换
  • 豆包的图片生成功能基于其底层AI模型,结合了多模态大模型和图像生成技术,其核心逻辑主要包括以下几个部分:
  • mac下通过anaconda安装Python
  • 你的台式机PCIe插槽到底是几条lane
  • 电脑硬盘分几个区好
  • 50天50个小项目 (Vue3 + Tailwindcss V4) ✨ | Dad Jokes(冷笑话卡片)
  • VueScan:全能扫描,高清输出
  • 《Linux C编程实战》笔记:多路复用
  • vue3:Table组件动态的字段(列)权限、显示隐藏和左侧固定
  • Oracle中的循环——FOR循环、WHILE循环和LOOP循环
  • 免费批量文件重命名软件