当前位置: 首页 > news >正文

Python-57:Base32编码和解码问题

问题描述

你需要实现一个 Base32 的编码和解码函数。

相比于 Base32,你可能更熟悉 Base64,Base64 是非常常见的用字符串形式表示二进制数据的方式,在邮件附件、Web 中的图片中都有广泛的应用。

Base32 是 Base64 的变种,与 Base64 不同的地方在于 Base64 以 6 bit 为一组作为索引,而 Base32 以 5 bit 为一组作为索引,每一组用一个 ASCII 字符表示。Base 64 总共需要 64 个字符表示,而 Base32 则只需要 32 个字符表示。

Base32 的编码流程如下:

  • 对二进制数据进行预处理:如果二进制数据的 bit 数目不是 5 的倍数的话,在末尾补 0 直至为 5 的倍数。
  • 以 5 bit 为一组进行分组。
  • 将每一组的 5 bit 二进制转换为索引(0 - 31)。
  • 在索引 - 字符转换表中查询索引对应的字符。
  • 根据原始二进制数据的 bit 数目除以 40 后的余数,确定末尾需要补 + 的数目。
  • 如果原始二进制数据 bit 数目除以 40 后的余数是 0 的话,不需要补 +
  • 如果余数是 8,补 6 个 +
  • 如果余数是 16,补 4 个 +
  • 如果余数是 24,补 3 个 +
  • 如果余数是 32,补 1 个 +

Base32 的索引 - 字符转换表如下:

索引:0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31

字符:9 8 7 6 5 4 3 2 1 0 m n b v c x z a s d f g h j k l p o i u y t

你需要对字符串rawStr进行编码,并对encodedStr进行解码。

代码

STRING_LIST = '9876543210mnbvcxzasdfghjklpoiuyt'

CHAR_MAP = {char: i for i, char in enumerate(STRING_LIST)}

PAD = '+'

PAD_COUNT_MAP = {40: 0, 8: 6, 16: 4, 24: 3, 32: 1}


 

def encode(str_input: str) -> str:

    binary_array = []

    for char in str_input:

        binary = bin(ord(char))[2:]

        binary_array.append(binary.zfill((len(binary) + 7) // 8 * 8))

    binary_string = ''.join(binary_array)

    groups = []

    fragments = []

    if len(binary_string) <= 40:

        groups.append(binary_string)

    else:

        segments = -(-len(binary_string) // 40)  # Ceiling division

        for i in range(segments):

            groups.append(binary_string[40 * i:40 * (i + 1)])

    pad_count = PAD_COUNT_MAP[len(groups[-1])]

    groups[-1] = groups[-1].ljust(40, '0')

    for index, s in enumerate(groups):

        group = []

        border = 8 - pad_count if index == len(groups) - 1 else 8

        for i in range(border):

            sequence = s[5 * i:5 * (i + 1)]

            idx = int(sequence, 2)

            group.append(STRING_LIST[idx])

        fragments.append(''.join(group))

    fragments.append(PAD * pad_count)

    return ''.join(fragments)


 

def decode(data: str) -> str:

    char_array = list(data)

    unit8_array = []

    carry = ''

    for char in char_array:

        if char == PAD:

            carry = ''

            continue

        index = CHAR_MAP[char]

        index_in_binary = carry + bin(index)[2:].zfill(5)

        if len(index_in_binary) <= 8:

            carry = index_in_binary

        else:

            unit8_array.append(int(index_in_binary[:8], 2))

            carry = index_in_binary[8:]

    return ''.join(chr(byte) for byte in unit8_array)


 

def solution(rawStr: str, encodedStr: str) -> str:

    return f"{encode(rawStr)}:{decode(encodedStr)}"

if __name__ == "__main__":

    #  You can add more test cases here

    print(solution("foo", "b0zj5+++") == "bljhy+++:bar" )

    print(solution("The encoding process", "bljhy+++b0zj5+++") == "maf3m164vlahyl60vlds9i6svuahmiod:foobar" )

    print(solution("Base32 encoding and decoding", "bvchz+++v4j21+++cals9+++") == "10zj3l0d31z3mod6vus3sod258zhil89bash3oo5v4j3c+++:c]hintts " )

http://www.xdnf.cn/news/243919.html

相关文章:

  • Git 基本操作(一)
  • DeepSeek 赋能自然语言处理:从理论到实践的全方位解析
  • GESP2024年6月认证C++八级( 第二部分判断题(1-5))
  • 【2025最新】为什么用ElasticSearch?和传统数据库MySQL与什么区别?
  • 驱动开发系列55 - Linux Graphics QXL显卡驱动代码分析(二)显存管理
  • C++11新特性_自动类型推导
  • (34)VTK C++开发示例 ---将图片映射到平面
  • PostgreSQL数据库操作SQL
  • 2025年- H17-Lc125-73.矩阵置零(矩阵)---java版
  • 坚鹏:工行《DEEPSEEK赋能银行智能办公及数字化营销服务》培训
  • [蓝桥杯 2023 国 Python B] 划分 Java
  • 如何快速定位网络中哪台主机发起ARP攻击
  • 范式演进:从ETL到ELT及未来展望
  • 如何提升个人的稳定性?
  • 学习 Django 之前
  • 数据结构——树(中篇)
  • 论文笔记——QWen2.5 VL
  • 基于大模型预测的输尿管癌诊疗全流程研究报告
  • PDF24 Tools:涵盖20+种PDF工具,简单高效PDF工具箱,支持一键编辑/转换/合并
  • Selenium:模拟真实用户的爬虫
  • 【Python Web开发】04-Cookie和Session
  • 彩带飘落效果
  • 大学之大:香港理工大学2025.5.1
  • 返回类型后置 和 auto推导返回值类型
  • Vue 3 中通过 this. 调用 setup 暴露的函数
  • 使用CubeMX新建DMA工程——存储器到外设模式
  • 21 课时精通生成式 AI:微软官方入门指南详解
  • 人工智能发展对未来IT从业岗位的展望
  • Java大厂硬核面试:Flink流处理容错、Pomelo JVM调优、MyBatis二级缓存穿透防护与Kubernetes服务网格实战解析
  • Rust多线程性能优化:打破Arc+锁的瓶颈,效率提升10倍