当前位置：首页 > ops >正文

Python 生成器：从基础到高级

ops 2025/7/19 19:34:08

在 Python 中，生成器（Generator）是一种特殊的迭代器，它通过 yield 关键字实现惰性计算。生成器允许我们逐个生成值，而不需要一次性将所有值存储在内存中，这使得生成器在处理大数据集时更加高效。本文将详细介绍生成器的基本概念、实现方法、使用场景以及一些高级特性。

1. 生成器的基本概念

1.1 什么是生成器？

生成器是一种特殊的迭代器，它通过 yield 关键字返回值。生成器函数（Generator Function）与普通函数类似，但每次调用时，它会从上次停止的地方继续执行，而不是从头开始。生成器的主要特点是：

惰性计算：生成器不会一次性计算所有值，而是按需生成值。
节省内存：生成器逐个生成值，不需要将所有值存储在内存中。

1.2 生成器的用途

生成器的主要用途是处理大数据集或无限序列。它特别适合以下场景：

大数据集：逐个处理数据，避免一次性加载整个数据集。
无限序列：生成器可以生成无限序列，例如斐波那契数列。
管道处理：生成器可以用于构建数据处理管道，逐个处理数据。

2. 创建生成器

2.1 使用 `yield` 关键字

生成器函数通过 yield 关键字返回值。每次调用生成器时，它会从上次停止的地方继续执行。

示例代码

def my_generator():yield 1yield 2yield 3# 创建生成器
gen = my_generator()# 使用 next() 函数访问生成器中的值
print(next(gen))  # 输出：1
print(next(gen))  # 输出：2
print(next(gen))  # 输出：3# 如果继续调用 next()，将抛出 StopIteration 异常
# print(next(gen))  # 抛出 StopIteration 异常

2.2 使用生成器表达式

生成器表达式（Generator Expression）是一种更简洁的方式，类似于列表推导式，但使用圆括号 () 而不是方括号 []。

示例代码

# 使用生成器表达式计算前10个平方数
squares_gen = (x**2 for x in range(10))# 使用 for 循环遍历生成器
for square in squares_gen:print(square)

3. 生成器的高级用法

3.1 无限生成器

生成器可以用于生成无限序列。例如，生成斐波那契数列。

示例代码

def fibonacci():a, b = 0, 1while True:yield aa, b = b, a + b# 创建无限生成器
fib_gen = fibonacci()# 打印前10个斐波那契数
for _ in range(10):print(next(fib_gen))

3.2 生成器的管道处理

生成器可以用于构建数据处理管道，逐个处理数据。这在处理大数据集时非常高效。

示例代码

def read_file(file_name):with open(file_name, 'r') as file:for line in file:yield line.strip()def filter_lines(lines, keyword):for line in lines:if keyword in line:yield linedef process_lines(lines):for line in lines:yield line.upper()# 使用生成器管道处理文件
file_name = 'example.txt'
keyword = 'important'lines = read_file(file_name)
filtered_lines = filter_lines(lines, keyword)
processed_lines = process_lines(filtered_lines)for line in processed_lines:print(line)

3.3 生成器的异常处理

生成器可以通过 throw() 方法抛出异常，通过 close() 方法关闭生成器。

示例代码

def my_generator():try:yield 1yield 2yield 3except ValueError:print("ValueError caught")# 创建生成器
gen = my_generator()print(next(gen))  # 输出：1
print(next(gen))  # 输出：2# 抛出异常
gen.throw(ValueError("An error occurred"))# 关闭生成器
gen.close()

4. 生成器的性能优势

生成器的一个重要优势是它不需要一次性加载整个集合，因此在处理大数据集时更加高效。与传统的列表推导式相比，生成器表达式可以节省大量内存。

示例代码

import sys# 使用列表推导式计算前1000000个平方数
squares_list = [x**2 for x in range(1000000)]# 使用生成器表达式计算前1000000个平方数
squares_gen = (x**2 for x in range(1000000))# 打印内存占用
print(f"Memory usage of list: {sys.getsizeof(squares_list)} bytes")
print(f"Memory usage of generator: {sys.getsizeof(squares_gen)} bytes")

输出结果

Memory usage of list: 8000096 bytes
Memory usage of generator: 112 bytes

从结果可以看出，生成器表达式在处理大数据集时显著节省了内存。

5. 总结

生成器是 Python 中一个非常强大的工具，它通过 yield 关键字实现惰性计算，逐个生成值，而不需要一次性将所有值存储在内存中。生成器特别适合处理大数据集、无限序列和数据处理管道。通过使用生成器，你可以编写更加高效和灵活的代码。

希望这篇教程能帮助你更好地理解和使用 Python 生成器。如果你有任何问题或建议，请随时在评论区留言！

查看全文

http://www.xdnf.cn/news/9715.html

【Ubuntu】Ubuntu网络管理

Vscode 解决 #include ＜＞找不到的问题

x86_64-apple-ios-simulator 错误

政策+技术双轮驱动：MiC建筑如何成为“好房子”建设的破局之道

UE5.5 pixelstreaming插件打包报错

UE5打包项目设置Project Settings（打包widows exe安装包）

《深入解析UART协议及其硬件实现》-- 第三篇：UART ASIC实现优化与低功耗设计

图像数据与显存

WebFuture：后台修改内容链接地址保存提示内容链接地址禁止输入外部url链接

制造业的未来图景：超自动化与劳动力转型的双重革命

数据库中常见的锁机制详解

Java设计模式之迭代器模式详解

Sigma-Aldrich胰蛋白酶细胞解离方案速览

从零开始的云计算生活——第十四天，困难重重，安全管理。

第4讲、Odoo 18 模块系统源码全解与架构深度剖析【modules】

Axure项目实战：驾驶舱（数据一张图）制作教程

【Deepseek 学网络互联】跨节点通信global 和节点内通信CLAN保序

新一代Python管理UV完全使用指南｜附实际体验与效果对比

Ubuntu系统如何部署Crawlab爬虫管理平台（通过docker部署）

STM32 单片机启动过程全解析：从上电到主函数的旅程

数据库 | timescaledb时序表使用注意事项

udp 传输实时性测量

【解决办法】ubuntu重启不起来，输入用户名和密码进不去，又重新返回登录页。

1. 生成器的基本概念

1.1 什么是生成器？

1.2 生成器的用途

2. 创建生成器

2.1 使用 yield 关键字

示例代码

2.2 使用生成器表达式

示例代码

3. 生成器的高级用法

3.1 无限生成器

示例代码

3.2 生成器的管道处理

示例代码

3.3 生成器的异常处理

示例代码

4. 生成器的性能优势

示例代码

5. 总结

相关文章：

2.1 使用 `yield` 关键字