当前位置：首页 > news >正文

Python容器与循环：数据处理的双剑合璧

news 2025/7/4 23:11:04

Python作为一门简洁强大的编程语言，其容器类型和循环结构的完美结合为数据处理提供了极大的便利。本文将带领初学者深入理解Python中的四大容器（列表、元组、字典、集合）以及它们与循环结构的配合使用，助你掌握数据处理的核心技能。

一、Python四大容器概览

Python有四种内置的容器数据类型，它们各具特色，适用于不同的场景：

容器类型	可变性	有序性	元素要求	示例
列表(list)	可变	有序	允许重复	`[1, 2, 3]`
元组(tuple)	不可变	有序	允许重复	`(1, 2, 3)`
字典(dict)	可变	无序	键唯一	`{'a':1, 'b':2}`
集合(set)	可变	无序	元素唯一	`{1, 2, 3}`

二、列表(list)与循环

1. 列表基础

列表是Python中最常用的可变序列，可以存储任意类型的元素：

fruits = ['apple', 'banana', 'orange']  # 创建列表
numbers = list(range(1, 6))            # 使用list()构造函数
mixed = [1, 'text', True, 3.14]        # 混合类型列表

2. 列表与for循环

遍历列表是最基本的操作：

fruits = ['apple', 'banana', 'orange']# 直接遍历元素
for fruit in fruits:print(f"I like {fruit}")# 遍历索引和元素
for index, fruit in enumerate(fruits):print(f"索引 {index} 处的水果是 {fruit}")

3. 列表推导式

列表推导式是循环创建列表的简洁方式：

# 创建平方数列表
squares = [x**2 for x in range(10)]# 带条件的列表推导式
even_squares = [x**2 for x in range(10) if x % 2 == 0]

三、元组(tuple)与循环

1. 元组基础

元组是不可变序列，常用于保护数据不被修改：

dimensions = (1920, 1080)  # 创建元组
point = tuple([3, 4])      # 从列表转换
single = (42,)             # 单元素元组（注意逗号）

2. 元组与循环

元组遍历方式与列表类似：

colors = ('red', 'green', 'blue')# 遍历元素
for color in colors:print(color)# 同时遍历多个元组（解包）
points = [(1, 2), (3, 4), (5, 6)]
for x, y in points:print(f"x坐标: {x}, y坐标: {y}")

四、字典(dict)与循环

1. 字典基础

字典存储键值对，查找效率极高：

student = {'name': 'Alice', 'age': 20, 'major': 'CS'}  # 创建字典
grades = dict(math=90, physics=85, chemistry=88)      # 使用dict()
empty_dict = {}                                       # 空字典

2. 字典与循环

字典有三种主要的遍历方式：

# 遍历键
for key in student:print(key)# 遍历键值对
for key, value in student.items():print(f"{key}: {value}")# 遍历值
for value in student.values():print(value)

3. 字典推导式

# 键值互换
flipped = {value: key for key, value in student.items()}# 创建数字平方字典
square_dict = {x: x**2 for x in range(5)}

五、集合(set)与循环

1. 集合基础

集合用于存储唯一元素，支持数学集合运算：

primes = {2, 3, 5, 7, 11}          # 创建集合
evens = set(range(0, 10, 2))        # 使用set()
empty_set = set()                   # 空集合（不能用{}，这是字典）

2. 集合与循环

集合遍历方式与列表类似：

unique_words = {'hello', 'world', 'python'}for word in unique_words:print(word.upper())

3. 集合运算示例

A = {1, 2, 3, 4}
B = {3, 4, 5, 6}print(A | B)  # 并集: {1, 2, 3, 4, 5, 6}
print(A & B)  # 交集: {3, 4}
print(A - B)  # 差集: {1, 2}

六、容器嵌套与复杂循环

实际应用中，容器常常嵌套使用：

1. 列表嵌套

matrix = [[1, 2, 3],[4, 5, 6],[7, 8, 9]
]# 遍历二维列表
for row in matrix:for num in row:print(num, end=' ')print()  # 换行

2. 字典列表

students = [{'name': 'Alice', 'score': 85},{'name': 'Bob', 'score': 92},{'name': 'Charlie', 'score': 78}
]# 遍历并处理
for student in students:if student['score'] > 80:print(f"{student['name']} 成绩优秀")

3. 字典中的集合

course_students = {'math': {'Alice', 'Bob', 'Charlie'},'physics': {'Alice', 'David', 'Eve'}
}# 找出同时选修两门课的学生
common = course_students['math'] & course_students['physics']
print("同时选修数学和物理的学生:", common)

七、循环控制技巧

1. break和continue

# break示例：找到第一个3的倍数
numbers = [1, 5, 9, 12, 7, 15]
for num in numbers:if num % 3 == 0:print(f"找到第一个3的倍数: {num}")break# continue示例：跳过负数
values = [5, -2, 8, -1, 10]
positive_sum = 0
for val in values:if val < 0:continuepositive_sum += val

2. else子句

循环的else子句在循环正常结束时执行（非break退出）：

for n in range(2, 10):for x in range(2, n):if n % x == 0:print(n, '=', x, '*', n//x)breakelse:# 循环中没有找到因子print(n, '是质数')

3. zip()并行迭代

names = ['Alice', 'Bob', 'Charlie']
scores = [85, 92, 78]for name, score in zip(names, scores):print(f"{name}的成绩是{score}")

八、性能考虑与最佳实践

选择合适容器：
- 需要有序、可重复、可变 → 列表
- 需要有序、可重复、不可变 → 元组
- 需要快速查找键 → 字典
- 需要唯一元素 → 集合
循环优化技巧：
- 对大型数据集考虑使用生成器表达式而非列表推导式
- 在字典循环中，直接使用for key in dict比for key in dict.keys()稍快
- 需要索引时使用enumerate()
可读性建议：
- 避免过深的嵌套（一般不超过3层）
- 复杂的循环条件考虑拆分为函数
- 使用有意义的变量名

九、实战案例：学生成绩分析系统

# 学生成绩数据
students = [{'name': 'Alice', 'math': 85, 'physics': 90, 'chemistry': 78},{'name': 'Bob', 'math': 78, 'physics': 82, 'chemistry': 85},{'name': 'Charlie', 'math': 92, 'physics': 88, 'chemistry': 90}
]# 1. 计算每个学生平均分
for student in students:scores = [student['math'], student['physics'], student['chemistry']]avg = sum(scores) / len(scores)student['average'] = round(avg, 2)print(f"{student['name']}的平均分: {student['average']}")# 2. 找出数学最高分的学生
top_math = max(students, key=lambda x: x['math'])
print(f"数学最高分: {top_math['name']} {top_math['math']}分")# 3. 统计各科平均分
subjects = ['math', 'physics', 'chemistry']
subject_avg = {}
for subject in subjects:total = sum(student[subject] for student in students)subject_avg[subject] = round(total / len(students), 2)print(f"{subject}平均分: {subject_avg[subject]}")