当前位置: 首页 > news >正文

Python集合运算:从基础到进阶全解析

Python基础:集合运算进阶


文章目录

  • Python基础:集合运算进阶
    • 一、知识点详解
      • 1.1 集合运算(运算符 vs 方法)
      • 1.2 集合运算符优先级
      • 1.3 集合关系判断方法
      • 1.4 方法对比
    • 二、说明示例
      • 2.1 权限管理系统
      • 2.2 数据去重与差异分析
      • 2.3 数学运算应用
    • 三、学习总结
    • 四、扩展知识
      • 不可变集合 `frozenset`
        • 4.1 `frozenset`特性
        • 4.2 创建`frozenset`
        • 4.3 `frozenset`应用场景
    • 五、知识点考察题


一、知识点详解

1.1 集合运算(运算符 vs 方法)

集合运算可类比数学中的集合操作,是数据分析、权限管理等场景的核心工具。

运算类型运算符对应方法功能描述
并集|union()合并两集合所有元素(自动去重)
交集&intersection()获取两集合的共有元素
差集-difference()保留 A中存在但B中不存在 的元素
对称差集^symmetric_difference()获取两集合的 独有元素之和(即不同时存在的元素)

运算符与方法的区别

  • 运算符方式更简洁,但只能用于两个集合之间的运算
  • 方法形式支持多集合操作,如A.union(B, C, D)
  • 方法可以链式调用,如A.intersection(B).difference(C)

示例

# 集合运算
A={1,2}
B={2,3}# 并集  → 合并两集合所有元素(自动去重)
# 使用运算符
print(A | B)  # 输出:{1,2,3} 
# 使用方法
print(A.union(B))  # 输出:{1,2,3} # 交集   → 获取两集合的共有元素 
print(A & B)  # 输出:{2}
print(A.intersection(B))  # 输出:{2}# 差集  → 保留A中存在但B中不存在的元素
print(A - B)  # 输出:{1} 
print(A.difference(B))  # 输出:{1} 
print(B - A)  # 输出:{3}
print(B.difference(A))  # 输出:{3}# 对称差集   → 获取两集合的独有元素之和
print(A ^ B)  # 输出:{1,3}
print(A.symmetric_difference(B))  # 输出:{1,3}# 多集合运算示例
A = {1, 2, 3}
B = {3, 4, 5}
C = {5, 6, 7}# 三集合并集
union_result = A.union(B, C)  # {1,2,3,4,5,6,7}# 三集合交集
intersection_result = A.intersection(B, C)  # 空集(无共有元素)# 链式调用示例
result = A.union(B).difference(C)  # {1,2,3,4}

1.2 集合运算符优先级

从高到低排序(同级运算符按从左到右顺序计算):

优先级运算符名称示例
1-差集A - B
2&交集A & B
3^对称差集A ^ B
4|并集A | B
5==, !=相等比较A == B
6<=, <子集判断A <= B
7>=, >超集判断A >= B

注意:进行混合运算时, 有( )时应先进行( )内运算

# 混合运算的陷阱演示
result = {1,2,3} - {2} & {3}  # 实际等价于 ({1,2,3} - {2}) & {3}
print(result)  # 输出:{3}# 推荐写法(显式括号)
result = ({1,2,3} - {2}) & {3}  # 意图清晰

优先级记忆口诀
"先差后交再对称,最后并集别忘记,不确定时就加括号!"


1.3 集合关系判断方法

集合关系判断用于分析多个数据集之间的包含、重叠或独立关系,是数据分析与系统开发中的高频操作。
以下是核心方法分类:

方法名运算符等价功能描述
issubset()<=判断当前集合是否为另一集合的子集(所有元素均在目标集合中存在)
issuperset()>=判断当前集合是否为另一集合的超集(包含目标集合的所有元素)
isdisjoint()判断两集合是否无交集(无共同元素)
intersection()&返回两集合的交集(共同元素),支持多集合操作

方法详解

  1. issubset():子集判断
    功能:验证集合A的所有元素是否都存在于集合B中。
    语法A.issubset(B)A <= BA < B(真子集)
    示例
    A = {1, 2}
    B = {1, 2, 3, 4}print(A.issubset(B))  # 输出:True
    print(A <= B)  # 输出:True
    print(A < B)   # 输出:True(A是B的真子集)C = {1, 2}
    print(C <= C)  # 输出:True(自己是自己的子集)
    print(C < C)   # 输出:False(不是真子集)
    
  • 应用场景
    权限验证:检查用户权限是否为所需权限的子集
    数据包含关系:验证一个数据集是否完全包含在另一个数据集中

  1. issuperset():超集判断
    功能:验证集合A是否包含集合B的所有元素。
    语法A.issuperset(B)A >= BA > B(真超集)
    示例
    A = {1, 2, 3, 4}
    B = {1, 2}print(A.issuperset(B))  # 输出:True
    print(A >= B)  # 输出:True
    print(A > B)   # 输出:True(A是B的真超集)
    
  • 易错点
    issuperset()与 “补集” 概念无关,仅判断包含关系
    > 表示真超集,即 A 包含 B 的所有元素且 A 不等于 B

  1. isdisjoint():不相交判断
    功能:判断两集合是否无共同元素。
    语法A.isdisjoint(B)
    示例
    A = {1, 2, 3}
    B = {4, 5, 6}
    C = {3, 4, 5}print(A.isdisjoint(B))  # 输出:True(没有共同元素)
    print(A.isdisjoint(C))  # 输出:False(有共同元素3)
    
  • 特性
    可接受任意可迭代对象参数(如列表、元组),无需显式转换为集合,比计算交集更高效。
  • 应用场景:黑名单过滤、敏感词检测、冲突检测。

  1. intersection():交集计算
    功能:返回两集合的共有元素。
    语法A.intersection(B)A & B
    扩展应用
    支持多集合操作:A.intersection(B, C)
    可用于替代isdisjoint():若交集为空,则两集合不相交。
    示例
    A = {1, 2, 3}  
    B = {3, 4, 5}  
    print(A.intersection(B))   # 输出:{3}  
    print(A & B)   # 输出:{3}  
    

  1. 集合相等判断
    集合相等判断也是集合关系判断的重要部分,用于判断两个集合是否包含完全相同的元素(顺序不重要)。
    语法== 和 !=
    示例
    A = {1, 2, 3}
    B = {3, 2, 1}
    C = {1, 2, 4}print(A == B)  # 输出:True(元素相同,顺序不重要)
    print(A != C)  # 输出:True
    

1.4 方法对比

需求推荐方法理由
快速判断是否有共同元素isdisjoint()高效,直接返回布尔值
多集合交集计算intersection()支持多参数,返回具体交集元素
验证严格子集关系< 运算符严格子集(A是B的真子集)需用运算符<,而非issubset()
动态数据关系判断运算符(&, <=代码更简洁,适合链式操作

二、说明示例

2.1 权限管理系统

# 定义角色权限集合
admin_perms = {"删除", "编辑", "查看"}
user_perms = {"编辑", "查看"}
guest_perms = {"查看"}# 当前用户 = 普通用户权限(user_perms)
current_user = user_perms# 验证用户权限
print("能删除吗? : ", "删除" in current_user)  # 输出:False
print("能编辑么? : ", "编辑" in current_user)    # 输出:True

2.2 数据去重与差异分析

# 两日商品销售数据
sales_day1 = {"手机", "耳机", "充电宝"}
sales_day2 = {"耳机", "笔记本", "鼠标"}# 合并两日所有商品(并集)
all_products = sales_day1 | sales_day2  # 输出:{'手机','耳机','充电宝','笔记本','鼠标'}# day2相交day1新增商品(差集)
new_products = sales_day2 - sales_day1   # 输出:{'笔记本','鼠标'}

2.3 数学运算应用

# 定义 男生爱好 和 女生爱好
hobbies_boy = {"篮球", "游戏", "音乐"}
hobbies_girl = {"购物", "音乐", "追剧"}# 交集:共同爱好
common_hobbies = hobbies_boy & hobbies_girl
print("共同爱好:", common_hobbies)  #  输出:{'音乐'}# 差集:男生特有爱好
boy_only = hobbies_boy - hobbies_girl
print("男生特有:", boy_only)  # 输出:{'篮球', '游戏'}# 对称差集:男女生各自独有爱好
unique_hobbies = hobbies_boy ^ hobbies_girl
print("独有爱好:", unique_hobbies)  # 输出:{'篮球', '游戏', '购物', '追剧'}

三、学习总结

3.1 集合四大基础运算

  • 并集|union()):合并所有元素并自动去重,常用于数据整合

  • 交集&intersection()):获取多个集合共有元素,适合找共同特征

  • 差集-difference()):保留当前集合独有的元素,用于数据差异分析

  • 对称差集^symmetric_difference()):收集非共有元素之和,适用于差异对比

    简单理解:交集用于 找共同点,并集用于 合并数据,差集用于 筛选差异,对称差集用于 找独有元素

3.2 运算符与方法的选用原则

  • 运算符(如 | & - ^):代码简洁,建议用于两个集合的快速操作
  • 方法调用(如 union()):支持多个集合运算和链式操作(如 A.union(B).difference(C)

3.3 集合关系判断要点

  • 包含验证issubset()/<= 判断子集,issuperset()/>= 判断超集
  • 严格包含< 表示真子集,> 表示真超集(要求元素完全包含且集合不等)
  • 冲突检测isdisjoint() 快速判断两集合是否无交集

四、扩展知识

不可变集合 frozenset

frozenset 是集合的不可变版本,创建后无法修改,但支持集合运算和成员检测。

4.1 frozenset特性
  1. 不可变性:创建后无法修改,尝试修改会引发AttributeError

    fs = frozenset([1, 2])
    fs.add(3)  # 报错:AttributeError
    
  2. 哈希性:可作为字典的键或其他集合的元素(普通集合不可)

    # 合法用法
    data = {frozenset({1,2}): "value"}# 非法用法(普通集合不可哈希)
    invalid = {{1,2}: "value"}  # TypeError
    
  3. 内存占用:因不可变特性,内存占用通常比普通集合小

4.2 创建frozenset
# 从列表创建
fs1 = frozenset([1, 2, 3])# 从字符串创建(字符拆分)
fs2 = frozenset("hello")  # frozenset({'h','e','l','o'})# 空集合
empty_fs = frozenset()# 从字典创建(获取键)
d = {"a":1, "b":2}
fs3 = frozenset(d)  # frozenset({'a','b'})

易错点

  • 非法操作frozenset 不支持 add()remove()pop() 等修改操作。
  • 元素限制:元素必须是不可变类型(如列表 [1,2] 不可作为元素)。
4.3 frozenset应用场景
# 1.作为字典键存储配置信息 
config = {frozenset(["host", "port"]): "数据库连接配置",frozenset(["user", "password"]): "用户认证信息"
}# 2.需要保证数据不被修改的场景
CONSTANTS = frozenset(["MAX_LIMIT", "TIMEOUT", "RETRIES"])# 3.嵌套集合中的元素
nested_set = {frozenset({1,2}), frozenset({3,4})}# 4. 支持数学运算(并、交、差集等运算)
fs1 = frozenset({1,2}) 
fs2 = frozenset({2,3})
print(fs1 & fs2)  # → {2}

五、知识点考察题

A = {1, 2, 3}
B = {1, 2}

以下哪个选项可以判断集合A包含集合B的所有元素且A≠B?( )❓

  • A. A.issubset(B)
  • B. A < B
  • C. A.issuperset(B)
  • D. A > B


关注「安于欣」获取更多Python技巧

http://www.xdnf.cn/news/506395.html

相关文章:

  • 无线信道的噪声与干扰
  • 长三角、珠三角、成渝、京津冀四大城市群的区域与分布
  • 生产者 - 消费者模式实现方法整理
  • Ubuntu 添加系统调用
  • 给你的matplotlib images添加scale Bar
  • Python 3.11详细安装步骤(包含安装包)Python 3.11详细图文安装教程
  • 学习深度学习是否要先学习机器学习?
  • C语言| 指针变量的定义
  • 现货黄金跌破 3160 美元,市场行情剧烈波动​
  • 数据库故障排查指南:从紧急响应到根因分析【DeepSeek创作】
  • AUTOSAR图解==>AUTOSAR_SRS_WatchdogDriver
  • 基于单片机的防盗报警器设计与实现
  • 专题四:综合练习(括号组合算法深度解析)
  • 一分钟用 MCP 上线一个 贪吃蛇 小游戏(CodeBuddy版)
  • ARM-Linux 完全入门
  • Word文档图片排版与批量处理工具推荐
  • 在 Linux 上安装 MATLAB:完整指南与疑难解决方案
  • Autosar Nvm下电存储实现方式-基于ETAS工具
  • 小demo:选中树结构最后层级拿到所有层级中的deviceName并按照要求拼接
  • 嵌入式培训之数据结构学习(五)栈与队列
  • C语言:gcc 如何调用 Win32 打开文件对话框 ?
  • 543.二叉树的直径
  • CT重建笔记(五)—2D平行束投影公式
  • 5.15 学习日志
  • Java 面向对象详解和JVM底层内存分析
  • 图表制作-基础雷达图
  • 代码随想录算法训练营第60期第三十九天打卡
  • 2025.5.17 字符串hash
  • 如何利用Redis实现延迟队列?
  • 【leetcode】2900. 最长相邻不相等子序列 I