当前位置: 首页 > news >正文

defaultdict 在python中的作用

collections.defaultdict 是 Python collections 模块中提供的一个字典(dict)的子类。它与普通的字典非常相似,但有一个关键的区别:当你尝试访问一个不存在的键时,defaultdict 不会引发 KeyError 异常,而是会自动为该键生成一个默认值。

defaultdict 的基本用法

defaultdict 的构造函数需要一个“默认工厂函数”(default_factory)作为参数。这个工厂函数是一个不接受任何参数的可调用对象,它会在访问不存在的键时被调用,并将其返回值作为该键的默认值。

Python

from collections import defaultdict# 使用 int 作为默认工厂函数,意味着当访问不存在的键时,会创建一个默认值为 0 的新条目。
# int() 会返回 0
word_counts = defaultdict(int)# 访问一个不存在的键 'apple',它会自动创建并赋值为 int() 的结果 (0)
print(word_counts['apple'])  # 输出: 0# 现在 'apple' 键存在了,我们可以像普通字典一样操作它
word_counts['apple'] += 1
print(word_counts['apple'])  # 输出: 1word_counts['banana'] += 1
word_counts['apple'] += 1
print(word_counts)  # 输出: defaultdict(<class 'int'>, {'apple': 2, 'banana': 1})

为什么使用 defaultdict

defaultdict 主要用于简化代码,避免在使用普通字典时频繁地检查键是否存在。这在以下场景中特别有用:

  1. 计数 (Counting): 统计列表中元素的出现次数,或字符串中字符的出现次数。

    使用普通字典:

    Python
    counts = {}
    my_list = ['apple', 'banana', 'apple', 'orange', 'banana', 'apple']
    for item in my_list:if item in counts:counts[item] += 1else:counts[item] = 1
    print(counts)
    

    使用 defaultdict(int)

    Python
    from collections import defaultdict
    counts = defaultdict(int)
    my_list = ['apple', 'banana', 'apple', 'orange', 'banana', 'apple']
    for item in my_list:counts[item] += 1  # 如果 'item' 不存在,会自动创建为 0,然后加 1
    print(counts)
    

    显然,defaultdict 的代码更简洁。

  2. 分组 (Grouping): 将具有相同特征的元素分组。例如,根据首字母将单词分组。

    使用普通字典:

    Python
    words_by_initial = {}
    words = ['apple', 'banana', 'apricot', 'cat', 'dog']
    for word in words:initial = word[0]if initial in words_by_initial:words_by_initial[initial].append(word)else:words_by_initial[initial] = [word]
    print(words_by_initial)
    

    使用 defaultdict(list)

    Python

    from collections import defaultdict
    words_by_initial = defaultdict(list)
    words = ['apple', 'banana', 'apricot', 'cat', 'dog']
    for word in words:initial = word[0]words_by_initial[initial].append(word) # 如果 'initial' 不存在,会自动创建为空列表 []
    print(words_by_initial)
    

    这里,list 作为默认工厂函数,当访问不存在的键时,会创建一个空列表。

  3. 累加/聚合 (Accumulating/Aggregating): 对某个键下的值进行累加或进行其他聚合操作。

    假设你有一些销售数据,想要计算每个产品的总销售额:

    Python
    from collections import defaultdictsales_data = [{'product': 'A', 'amount': 100},{'product': 'B', 'amount': 50},{'product': 'A', 'amount': 75},{'product': 'C', 'amount': 200},{'product': 'B', 'amount': 120},
    ]total_sales = defaultdict(float) # 或者 int,根据你的数据类型for item in sales_data:product = item['product']amount = item['amount']total_sales[product] += amountprint(total_sales)
    # 输出: defaultdict(<class 'float'>, {'A': 175.0, 'B': 170.0, 'C': 200.0})
    

defaultdict 的工厂函数

defaultdictdefault_factory 可以是任何可调用对象,而不仅仅是内置类型(如 intlistset)。

  • int: 默认值为 0

    Python
    d = defaultdict(int)
    print(d['a']) # 0
    
  • list: 默认值为 []

    Python
    d = defaultdict(list)
    d['a'].append(1)
    print(d) # defaultdict(<class 'list'>, {'a': [1]})
    
  • set: 默认值为 set()

    Python
    d = defaultdict(set)
    d['a'].add(1)
    d['a'].add(2)
    print(d) # defaultdict(<class 'set'>, {'a': {1, 2}})
    
  • str: 默认值为 ''

    Python
    d = defaultdict(str)
    print(d['a']) # ''
    
  • 自定义函数:

    Python
    def create_default_value():return "Not Found"d = defaultdict(create_default_value)
    print(d['unknown_key']) # Not Found
    
  • lambda 表达式:

    Python
    d = defaultdict(lambda: {'count': 0, 'items': []})
    d['product1']['count'] += 1
    d['product1']['items'].append('item_x')
    print(d['product1']) # {'count': 1, 'items': ['item_x']}
    

defaultdictdict.setdefault() 的比较

在某些情况下,dict.setdefault() 也可以实现类似的功能,但 defaultdict 通常更简洁高效。

dict.setdefault(key, default_value) 方法会在字典中查找 key。如果 key 存在,则返回其对应的值;如果 key 不存在,则将 key 插入字典并赋值为 default_value,然后返回 default_value

使用 dict.setdefault() 进行计数:

Python

counts = {}
my_list = ['apple', 'banana', 'apple']
for item in my_list:counts[item] = counts.setdefault(item, 0) + 1
print(counts) # {'apple': 2, 'banana': 1}

使用 dict.setdefault() 进行分组:

Python

words_by_initial = {}
words = ['apple', 'banana', 'apricot']
for word in words:initial = word[0]words_by_initial.setdefault(initial, []).append(word)
print(words_by_initial) # {'a': ['apple', 'apricot'], 'b': ['banana']}

对比:

  • 简洁性: defaultdict 在很多情况下代码更简洁,因为它省去了显式的条件判断或 setdefault 调用。
  • 性能: 对于大量操作,defaultdict 通常比重复调用 setdefault 稍微快一些,因为它避免了每次访问时都可能进行的键查找和方法调用开销。
  • 语义: defaultdict 明确表达了“如果键不存在,就创建一个默认值”的意图,使得代码更易读。
  • 灵活性: defaultdict 允许你指定一个工厂函数,而 setdefault 每次都需要提供一个具体的默认值。虽然 setdefault 也可以结合函数调用,但不如 defaultdict 的设计直接。

http://www.xdnf.cn/news/974827.html

相关文章:

  • 传输层协议 TCP 介绍 -- TCP协议格式,确认应答机制,超时重传机制,连接管理机制,滑动窗口,流量控制,拥塞控制,延迟应答,捎带应答
  • 告别尺寸混乱!CAD 快速看图【比例】功能精准校准,测量标注零误差
  • 批量转灰度图和调整图片大小
  • 如何在 TypeScript 中使用类型保护
  • Vim鼠标右键复制问题解决方法
  • java转PHP开发需要几步?
  • PHP基础-语法变量
  • LVS 负载均衡详解:四层转发原理与三种经典模式全面解析
  • 谈文件系统
  • Vue 中的数据代理机制
  • 中兴B860AV1.1_MSO9280_降级后开ADB-免刷机破解教程(非刷机)
  • Java面试题019:一文深入了解微服务之负载均衡Ribbon
  • Wireshark 筛选功能详解:语法与示例
  • 一些学习网站分享
  • OctoPrint公网部署如何实现?3D打印远程控制一键部署过程!
  • 《零基础读懂新能源汽车》——V2G/电池梯次利用/氢能源生态级技术拆解与商业预言
  • 智能体商业化:创建-接入-封装成小程序/网站/H5
  • PHP7+MySQL5.6 雪里开简易预约制访客管理系统V1.0
  • 深度解读云防火墙(WAF):守护网络安全的智能卫士
  • 在当系统未连接上wifi的时候,直接不显示wifi列表 ,这个判断导致?
  • UI 设计|审美积累|新拟态风格(Neumorphism)
  • 【华为Pura80系列】鸿蒙生态再升级:Pura 80 系列影像突破,WATCH 5 开启智能手表新纪元
  • 2025 年 MQTT 技术趋势:驱动 AI 与物联网未来发展的关键动力
  • 理解什么是并查集
  • 阿糖胞苷联合伊达比星为代表的强化治疗方案引领AML多阶段治疗新进展
  • 学习threejs,使用TSL计算粒子鼠标特效
  • Maven 构建性能优化深度剖析:原理、策略与实践
  • 目标检测yolo算法
  • AI赋能Automa二次开发
  • 超市售货管理平台小程序