文章目录

      • 核心特点
      • 基本语法
      • 常见使用场景
        • 1. 分组数据(默认值为列表)
        • 2. 计数(默认值为整数)
        • 3. 集合操作(默认值为集合)
        • 4. 嵌套字典
      • 注意事项
      • 与普通字典对比
      • 总结
      • 1. 键(Key)的类型
      • 2. 值(Value)的类型
      • 3. `default_factory` 的返回值
      • 4. 嵌套 `defaultdict` 的键值
      • 5. 键和值的可变性总结
      • 常见问题解答
        • Q1:可以用 `list` 作为键吗?
        • Q2:可以用 `defaultdict` 作为键吗?
        • Q3:值可以是函数或类吗?
      • 总结

在 Python 中, defaultdictcollections 模块提供的一个非常有用的类,它是内置字典类型 dict 的子类。 defaultdict 的主要特点是 自动处理字典中不存在的键,避免在使用普通字典时因访问不存在的键而抛出 KeyError 异常。


核心特点

  1. 自动初始化默认值:当访问一个不存在的键时,defaultdict 会调用指定的默认工厂函数(default_factory)生成一个初始值,确定了字典中值的类型
  2. 简化代码:无需手动检查键是否存在,适合需要分组、统计或聚合数据的场景。

基本语法

from collections import defaultdictd = defaultdict(default_factory)
  • default_factory:一个可调用对象(如 list, int, set, str 或自定义函数),用于生成默认值。

常见使用场景

1. 分组数据(默认值为列表)

将数据按键分组,类似 SQL 的 GROUP BY

from collections import defaultdictdata = [("apple", "fruit"), ("carrot", "vegetable"), ("apple", "fruit")]
grouped = defaultdict(list)for name, category in data:grouped[category].append(name)print(grouped)
# 输出:defaultdict(<class 'list'>, {'fruit': ['apple', 'apple'], 'vegetable': ['carrot']})
2. 计数(默认值为整数)

统计元素出现次数:

from collections import defaultdicttext = "apple banana apple orange banana"
words = text.split()
count = defaultdict(int)for word in words:count[word] += 1print(count)
# 输出:defaultdict(<class 'int'>, {'apple': 2, 'banana': 2, 'orange': 1})
3. 集合操作(默认值为集合)

避免重复值:

from collections import defaultdictpairs = [("a", 1), ("b", 2), ("a", 3)]
unique = defaultdict(set)for key, value in pairs:unique[key].add(value)print(unique)
# 输出:defaultdict(<class 'set'>, {'a': {1, 3}, 'b': {2}})
4. 嵌套字典

构建多层嵌套结构:

from collections import defaultdictnested = defaultdict(lambda: defaultdict(int))
nested["fruit"]["apple"] += 1
nested["vegetable"]["carrot"] += 2print(nested["fruit"])        # 输出:defaultdict(<class 'int'>, {'apple': 1})
print(nested["unknown_key"])  # 输出:defaultdict(<class 'int'>, {})

注意事项

  1. default_factory 必须可调用:例如 listint 是类(构造函数),而 list()int() 的返回值不可作为工厂。
  2. 仅对 d[key] 有效:使用 d.get(key)key in d 不会触发默认值生成。
  3. 性能:与普通字典性能接近,适合高频插入操作。

与普通字典对比

# 普通字典需要手动处理缺失键
d = {}
key = "unknown"
if key not in d:d[key] = []
d[key].append(1)# defaultdict 自动处理
d = defaultdict(list)
d["unknown"].append(1)

总结

defaultdict 简化了需要初始化默认值的字典操作,特别适合数据聚合、分组和统计场景。通过合理选择 default_factory(如 listintset 或自定义函数),可以大幅提升代码简洁性和可读性。

在 Python 中,defaultdict 继承自 dict,因此它的 键(Key)和值(Value)的类型规则与普通字典一致,但也有一些细节需要注意。以下是详细说明:


1. 键(Key)的类型

  • 规则:键必须是 不可变类型(Immutable)可哈希(Hashable)

  • 允许的类型

    • 基本类型:int, float, str, bool, None
    • 不可变容器:tuple(但元组内的元素也必须不可变)
    • frozenset(不可变集合)
    • 用户自定义的不可变对象(需正确实现 __hash____eq__ 方法)。
  • 禁止的类型

    • 可变类型:list, dict, set
    • 包含可变元素的 tuple(例如 (1, [2, 3]))。
  • 示例

    from collections import defaultdict# 合法键
    d = defaultdict(int)
    d["apple"] = 10       # 字符串作为键 ✅
    d[123] = 20          # 整数作为键 ✅
    d[(1, 2)] = 30       # 不可变元组作为键 ✅# 非法键(会抛出 TypeError)
    d[[1, 2]] = 40       # 列表不可哈希 ❌
    d[{"a": 1}] = 50     # 字典不可哈希 ❌
    

2. 值(Value)的类型

  • 规则:值可以是 任意类型,包括可变对象。

  • 允许的类型

    • 基本类型(int, float, str 等)
    • 可变容器(list, dict, set
    • 自定义对象、函数、类实例等。
  • 示例

    from collections import defaultdict# 值可以是列表(可变)
    d_list = defaultdict(list)
    d_list["fruits"].append("apple")# 值可以是字典(可变)
    d_dict = defaultdict(dict)
    d_dict["data"]["count"] = 10# 值可以是自定义对象
    class MyClass:passd_obj = defaultdict(MyClass)
    obj = d_obj["instance"]  # 自动生成一个 MyClass 实例
    

3. default_factory 的返回值

default_factory 是一个可调用对象(如 list, int 或自定义函数),它决定了 当键不存在时,默认值的类型。例如:

  • defaultdict(list):默认值是一个空列表([])。
  • defaultdict(int):默认值是 0
  • defaultdict(lambda: "unknown"):默认值是字符串 "unknown"

值的类型完全由 default_factory 决定,与键的类型无关


4. 嵌套 defaultdict 的键值

可以创建多层嵌套的 defaultdict,键的规则依然适用:

from collections import defaultdict# 嵌套 defaultdict(值类型是另一个 defaultdict)
nested = defaultdict(lambda: defaultdict(int))# 合法操作
nested["fruit"]["apple"] += 1      # 键为 "fruit"(字符串)和 "apple"(字符串)
nested[123][(4, 5)] = 2           # 键为 123(整数)和 (4, 5)(不可变元组)# 非法操作(内层键非法)
nested["data"][[1, 2]] = 3        # 内层键为列表,不可哈希 ❌

5. 键和值的可变性总结

特性键(Key)值(Value)
类型限制必须不可变且可哈希可以是任意类型
可变性不可变可以可变
示例int, str, tuplelist, dict, 自定义对象

常见问题解答

Q1:可以用 list 作为键吗?
  • 。列表是可变类型,不可哈希。若需用类似列表的结构作为键,可以转换为不可变的 tuple
Q2:可以用 defaultdict 作为键吗?
  • defaultdict 是可变对象,不可哈希。只有不可变类型(如 frozenset)可以作为键。
Q3:值可以是函数或类吗?
  • 。例如:
    d = defaultdict(type)  # 默认值是类对象
    d["my_class"] = MyClass
    

总结

  • :必须为不可变且可哈希的类型(如 str, int, tuple)。
  • :可以是任意类型(包括可变对象),具体由 default_factory 决定。
  • 嵌套结构:可以自由嵌套 defaultdict,但需确保每一层的键合法。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/78697.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/78697.shtml
英文地址,请注明出处:http://en.pswp.cn/pingmian/78697.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

结构化数据、半结构化数据、非结构化数据 差异与实践指南

结构化数据、半结构化数据、非结构化数据 差异与实践指南 一、核心概念与差异对比 维度结构化数据半结构化数据非结构化数据数据结构固定Schema&#xff08;行列明确&#xff09;含标签/层级结构&#xff08;无固定Schema&#xff09;无预定义结构存储方式关系型数据库&#x…

【AI News | 20250429】每日AI进展

AI Repos 1、aci ACI.dev是一个开源基础设施层&#xff0c;旨在为AI智能体的工具使用提供支持。它通过统一的模型-上下文-协议&#xff08;MCP&#xff09;服务器或轻量级Python SDK&#xff0c;使智能体能够以感知意图的方式访问600多种工具&#xff0c;并具备多租户认证、细…

【C++ 类和数据抽象】消息处理示例(1):从设计模式到实战应用

目录 一、数据抽象概述 二、消息处理的核心概念 2.1 什么是消息处理&#xff1f; 2.2 消息处理的核心目标 三、基于设计模式的消息处理实现 3.1 观察者模式&#xff08;Observer Pattern&#xff09; 3.2 命令模式&#xff08;Command Pattern&#xff09; 四、实战场景…

【Android】自定义Trace

1&#xff0c;Trace分析 Android掉帧分析-CSDN博客 2&#xff0c;自定义Trace 以下&#xff0c;android.os.Trace公开了以下API 1&#xff0c;beginSection与endSection联合使用&#xff0c;只能在同一个线程 2&#xff0c;beginAsyncSection与endAsyncSection可以在不同线程…

基于tabula对pdf中的excel进行识别并转换成word(三)

上一节中是基于PaddleOCR对图片中的excel进行识别并转换成word优化&#xff0c;本节改变思路&#xff0c;直接从pdf中读取表格的信息&#xff0c;具体思路如下所述。 PDF中的表格数据如下截图所示&#xff1a; 一、基于tabula从PDF中提取表格 df_list tabula.read_pdf("…

Java中的接口和抽象类

Java 抽象类与接口&#xff1a;区别、应用与选择 在 Java 编程的世界里&#xff0c;抽象类和接口是两个极为重要的概念&#xff0c;它们在实现代码抽象、提高代码复用性和可维护性方面发挥着关键作用。然而&#xff0c;很多开发者在使用时容易混淆这两个概念。本文将深入探讨 …

Java读Excel:解析阿里云easyExcel导入文件的行号

文章目录 引言I 解析阿里云easyExcel导入文件的行号声明解析对象的基类判断Excel解析对象类型是否包含继承某个类 isAssignableFromJava 转换list类型并设置下标到元素对象属性II 封装excel 文件读取excel 文件读取用法文件导入上下文III 参数校验工具类校验参数是否合法 (jaka…

mmap核心原理和用途及其与内存映射段的关系

mmap 是 Linux/Unix 系统中的一个关键系统调用&#xff0c;全称是 Memory Map&#xff08;内存映射&#xff09;。它的核心功能是将 文件、设备或匿名内存 直接映射到进程的虚拟地址空间&#xff0c;从而实现高效的内存访问和操作。以下是其核心原理和用途的详细说明&#xff1…

数据库概论速成期中版

文章目录 引论数据库用户Casual usersNaive usersApplication programmersDatabase administrators 关系模型CAP数据库两种描述关系数据库的方式简单总结 第一范式规则第二范式规则举个例子符合第二规则的操作不符合第二规则的操作 第三范式规则key,superkey,null values,主键&…

解决调用Claude 3.7接口 403 Request not allowed问题

1. 遇到问题 Python 基于 Langchain 对接 Claude 3.7 大模型接口进行问答时&#xff0c;由于国内不在Claude支持的国家和地区&#xff0c;所以一直调不通&#xff0c;错误 anthropic.PermissionDeniedError: Error code: 403 - {error: {type: forbidden, message: Request…

Vue2+Vue3学习笔记

Vue基础介绍 下载并安装vue.js v2 https://v2.cn.vuejs.org/https://v2.cn.vuejs.org/ v3 https://v3.cn.vuejs.org/ 会重定向到Vue.js - 渐进式 JavaScript 框架 | Vue.jsVue.js - 渐进式的 JavaScript 框架https://cn.vuejs.org/ 从v2过渡到v3 在F盘创建v2v3学习笔记 并…

2025年KBS新算法 SCI1区TOP:长颖燕麦优化算法AOO,深度解析+性能实测

目录 1.摘要2.算法原理3.结果展示4.参考文献5.文章&代码获取 1.摘要 本文提出了一种新颖的元启发式算法——长颖燕麦优化算法&#xff08;AOO&#xff09;&#xff0c;该算法灵感来自动画燕麦在环境中的自然行为。AOO模拟了长颖燕麦的三种独特行为&#xff1a;(i) 通过自然…

CentosLinux系统crontab发现执行删除命令失效解决方法

权限或安全策略限制 ​​可能场景​​&#xff1a; ​​### ​​目录权限冲突​​&#xff1a; 你的目录权限为 drwxr-xr-x&#xff08;属主 mssql&#xff09;&#xff0c;但 cron 任务以 root 执行。 ​​风险点​​&#xff1a;若目录内文件属主为 mssql 且权限为 700&…

后验概率最大化(MAP)估计算法原理以及相具体的应用实例附C++代码示例

1. MAP估计基本原理 MAP&#xff08;Maximum A Posteriori&#xff0c;最大后验概率估计&#xff09;是贝叶斯推断中的重要概念&#xff0c;它的目标是&#xff1a; 给定观测数据&#xff0c;找到使得后验概率最大的参数值。 公式化表示&#xff1a; [ θ MAP arg ⁡ max ⁡…

16、路由守卫:设置魔法结界——React 19 React Router

一、魔法结界的本质 "路由守卫是霍格沃茨城堡的隐身斗篷&#xff0c;在时空裂隙中精准控制维度跃迁&#xff01;" 魔法部交通司官员挥舞魔杖&#xff0c;React Router 的嵌套路由在空中交织成星轨矩阵。 ——基于《国际魔法联合会》第7号时空协议&#xff0c;路由守…

从车道检测项目入门open cv

从车道检测项目入门open cv 前提声明&#xff1a;非常感谢b站up主 嘉然今天吃带变&#xff0c;感谢其视频的帮助。同时希望各位大佬积积极提出宝贵的意见。&#x1f60a;&#x1f60a;&#x1f60a;(❁◡❁)(●’◡’●)╰(▽)╯ github地址&#xff1a;https://github.com/liz…

【行业特化篇3】制造业简历优化指南:技术参数与标准化流程的关键词植入艺术

写在最前 作为一个中古程序猿,我有很多自己想做的事情,比如埋头苦干手搓一个低代码数据库设计平台(目前只针对写java的朋友),比如很喜欢帮身边的朋友看看简历,讲讲面试技巧,毕竟工作这么多年,也做到过高管,有很多面人经历,意见还算有用,大家基本都能拿到想要的offe…

如何在本地部署小智服务器:从源码到全模块运行的详细步骤

小智聊天机器人本地后台服务器源码全模块部署 作者&#xff1a;林甲酸 -不是小女子也不是女汉子 是大女子 更新日期&#xff1a;2025年4月29日 &#x1f3af; 前言&#xff1a;为什么要写这篇教程&#xff1f; 上周按照虾哥小智服务器的教程去部署本地后台&#xff0c;我用的是…

github开源项目添加开源协议,使用很简单

直接在 GitHub 网页上创建 进入你的 GitHub 仓库 打开你的项目仓库页面&#xff08;如 https://github.com/用户名/仓库名&#xff09;。 点击 "Add file" → "Create new file" 在仓库主页&#xff0c;点击右上角的 "Add file" 按钮&#xff…

8.idea创建maven项目(使用Log4j日志记录框架+Log4j 介绍)

8.idea创建maven项目(使用Log4j日志记录框架Log4j 介绍) 在 IntelliJ IDEA 的 Maven 项目中引入了 Log4j&#xff0c;并配置了日志同时输出到控制台和文件。 Log4j 提供了灵活的日志配置选项&#xff0c;可以根据项目需求调整日志级别、输出目标和格式。 1. 创建 Maven 项目 …