当前位置: 首页 > ds >正文

什么时候需要用到 multiprocessing?

什么时候需要用到 multiprocessing?

  • 必须记忆的 7 组核心 API 与实战代码
    • 1. Process 基本用法(记住两段模板)
      • 模板 A:无参函数
      • 模板 B:带参函数(注意可 pickle)
    • 2. 守护进程 Daemon(后台任务心跳)
    • 3. 优雅退出:join、terminate、exitcode
    • 4. 进程间通信:Queue(生产者-消费者模式)
    • 5. 共享状态:Manager 与 Lock
    • 6. 进程池 Pool(MapReduce 雏形)
    • 7. 自定义 Process 子类(可重用组件)
  • 一张思维导图总结
  • 结语:记忆策略

场景速查表:

场景是否需要 multiprocessing原因
CPU 密集型任务(加密、科学计算、图像处理)✅ 必须GIL 限制,多线程无法并行
I/O 密集型任务(文件、网络)❌ 优先用多线程/异步线程切换开销更小
需要多个 Python 解释器隔离✅ 必须每个进程独立内存空间
需要共享大量复杂对象⚠️ 谨慎进程间共享成本高于线程

结论:只要你要榨干多核 CPU,就绕不开 multiprocessing。否则可以先考虑线程或协程。


必须记忆的 7 组核心 API 与实战代码

下面把「面试时写得出、项目里用得着」的知识点浓缩成一篇 CSDN 风格的速查博客。每个点都给出最小可运行示例(MRE:Minimal Runnable Example),复制即可运行。


1. Process 基本用法(记住两段模板)

模板 A:无参函数

import multiprocessing, timedef worker():print('Worker start', multiprocessing.current_process().name)time.sleep(1)if __name__ == '__main__':p = multiprocessing.Process(target=worker, name='worker-A')p.start()p.join()

模板 B:带参函数(注意可 pickle)

import multiprocessingdef power(base, exp):print(f'{base}^{exp} = {base**exp}')if __name__ == '__main__':for pair in [(2, 10), (3, 5)]:multiprocessing.Process(target=power, args=pair).start()

2. 守护进程 Daemon(后台任务心跳)

import multiprocessing, timedef heartbeat():while True:print('heartbeat', time.strftime('%H:%M:%S'))time.sleep(1)if __name__ == '__main__':d = multiprocessing.Process(target=heartbeat, daemon=True)d.start()time.sleep(3)      # 主进程 3 秒后退出,守护进程随之被杀

3. 优雅退出:join、terminate、exitcode

import multiprocessing, time, signaldef slow():time.sleep(5)if __name__ == '__main__':p = multiprocessing.Process(target=slow)p.start()time.sleep(1)p.terminate()          # 向子进程发 SIGTERMp.join()               # 回收资源print('exitcode:', p.exitcode)   # -15 代表被信号 15 杀死

4. 进程间通信:Queue(生产者-消费者模式)

import multiprocessing, random, timedef producer(q):for i in range(5):q.put(random.randint(1, 100))time.sleep(0.2)def consumer(q):while True:item = q.get()if item is None:          # 毒丸breakprint('Consumed', item)if __name__ == '__main__':q = multiprocessing.Queue()p = multiprocessing.Process(target=producer, args=(q,))c = multiprocessing.Process(target=consumer, args=(q,))p.start(); c.start()p.join()q.put(None)                  # 发毒丸c.join()

5. 共享状态:Manager 与 Lock

import multiprocessingdef add_to_dict(d, key, lock):with lock:                # 防止竞态d[key] = key * keyif __name__ == '__main__':mgr = multiprocessing.Manager()shared_dict = mgr.dict()lock = multiprocessing.Lock()jobs = [multiprocessing.Process(target=add_to_dict, args=(shared_dict, i, lock))for i in range(10)]for j in jobs: j.start()for j in jobs: j.join()print(shared_dict)

6. 进程池 Pool(MapReduce 雏形)

import multiprocessing, osdef square(x):return x * xif __name__ == '__main__':with multiprocessing.Pool(processes=os.cpu_count()) as pool:result = pool.map(square, range(10))print(result)     # [0, 1, 4, 9, ... 81]

7. 自定义 Process 子类(可重用组件)

import multiprocessing, timeclass TimerProcess(multiprocessing.Process):def __init__(self, interval):super().__init__()self.interval = intervaldef run(self):for i in range(3):print(f'{self.name}: {i+1}/{3}')time.sleep(self.interval)if __name__ == '__main__':TimerProcess(1).start()

一张思维导图总结

multiprocessing
├─ 基本对象
│  ├─ Process
│  ├─ Queue / JoinableQueue
│  ├─ Lock / Semaphore / Condition / Event
│  └─ Manager
├─ 高级抽象
│  ├─ Pool
│  └─ 自定义 Process 子类
└─ 生命周期├─ start / join / terminate└─ daemon / exitcode

结语:记忆策略

  1. 先背 3 个模板(Process、Queue、Pool)。
  2. 再背 生命周期:start → join/terminate → exitcode。
  3. 其余 API 用的时候查表即可。
http://www.xdnf.cn/news/15492.html

相关文章:

  • 基于 CentOS 7 的 LVS+DR+Web+NFS 旅游攻略分享平台部署
  • 【RA-Eco-RA6E2-64PIN-V1.0 开发板】ADC 电压的 LabVIEW 数据采集
  • 【读书笔记】《Effective Modern C++》第六章 Lambda Expressions
  • Windows 常用命令
  • vue防内存泄漏和性能优化浅解
  • 如何自动化处理TXT日志,提升工作效率新方式
  • RabbitMQ队列的选择
  • 03.Python 字符串中的空白字符处理
  • Springboot实现一个接口加密
  • 华为交换机 undo negotiation auto功能(华为交换机端口接光纤两端起不来)
  • 【Complete Search】-基础完全搜索-Basic Complete Search
  • JAVA 项目工程化实践
  • fatal: active `post-checkout` hook found during `git clone`
  • v-for中key值的作用:为什么我总被要求加这个‘没用的‘属性?
  • 大小为 K 且平均值大于等于阈值的子数组数目
  • “找到一个或多个多重定义的符号“(LNK2005 或 LNK1169)
  • 006_测试评估与安全实践
  • 深入理解 LangChain:AI 应用开发的全新范式
  • 面试150 填充每个节点的下一个右侧节点指针Ⅱ
  • 第一个Flink 程序 WordCount,词频统计(批处理)
  • ReAct论文解读(1)—什么是ReAct?
  • AI大模型计数能力的深度剖析:从理论缺陷到技术改进
  • Java行为型模式---观察者模式
  • macOS - Chrome 关闭自动更新
  • c语言初阶 结构体
  • 基于Flink的实时开发平台-Dinky
  • v-show和v-if的区别
  • 【C++】auto关键字 C++入门(5)
  • 数据结构(8)——二叉树(2)
  • HarmonyOS 获取设备位置信息开发指导