当前位置: 首页 > news >正文

linux_线程概念

线程特征:是进程内的执行分支,线程的执行粒度,要比进程要细。

1.理解Linux线程

线程<=执行流<=进程 

线程实际上是复用进程的数据结构和管理算法,进程的task struct,实际上是模拟线程,部分书中说Linux没有真正意义上的线程是不太准确的的,因为用进程模拟的线程,实际上复用了进程的内核的数据结构,从功能角度,Linux 的轻量级进程完全能实现线程的核心功能(如共享地址空间、并发执行),且用户态通过 pthread 库可屏蔽内核实现细节,对开发者而言与“真正的线程”无实质区别。因此,不能说 Linux“没有线程”,只是实现方式特殊。

在以往我们所谈到的进程中,操作系统其实是以进程为单位给我们分配资源,我们当前的进程的内部只有一个执行流。

在Linux的实现方案中,线程在进程内部执行,线程在进程的地址空间内运行。其原因是任何执行流要执行都要有资源,而地址空间是进程的资源窗口同时线程的执行力度要比进程更细,其本质原因是线程执行进程的代码的一部分

2.线程和进程的定义

 线程:线程操作系统调度的基本单位

进程:内核观点进程是承担分配系统资源的基本实体,进程=内核数据结构+代码和数据

执行流: 执行流也是资源,因为线程是进程内部的执行力资源

3.重谈地址空间

X86的特点便是起始地址+类型=起始地址+偏移量 

如int类型对该变量取地址,实际上拿到的是他的第1字节个地址

4.Linux线程的周边概念

以下从 缓存(cache)相关过程 和 线程切换效率更高的原因 两方面展开,结合图中 Linux 线程、进程的架构逻辑来讲:

一、缓存(cache)相关过程

图里的 “cache(缓存)”,核心是 CPU 缓存与进程/线程数据的关联 :

- 程序运行时,CPU 会把高频访问的内存数据(比如进程/线程的指令、常用变量等)暂存到 CPU 缓存里 。这样做是为了 减少 CPU 直接访问物理内存的次数(内存读写速度远低于 CPU 运算速度,缓存能当 “高速中转站”)。
- 对进程/线程来说,这些缓存里的 “热数据” 是它们高效运行的基础 。比如线程执行时,常用的  task_struct  部分信息、虚拟内存映射的关键数据,可能就存在缓存里,CPU 直接从缓存取数据,能大幅加快执行效率。

简单说,缓存就是给 CPU 快速 “存取常用数据” 开的 “绿色通道” ,让进程/线程跑起来更流畅,少等内存读写的 “延迟”。

、线程切换效率更高的原因

从图中 Linux 进程、线程的架构(共享虚拟地址空间、 task_struct  等)来看,线程切换比进程切换 “更轻量”,核心原因在这两点:

1. 地址空间 & 资源共享层面

- 进程切换:
进程有独立的虚拟地址空间( mm_struct  管理),切换时,CPU 缓存里的旧进程地址、数据会被 “清空/替换” ,还要重新加载新进程的页表、地址空间等一大堆资源(相当于换了一套全新的 “运行环境”),这一步特别耗时 。
- 线程切换:
同一进程里的线程 共享虚拟地址空间( mm_struct  是共用的)!切换时,不需要动页表、地址空间这些 “大块头”,缓存里的热数据(比如进程内共享的代码、全局变量缓存)大概率还能用 ,省去了重新加载地址空间的巨大开销。

2. PCB( task_struct )切换层面

- 进程切换:
除了地址空间,进程的  task_struct  里还得处理一大堆独立资源(文件描述符、信号量等),切换时要把这些状态全部 “保存 - 恢复”,流程复杂、耗时多。
- 线程切换:
线程的  task_struct  虽然也有自己的执行上下文(比如寄存器状态、程序计数器),但 共享了进程级的大部分资源(文件、信号等)。切换时,主要就是改改寄存器、程序计数器这些 “小状态”,比起进程切换要简单得多,自然更快 。

总结一下:

- 缓存过程 是 CPU 为了加速程序运行,把常用数据临时存在 “高速缓存” 里;
- 线程切换更快 ,是因为线程共享了进程的地址空间、大部分资源,切换时不用像进程那样 “大动干戈” 换地址空间、重新加载大量资源,所以效率更高 。
需要注意的是线程有属于自己的上下文和栈

 

5.线程的优缺点:一把双刃剑

(一)线程的优点

1. 创建与切换成本低:创建新线程比创建新进程划算多了。打个比方,创建进程就像在电脑里“新建”一个独立的软件环境,要分配很多资源;而线程就像是在同一个软件里开个“小分支”,资源共享,所以轻松不少。线程切换时,操作系统要做的工作也少,就像在同一个房间里换个角落干活,比跑到另一个房间方便。

2. 资源占用少:线程占的资源比进程少很多,这样就能同时运行更多线程,充分利用 CPU 的多核能力,让程序跑得更快。

3. 提升程序效率:要是程序需要等待慢速的 I/O 操作(比如读写文件、网络请求),线程可以在等待的时候去做别的任务,不浪费时间。对于计算密集型任务,把计算拆分成多个线程,能让多核 CPU 一起发力;对于 I/O 密集型任务,多个线程同时等待不同的 I/O 操作,也能提高整体性能 。

(二)线程的缺点

1. 性能损失:如果有很多计算密集型线程,处理器忙不过来,线程之间切换和同步会增加额外开销,就像好几个人挤在一个小房间干活,互相干扰,效率反而变低。

2. 健壮性降低:写多线程程序得特别小心。线程之间时间分配的小偏差,或者不小心共享了不该共享的变量,都可能出问题。而且线程之间缺乏保护,一个线程出问题,可能连累整个程序。

3. 缺乏访问控制:进程是访问控制的基本单位,线程里调用一些操作系统函数,可能影响整个进程,就像一个线程在“大团队”里搞破坏,会牵连所有人。

4. 编程难度高:多线程程序又难写又难调试。要考虑线程同步、竞争条件这些问题,稍微不注意就出错,比单线程程序复杂多了 。

http://www.xdnf.cn/news/1107379.html

相关文章:

  • 基于开源AI智能名片链动2+1模式S2B2C商城小程序的营销直播质量提升策略研究
  • Vue框架之钩子函数详解
  • 2025年亚太杯(中文赛项)数学建模B题【疾病的预测与大数据分析】原创论文分享
  • [爬虫实战] 多进程/多线程/协程-异步爬取豆瓣Top250
  • QML与C++相互调用函数并获得返回值
  • PID控制算法理论学习基础——单级PID控制
  • 多 Agent 强化学习实践指南(一):CTDE PPO 在合作捕食者-猎物游戏中的应用详解
  • GitHub 操作指南:项目协作与自动化工作流实践
  • 【小沐杂货铺】基于Three.JS绘制汽车展示Car(WebGL、vue、react、autoshow、提供全部源代码)
  • 【Elasticsearch】function_score与rescore
  • html-初级标签
  • 【离线数仓项目】——数据模型开发实战
  • S7-200 SMART PLC:硬件、原理及接线特点全解析
  • 别再怕 JSON!5分钟带你轻松搞懂这个程序员的好帮手
  • C#调用Matlab生成的DLL
  • C++ Map 和 Set 详解:从原理到实战应用
  • win10安装Rust Webassembly工具链(wasm-pack)报错。
  • 细谈kotlin中缀表达式
  • RISC-V:开源芯浪潮下的技术突围与职业新赛道 (四) 产业应用全景扫描
  • Vim的magic模式
  • javaEE——synchronized关键字
  • Linux解决vim中文乱码问题
  • Spring AOP 是如何生效的(入口源码级解析)?
  • leetcode:HJ18 识别有效的IP地址和掩码并进行分类统计[华为机考][字符串]
  • 【Datawhale AI夏令营】mcp-server
  • [Python] Flask 多线程绘图时报错“main thread is not in main loop”的解决方案
  • 【unity实战】在Unity实现低耦合可复用的交互系统
  • 14. 请谈一下浏览器的强缓存和协商缓存
  • 基于大模型的鼻咽癌全周期预测及诊疗优化研究报告
  • YOLO家族内战!v5/v8/v10谁才是你的真命天子?(附保姆级选择指南)