当前位置：首页 > news >正文

linux_线程概念

news 2025/9/1 8:48:32

线程特征：是进程内的执行分支，线程的执行粒度，要比进程要细。

1.理解Linux线程

线程<=执行流<=进程

线程实际上是复用进程的数据结构和管理算法，进程的task struct，实际上是模拟线程，部分书中说Linux没有真正意义上的线程是不太准确的的，因为用进程模拟的线程，实际上复用了进程的内核的数据结构，从功能角度，Linux 的轻量级进程完全能实现线程的核心功能（如共享地址空间、并发执行），且用户态通过 pthread 库可屏蔽内核实现细节，对开发者而言与“真正的线程”无实质区别。因此，不能说 Linux“没有线程”，只是实现方式特殊。

在以往我们所谈到的进程中，操作系统其实是以进程为单位给我们分配资源，我们当前的进程的内部只有一个执行流。

在Linux的实现方案中，线程在进程内部执行，线程在进程的地址空间内运行。其原因是任何执行流要执行都要有资源，而地址空间是进程的资源窗口。同时线程的执行力度要比进程更细，其本质原因是线程执行进程的代码的一部分

2.线程和进程的定义

线程：线程操作系统调度的基本单位

进程：内核观点进程是承担分配系统资源的基本实体，进程=内核数据结构+代码和数据

执行流：执行流也是资源，因为线程是进程内部的执行力资源

3.重谈地址空间

X86的特点便是起始地址+类型=起始地址+偏移量

如int类型对该变量取地址，实际上拿到的是他的第1字节个地址

4.Linux线程的周边概念

以下从缓存（cache）相关过程和线程切换效率更高的原因两方面展开，结合图中 Linux 线程、进程的架构逻辑来讲：

一、缓存（cache）相关过程

图里的 “cache（缓存）”，核心是 CPU 缓存与进程/线程数据的关联：

- 程序运行时，CPU 会把高频访问的内存数据（比如进程/线程的指令、常用变量等）暂存到 CPU 缓存里。这样做是为了 减少 CPU 直接访问物理内存的次数（内存读写速度远低于 CPU 运算速度，缓存能当 “高速中转站”）。
- 对进程/线程来说，这些缓存里的 “热数据” 是它们高效运行的基础。比如线程执行时，常用的 task_struct  部分信息、虚拟内存映射的关键数据，可能就存在缓存里，CPU 直接从缓存取数据，能大幅加快执行效率。

简单说，缓存就是给 CPU 快速 “存取常用数据” 开的 “绿色通道” ，让进程/线程跑起来更流畅，少等内存读写的 “延迟”。

二、线程切换效率更高的原因

从图中 Linux 进程、线程的架构（共享虚拟地址空间、 task_struct  等）来看，线程切换比进程切换 “更轻量”，核心原因在这两点：

1. 地址空间 & 资源共享层面

- 进程切换：
进程有独立的虚拟地址空间（ mm_struct  管理），切换时，CPU 缓存里的旧进程地址、数据会被 “清空/替换” ，还要重新加载新进程的页表、地址空间等一大堆资源（相当于换了一套全新的 “运行环境”），这一步特别耗时。
- 线程切换：
同一进程里的线程共享虚拟地址空间（ mm_struct  是共用的）！切换时，不需要动页表、地址空间这些 “大块头”，缓存里的热数据（比如进程内共享的代码、全局变量缓存）大概率还能用，省去了重新加载地址空间的巨大开销。

2. PCB（ task_struct ）切换层面

- 进程切换：
除了地址空间，进程的 task_struct  里还得处理一大堆独立资源（文件描述符、信号量等），切换时要把这些状态全部 “保存 - 恢复”，流程复杂、耗时多。
- 线程切换：
线程的 task_struct  虽然也有自己的执行上下文（比如寄存器状态、程序计数器），但共享了进程级的大部分资源（文件、信号等）。切换时，主要就是改改寄存器、程序计数器这些 “小状态”，比起进程切换要简单得多，自然更快。

总结一下：

- 缓存过程是 CPU 为了加速程序运行，把常用数据临时存在 “高速缓存” 里；
- 线程切换更快，是因为线程共享了进程的地址空间、大部分资源，切换时不用像进程那样 “大动干戈” 换地址空间、重新加载大量资源，所以效率更高。
需要注意的是线程有属于自己的上下文和栈

5.线程的优缺点：一把双刃剑

（一）线程的优点

1. 创建与切换成本低：创建新线程比创建新进程划算多了。打个比方，创建进程就像在电脑里“新建”一个独立的软件环境，要分配很多资源；而线程就像是在同一个软件里开个“小分支”，资源共享，所以轻松不少。线程切换时，操作系统要做的工作也少，就像在同一个房间里换个角落干活，比跑到另一个房间方便。

2. 资源占用少：线程占的资源比进程少很多，这样就能同时运行更多线程，充分利用 CPU 的多核能力，让程序跑得更快。

3. 提升程序效率：要是程序需要等待慢速的 I/O 操作（比如读写文件、网络请求），线程可以在等待的时候去做别的任务，不浪费时间。对于计算密集型任务，把计算拆分成多个线程，能让多核 CPU 一起发力；对于 I/O 密集型任务，多个线程同时等待不同的 I/O 操作，也能提高整体性能。

（二）线程的缺点

1. 性能损失：如果有很多计算密集型线程，处理器忙不过来，线程之间切换和同步会增加额外开销，就像好几个人挤在一个小房间干活，互相干扰，效率反而变低。

2. 健壮性降低：写多线程程序得特别小心。线程之间时间分配的小偏差，或者不小心共享了不该共享的变量，都可能出问题。而且线程之间缺乏保护，一个线程出问题，可能连累整个程序。

3. 缺乏访问控制：进程是访问控制的基本单位，线程里调用一些操作系统函数，可能影响整个进程，就像一个线程在“大团队”里搞破坏，会牵连所有人。

4. 编程难度高：多线程程序又难写又难调试。要考虑线程同步、竞争条件这些问题，稍微不注意就出错，比单线程程序复杂多了。

查看全文

http://www.xdnf.cn/news/1107379.html