当前位置: 首页 > news >正文

从内核到应用层:Linux缓冲机制与语言缓冲区的协同解析

系列文章目录


文章目录

  • 系列文章目录
  • 前言
  • 一、缓冲区
    • 1.1 示例1
    • 1.2 缓冲区的概念
  • 二、缓冲区刷新方案
  • 三、缓冲区的作用及存储


前言

上篇我们介绍了,文件的重定向操作以及文件描述符的概念,今天我们再来学习一个和文件相关的知识-----------用户缓冲区。
在操作系统中,缓冲区是实现高效资源管理的关键进制,缓冲区可以帮助用户、系统暂存读取及写入数据,规避了用户频繁的I/O操作,可以很好的提高系统的性能和用户的体验。


一、缓冲区

由于我们对缓冲区接触的比较少,所以在讲解这部分知识时,我们会引入大量的代码示例,后面我们会对这些示例及结果逐一分析。

1.1 示例1

下列函数均向标准输出打印

    1 #include<stdio.h>2 #include<string.h>3 #include<unistd.h>4 int main()5 {6   char *fstr="hello fwrite\n";7   char *wstr="hello witer\n";8   //c函数9   printf("hello printf\n");10   fprintf(stdout,"hello fprintf\n");11   fwrite(fstr,1,strlen(fstr),stdout);                                                                                           12   //系统调用接口                                                                                                       13   write(1,wstr,strlen(wstr));                                                                                          14   return 0;                                                                                                            15 }   

执行结果1:
在这里插入图片描述
将输出重定向至log1.txt

./myfile >log1.txt

执行结果2:
在这里插入图片描述
到现在执行结果都是我们可以接受的,不要着急继续向下看。

    1 #include<stdio.h>2 #include<string.h>3 #include<unistd.h>4 int main()5 {6   char *fstr="hello fwrite\n";7   char *wstr="hello witer\n";8   //c函数9   printf("hello printf\n");10   fprintf(stdout,"hello fprintf\n");11   fwrite(fstr,1,strlen(fstr),stdout);12   //系统调用接口13   write(1,wstr,strlen(wstr));14   fork();                                                                                                                       15   return 0;                                                 16 }       

我们在文件末尾处创建了一个子进程,重复上面实验:
执行结果3:
在这里插入图片描述
将文件重定向输入到log2.txt

./myfile >log2.txt

执行结果4:
在这里插入图片描述
通过和前三次执行结果对比,我们可以看到向文件log2.txt打印的结果,库函数打印了两次,系统调用接口只打印了一次,通过对比结果2和结果4,我们可以知道一定是fork()函数产生的影响,那么为什么fork()没有对结果3产影响呢?带着这两问题我们继续往下看。

1.2 缓冲区的概念

我们接着来看下面这两个示例:

    1 #include<stdio.h>                                            2 #include<string.h>                                           3 #include<unistd.h>                                           4 int main()                                                   5 {                                                            6   char *fstr="hello fwrite\n";                               7   char *wstr="hello witer\n";                                8   //c函数                                                    9   printf("hello printf\n");                                  10   fprintf(stdout,"hello fprintf\n");                         11   fwrite(fstr,1,strlen(fstr),stdout);                        12   //系统调用接口13   write(1,wstr,strlen(wstr));                                                                                                   14   //fork();15   close(1);16   return 0;                      17 }

当执行完上面四个调用后我们使用close()函数关闭文件描述符1的文件。
在这里插入图片描述
此时并没有对程序执行结果造成影响,下面我们将\n全部去掉,继续执行程序。

    1 #include<stdio.h>2 #include<string.h>3 #include<unistd.h>4 int main()5 {6   char *fstr="hello fwrite";7   char *wstr="hello witer";8   //c函数9   printf("hello printf");10   fprintf(stdout,"hello fprintf");                                                                                              11   fwrite(fstr,1,strlen(fstr),stdout);12   //系统调用接口13   write(1,wstr,strlen(wstr));14   //fork();15   close(1);16   return 0;17 }

在这里插入图片描述
可以看到此时只有系统调用接口成功将内容打印了出来,这又是怎么回事呢,相信大家早在学习C语言时,就听说过缓冲区,下面我们就来慢慢的回答上面一系列问题。

在这里插入图片描述

结合下面的解释看这个图,一定要仔细看,精华全在图上!!!!!
首先我们要清楚的一点是,printf/fprintf/fwrite全部是封装的系统调用write。在我们的内核中,进程会拥有对于的task_struct结构体,这个结构体对象包含一个文件结构体指针(上篇我们讲了,这里我们认为此时它指向显示器文件的file对象),通过这个文件对象可以找到内核缓冲区,所以的输入、输出,都需要经过这个缓冲区才能到达对应的磁盘中(包含硬件设备),当我们在执行C语言函数时,结果并不会直接打印在屏幕上,而是先存入C语言的缓存区,这一点通过上面的示例也能感受到,当程序执行到合适的时间,就会调用系统接口writewrite通过文件描述符找到对应的文件对象,然后才能将c语言缓冲区的内容输出到内核缓冲区,当数据到达内核缓冲区,符合条件,就会被刷新到显示器上(磁盘),这个条件我们后面会介绍。

当程序执行系统调用write时,它会根据我们给他提供的文件描述符,找到对应的文件对象,直接将内容输出到内核缓冲区。有了这些概念,我们来分析上面代码。
在这里插入图片描述
当我们执行的程序执行c函数时,它会先将内容存入C语言的缓冲区,但程序执行系统调用时,他是将内容直接刷新到了系统缓冲区,程序继续向下执行close(1)显示器文件被关闭,此时c函数调用系统调用write想要将处在C语言缓冲区的数据输出道系统缓冲区,但是此时write已经无法找到显示器结构体对象了,素以无法实现,最后程序结束,系统缓冲区被刷新到显示器,结果表现为只有系统调用打印成功。到了这里我们算是回答了一个问题,那么为什么打印数据后加\n,就可以输出成功呢?要回答这个问题我们就要来谈一谈缓冲区刷新方案了。

二、缓冲区刷新方案

在这里我们只谈C语言的缓冲区刷新方案,我们将这种语言及的缓冲区称为用户及缓冲区(每个语言都会提供)。
缓冲区刷新方案主要有三种:

  • 无缓冲-------直接刷新
  • 行缓冲--------不刷新,直到碰见\n(一般为向显示器打印时采用)
  • 全缓冲----------缓冲区满了,才刷新(一般为向文件打印时采用)

此外当程序执行结束后也会进行刷新。

现在我们可以来回答为什么,这里不受文件关闭的影响了。
在这里插入图片描述

当程序执行C函数时,会先将数据存入用户及缓冲区,但用户及缓冲区判断数据存在\n就会立即调用write将数据刷新到系统的缓冲区(此时文件还没有关闭)。

下面我们来回答这个问题

在这里插入图片描述
为什么我们对程序进行重载后,C函数的结果打印了两次。
在这里插入图片描述
当执行这个程序时,我们对他它重定向到文件,此时缓冲区刷新方案由之前的行缓冲变为全缓冲,所以c函数的执行结果会被存储在用户级缓冲区,而write的执行结果则会直接存入系统缓冲区,此时创建子进程,程序结束时,父进程要调用write将用户级缓冲区数据刷新到系统缓冲区上(这个行为会将用户及缓冲区数据清空),触发写时拷贝,子进程结束后也会将数据刷新,这时就有两份数据打印到了文件中。

不知道大家有没有注意到,我们上面例子的结果打印顺序,也出现了变化,刚刚的这个逻辑同样能解释这个问题,到了这里我们算是将问题都解决了

三、缓冲区的作用及存储

提高用户效率

在我们调用C函数向显示器或文件写入数据时,若没有缓冲区存在,其底层就会不断的去调用write函数,执行效率较低。

配合格式化

我们学习的printf/fprintf等函数,都是格式化输出函数(如使用%d格式化数据)但是在操作系统中并没有整形、浮点型等概念,在向显示器或文件打印时统一被作为字符输出,所以用户级缓冲区的作用就是将数据格式化处理后,再交有系统接口。

在这里插入图片描述
用户级缓冲区存储位置

用户缓冲区实际是被定义再FILE结构体中的。

http://www.xdnf.cn/news/881173.html

相关文章:

  • 数据集-目标检测系列- 猴子 数据集 monkey >> DataBall
  • 数字孪生在建设智慧城市中可以起到哪些作用或帮助?
  • Go语言底层(三): sync 锁 与 对象池
  • 结合Jenkins、Docker和Kubernetes等主流工具,部署Spring Boot自动化实战指南
  • 如何通过外网访问内网?哪个方案比较好用?跨网远程连接网络知识早知道
  • 在Docker里面运行Docker
  • Windows11:解决近期更新后无法上网的问题
  • .net ORM框架dapper批量插入
  • 案例分享--汽车制动卡钳DIC测量
  • PDF 转 HTML5 —— HTML5 填充图形不支持 Even-Odd 奇偶规则?(第二部分)
  • 智慧赋能:新能源汽车充电桩应用现状与管理升级方案
  • 矩阵分解相关知识点总结(二)
  • Playwright 测试框架 - Java
  • 【缺陷】温度对半导体缺陷电荷态跃迁能级的影响
  • React 样式方案与状态方案初探
  • AiPy实战:10分钟用AI造了个音乐游戏!
  • c++ 通过XOR自己实现一个对称分组加密算法
  • 谷歌披露威胁组织攻击方式:伪造Salesforce数据加载器实施钓鱼攻击
  • 使用 uv 工具快速部署并管理 vLLM 推理环境
  • [10-1]I2C通信协议 江协科技学习笔记(17个知识点)
  • 网站首页菜单两种布局vue+elementui顶部和左侧栏导航
  • 为什么需要自动下载浏览器驱动?
  • Linux(13)——Ext系列⽂件系统
  • Amazing晶焱科技:电子系统产品在多次静电放电测试后的退化案例
  • RKNN3588上部署 RTDETRV2
  • Day45
  • [Git] 分布式版本控制 远程仓库协作
  • C语言输入函数
  • 1、Go语言基础中的基础
  • Django之表格上传