当前位置: 首页 > ai >正文

Linux系统编程——基础IO

一些前置知识:

文件 = 属性 + 内容

文件 分为 打开的文件、未打开的文件

打开的文件:由进程打开,本质是 进程与文件 的关系;维护的文件对象先加载文件属性,文件内容一般按需加载

未打开的文件:在永久性存储介质 —— 磁盘上;也需要被管理

C语言文件接口

fopen

打开文件并指定打开方式,返回 FILE* 文件对象指针

r:只读

w:写入、但在写入之前会清空文件;  > 重定向也是使用 w 方法写入文件

a:追加,在文件结尾写入; >> 追加方法

fwrite

向已打开的 FILE 文件对象写入 size 字节的内容

stdin、stdout、stderr

C程序默认启动时,会打开 3 个标准输入输出流,分别是 键盘文件 和 2 个显示器文件

fprintf

向指定文件对象 中写入

文件相关系统调用接口

未打开的文件存储在 磁盘上,磁盘是 外设,访问磁盘上的文件 —— 相当于在 访问硬件;

几乎所有的库,只要是 访问硬件设备相关,必定封装了系统调用

因为 操作系统 通过 硬件驱动 管理硬件,并向上层提供 系统调用接口;

open

参数解读

pathname:文件路径

int flags:系统提供了设置好的多个 宏 标志位,可以 通过 位或运算 进行组合,以实现不同的 文件打开方法(bit 位级别的 标志位传递方式、有点类似位图了)

mode:以 8 进制的方式 设置被打开文件的权限,但还要经过 umask 权限掩码的计算( 最终权限 = 起始权限 & (~umask)

返回值:一个较小的非负整数,文件描述符 file descriptor

int fd = open("test.txt", O_WRONLY | O_CREAT, 0666);
if( fd < 0 )
{perror("open error");return 1;
}

close

int fd = open("test.txt", O_WRONLY | O_CREAT, 0666);
if( fd < 0 )
{perror("open error");return 1;
}close(fd);

write

int fd = open("logggggg.txt", O_WRONLY | O_CREAT | O_TRUNC, 0666);
int size_write = write(fd, "aaaaaaa", 3);	
close(fd);

默认从文件开始写,但不会清空原有内容,而是覆盖

小结

C文件相关库函数 封装了系统调用 open、write、close

C库中使用 自定义类型 FILE 类型的文件对象描述打开的文件,而系统调用中 使用 文件描述符 fd

不论什么语言,底层都是这种 封装系统调用的 模式,向用户提供 库函数,以便二次开发

文件描述符 fd

在 Linux 中,文件描述符 就是一个 小整数

当磁盘文件被加载到内存,内核为该进程创建 PCB,接着创建文件描述符表 struct files_struct,其中有 存放文件对象指针的 指针数组 struct file* fd_array[ ] ,接着打开 3 个默认的标准输入输出流 stdin、stdout、stderr,接着创建一个 struct file 自定义数据结构 描述被打开文件的属性;如果一个进程打开多个文件,那就创建多个文件对象 struct file,用 双链表指针 互相组织起来 —— 对文件的操作就变成了对该文件对象的 增删改查

通过从进程创建 到 打开文件捋一遍之后,文件描述符 fd 就是 文件描述符表 中 指针数组的 下标。

既然已经有文件描述符表来组织管理 打开的文件对象 struct file,那各个 struct file 还用双链表结构组织是否多此一举?

非也,考虑了如果进程崩掉了之类的意外情况。

通过 文件描述符表 结构,将 内核中的 进程管理模块 与 文件管理模块 解耦

注意:除了 内核 默认打开的 3 个标准输入输出流文件,其余打开文件对象的指针 struct file* 依次按照文件描述符表的 空闲的 元素位置 进行分配。

用 系统调用 操作 fd

例 read:从文件中读取 count 字节数据

char buff[100];
ssize_t s = read(0, buff, sizeof(buff));
buff[s] = '\0';
printf("echo : %s\n", buff);

从文件描述符为 0 的文件中读取 sizeof(buff) 大小的数据,并写入 buff 开始的缓冲区中:

根据运行结果,回车也被写入,因为此时 bash 内的缓冲区为 行缓冲方式(见后文描述)

小结

为什么默认打开 stdin、stdout、stderr?

因为 操作系统启动时,键盘、显示器就已经被 操作系统 识别并打开了,在 其他进程被创建时,只需要将这三个 已经被打开的 文件对象struct file 的地址 填进 文件描述符表 中,使用就 ok。

Linux 中的文件相关 系统调用 只认文件描述符,不同于 C 库中封装的自定义类型 FILE(但 FILE 中一定封装了 文件描述符)

stdout 和 stderr 都指向显示器文件;

一个文件对象 struct file 可以被多个进程使用,例如 3 个默认的 stdin、stdout、stderr 可以被多个进程同时使用;所以 struct file 中会包含一个属性:引用计数

引用计数:记录有几个文件描述符 指向自己;调用 close 会使该文件对象的 引用计数 减 1,并且将 这个进程的 文件描述符表 中的 对应文件描述符下标 的指针数组 的元素 置空,以供其他打开的文件使用; 当被 close 的文件对象的引用计数为 1时,调用 close 会释放掉这个 文件对象。

重定向

本质:对进程的 文件描述符表 中的地址 进行内核级别的 拷贝。

文件描述符的分配规则:从文件描述符表的 0 下标开始,寻找空闲位置存放 新文件的 文件对象指针。

输出重定向

示例:将 本来写入显示器文件(文件描述符 1)的内容,写入 文件描述符为 5 的文件

操作系统提供了 系统调用接口,主要介绍 dup2 :完成 拷贝文件描述符下标对应的 文件对象指针 的工作

int fd = open("fdddddddd.txt", O_WRONLY | O_CREAT | O_TRUNC, 0666 );const char* str = "hello world forever!";//dup2(1, fd);dup2(fd, 1);
write(1, str, strlen(str));

追加重定向

与输出重定向一样,只是打开文件时 的 flags 参数,再按位或 O_APPEND,就是向文件中追加内容,而不是 清空掉原文件内容 再写入

int fd = open("fdddddddd.txt", O_WRONLY | O_CREAT | O_APPEND, 0666 );const char* str = "hello world forever!";//dup2(1, fd);dup2(fd, 1);
write(1, str, strlen(str));

输入重定向

示例:本来要从 stdin 中读取数据,可以使用 dup2 系统调用接口,拷贝 某个文件描述符对应的 文件对象指针,转为 从 另一个文件中读取数据

int fd = open("fdddddddd.txt", O_CREAT | O_APPEND | O_RDONLY, 0666 );                                                                                                                                    char buff[100];dup2(fd, 0);
ssize_t s = read(0, buff, sizeof(buff));
buff[s] = '\0';printf("%s", buff);

成功将 fddddddd.txt 重定向到 0 号文件描述符,使得本应从 stdin 读取数据存入 buff,转为 从 fdddddd.txt 中读取数据 存入 buff。

:如果把 stdout、stdin、stderr 给重定向,覆盖掉了,有办法找到这三个文件,再重定向回来即可恢复

为什么 stdout、stderr 都指向显示器,应用场景

在分离正常日志与错误日志时非常有用:

另外,命令行输出重定向时,默认被重定向的是 1号 文件描述符 stdout,可以省略不写。

:程序替换 exce 接口功能,并不影响进程对 文件的访问。

小结

硬件设备都可以被进程,以 open 打开访问,因为 Linux 下一切皆文件:

1、内核为 进程创建 PCB —— task_struct,其中包含指针 指向文件描述符表

2、文件描述符表 这个指针数组中 存放着 struct file* —— 文件对象的指针

3、对于所有外设(键盘、显示器、磁盘等硬件)来说,进程在 打开它们并创建对应的 struct file 时,struct file 中有个自定义类型的指针 指向 struct operation_func

4、struct operation_func 中有相应的 读、写 的函数指针,不同外设共用相同的 struct operation_func 结构(一般情况下);读、写和其他方法的 函数指针指向相应的外设的 具体底层驱动的 函数方法实现,但这些对上层来说,是不用关心的;相同的函数指针 却指向 不同的方法实现,就像面向对象中的 多态一样

5、struct operation_func 结构中 有 读、写等方法的函数指针,不同外设的 底层驱动的 方法实现,就会用来 初始化这些 函数指针。

对于 C 库中的 stdin、stdout、stderr:

内核在创建进程时就已经把 0、1、2 这三个描述符指向同一个终端设备

C 库只是随后把这三个描述符包装成 FILE* 变量(stdin、stdout、stderr),并加了一层缓冲而已。

在 Linux 中,键盘输入、屏幕输出都被抽象成同一个“终端设备文件”,这个终端设备文件既提供读接口(用户敲的字符)又提供写接口(送到屏幕的文字),因此 0、1、2 三个文件描述符实际上都指向同一个 inode(同一个 struct file),只是分别用于读、写、写。

http://www.xdnf.cn/news/17505.html

相关文章:

  • 《录井管理与工程》书籍第一章要点及相应思考
  • 虚幻GAS底层原理解剖十 (网络)
  • 深度剖析 Linux 信号:从基础概念到高级应用,全面解析其在进程管理与系统交互中的核心作用与底层运行机制
  • Orange的运维学习日记--39.Nginx详解与服务部署
  • 【liunx】web高可用---nginx
  • GSON 框架下百度天气 JSON 数据转 JavaBean 的实战攻略
  • ZooKeeper和Reids做分布式锁的区别?
  • Notepad--:国产跨平台文本编辑器,Notepad++ 的理想替代方案
  • 车载软件架构 --- 车辆量产后怎么刷写Flash Bootloader
  • 【数据结构入门】二叉树(1)
  • Redis7 GEO功能介绍与电商场景案例解析
  • Android模块化架构深度解析:从设计到实践
  • HTML5中华美食网站源码
  • (Arxiv-2025)Phantom-Data:迈向通用的主体一致性视频生成数据集
  • LangChain框架之 invoke() 方法
  • 【SpringBoot】02 基础入门-什么是Spring Boot?:Spring与SpringBoot
  • CLIP在文生图模型中的应用
  • Unity笔记(五)知识补充——场景切换、退出游戏、鼠标隐藏锁定、随机数、委托
  • redis笔记(二)
  • 深入解析游戏引擎(OGRE引擎)通用属性系统:基于Any类的类型安全动态属性设计
  • 《深度剖析前端框架中错误边界:异常处理的基石与进阶》
  • Rust 实战五 | 配置 Tauri 应用图标及解决 exe 被识别为威胁的问题
  • 麒麟系统使用-PATH设置
  • 【96页PPT】华为IPD流程管理详细版(附下载方式)
  • 34-Hive SQL DML语法之查询数据-3
  • 游戏盾是什么?
  • Vibe Coding 自然语言驱动 AI 编程方式
  • 在Linux中部署tomcat
  • Android Coil3视频封面抽取封面帧存Disk缓存,Kotlin
  • 自然语言处理实战:用LSTM打造武侠小说生成器