当前位置：首页 > ai >正文

Linux系统编程——基础IO

ai 2025/8/12 10:03:37

一些前置知识：

文件 = 属性 + 内容

文件分为打开的文件、未打开的文件

打开的文件：由进程打开，本质是进程与文件的关系；维护的文件对象先加载文件属性，文件内容一般按需加载

未打开的文件：在永久性存储介质 —— 磁盘上；也需要被管理

C语言文件接口

fopen

打开文件并指定打开方式，返回 FILE* 文件对象指针

r：只读

w：写入、但在写入之前会清空文件； > 重定向也是使用 w 方法写入文件

a：追加，在文件结尾写入； >> 追加方法

fwrite

向已打开的 FILE 文件对象写入 size 字节的内容

stdin、stdout、stderr

C程序默认启动时，会打开 3 个标准输入输出流，分别是键盘文件和 2 个显示器文件

fprintf

向指定文件对象中写入

文件相关系统调用接口

未打开的文件存储在磁盘上，磁盘是外设，访问磁盘上的文件 —— 相当于在访问硬件；

几乎所有的库，只要是访问硬件设备相关，必定封装了系统调用

因为操作系统通过硬件驱动管理硬件，并向上层提供系统调用接口；

open

参数解读：

pathname：文件路径

int flags：系统提供了设置好的多个宏标志位，可以通过位或运算进行组合，以实现不同的文件打开方法（bit 位级别的标志位传递方式、有点类似位图了）

mode：以 8 进制的方式设置被打开文件的权限，但还要经过 umask 权限掩码的计算（最终权限 = 起始权限 & (~umask) ）

返回值：一个较小的非负整数，文件描述符 file descriptor

int fd = open("test.txt", O_WRONLY | O_CREAT, 0666);
if( fd < 0 )
{perror("open error");return 1;
}

close

int fd = open("test.txt", O_WRONLY | O_CREAT, 0666);
if( fd < 0 )
{perror("open error");return 1;
}close(fd);

write

int fd = open("logggggg.txt", O_WRONLY | O_CREAT | O_TRUNC, 0666);
int size_write = write(fd, "aaaaaaa", 3);	
close(fd);

默认从文件开始写，但不会清空原有内容，而是覆盖

小结

C文件相关库函数封装了系统调用 open、write、close

C库中使用自定义类型 FILE 类型的文件对象描述打开的文件，而系统调用中使用 文件描述符 fd

不论什么语言，底层都是这种封装系统调用的模式，向用户提供库函数，以便二次开发

文件描述符 fd

在 Linux 中，文件描述符就是一个小整数

当磁盘文件被加载到内存，内核为该进程创建 PCB，接着创建文件描述符表 struct files_struct，其中有存放文件对象指针的指针数组 struct file* fd_array[ ] ，接着打开 3 个默认的标准输入输出流 stdin、stdout、stderr，接着创建一个 struct file 自定义数据结构描述被打开文件的属性；如果一个进程打开多个文件，那就创建多个文件对象 struct file，用双链表指针互相组织起来 —— 对文件的操作就变成了对该文件对象的增删改查

通过从进程创建到打开文件捋一遍之后，文件描述符 fd 就是文件描述符表中指针数组的下标。

既然已经有文件描述符表来组织管理打开的文件对象 struct file，那各个 struct file 还用双链表结构组织是否多此一举？

非也，考虑了如果进程崩掉了之类的意外情况。

通过文件描述符表结构，将内核中的进程管理模块与文件管理模块解耦。

注意：除了内核默认打开的 3 个标准输入输出流文件，其余打开文件对象的指针 struct file* 依次按照文件描述符表的空闲的元素位置进行分配。

用系统调用操作 fd

例 read：从文件中读取 count 字节数据

char buff[100];
ssize_t s = read(0, buff, sizeof(buff));
buff[s] = '\0';
printf("echo : %s\n", buff);

从文件描述符为 0 的文件中读取 sizeof(buff) 大小的数据，并写入 buff 开始的缓冲区中：

根据运行结果，回车也被写入，因为此时 bash 内的缓冲区为行缓冲方式（见后文描述）

小结

为什么默认打开 stdin、stdout、stderr？

因为操作系统启动时，键盘、显示器就已经被操作系统识别并打开了，在其他进程被创建时，只需要将这三个已经被打开的文件对象struct file 的地址填进文件描述符表中，使用就 ok。

Linux 中的文件相关系统调用只认文件描述符，不同于 C 库中封装的自定义类型 FILE（但 FILE 中一定封装了文件描述符）

stdout 和 stderr 都指向显示器文件；

一个文件对象 struct file 可以被多个进程使用，例如 3 个默认的 stdin、stdout、stderr 可以被多个进程同时使用；所以 struct file 中会包含一个属性：引用计数

引用计数：记录有几个文件描述符指向自己；调用 close 会使该文件对象的 引用计数减 1，并且将这个进程的文件描述符表中的对应文件描述符下标的指针数组的元素置空，以供其他打开的文件使用；当被 close 的文件对象的引用计数为 1时，调用 close 会释放掉这个文件对象。

重定向

本质：对进程的文件描述符表中的地址进行内核级别的拷贝。

文件描述符的分配规则：从文件描述符表的 0 下标开始，寻找空闲位置存放新文件的文件对象指针。

输出重定向

示例：将本来写入显示器文件（文件描述符 1）的内容，写入文件描述符为 5 的文件

操作系统提供了系统调用接口，主要介绍 dup2 ：完成拷贝文件描述符下标对应的文件对象指针的工作

int fd = open("fdddddddd.txt", O_WRONLY | O_CREAT | O_TRUNC, 0666 );const char* str = "hello world forever!";//dup2(1, fd);dup2(fd, 1);
write(1, str, strlen(str));

追加重定向

与输出重定向一样，只是打开文件时的 flags 参数，再按位或 O_APPEND，就是向文件中追加内容，而不是清空掉原文件内容再写入

int fd = open("fdddddddd.txt", O_WRONLY | O_CREAT | O_APPEND, 0666 );const char* str = "hello world forever!";//dup2(1, fd);dup2(fd, 1);
write(1, str, strlen(str));

输入重定向

示例：本来要从 stdin 中读取数据，可以使用 dup2 系统调用接口，拷贝某个文件描述符对应的文件对象指针，转为从另一个文件中读取数据

int fd = open("fdddddddd.txt", O_CREAT | O_APPEND | O_RDONLY, 0666 );                                                                                                                                    char buff[100];dup2(fd, 0);
ssize_t s = read(0, buff, sizeof(buff));
buff[s] = '\0';printf("%s", buff);

成功将 fddddddd.txt 重定向到 0 号文件描述符，使得本应从 stdin 读取数据存入 buff，转为从 fdddddd.txt 中读取数据存入 buff。

注：如果把 stdout、stdin、stderr 给重定向，覆盖掉了，有办法找到这三个文件，再重定向回来即可恢复

为什么 stdout、stderr 都指向显示器，应用场景：

在分离正常日志与错误日志时非常有用：

另外，命令行输出重定向时，默认被重定向的是 1号文件描述符 stdout，可以省略不写。

注：程序替换 exce 接口功能，并不影响进程对文件的访问。

小结

硬件设备都可以被进程，以 open 打开访问，因为 Linux 下一切皆文件：

1、内核为进程创建 PCB —— task_struct，其中包含指针指向文件描述符表

2、文件描述符表这个指针数组中存放着 struct file* —— 文件对象的指针

3、对于所有外设（键盘、显示器、磁盘等硬件）来说，进程在打开它们并创建对应的 struct file 时，struct file 中有个自定义类型的指针指向 struct operation_func

4、struct operation_func 中有相应的读、写的函数指针，不同外设共用相同的 struct operation_func 结构（一般情况下）；读、写和其他方法的 函数指针，指向相应的外设的 具体底层驱动的函数方法实现，但这些对上层来说，是不用关心的；相同的函数指针却指向不同的方法实现，就像面向对象中的多态一样

5、struct operation_func 结构中有读、写等方法的函数指针，不同外设的底层驱动的方法实现，就会用来初始化这些函数指针。

对于 C 库中的 stdin、stdout、stderr：

内核在创建进程时就已经把 0、1、2 这三个描述符指向同一个终端设备；

C 库只是随后把这三个描述符包装成 FILE* 变量（stdin、stdout、stderr），并加了一层缓冲而已。

在 Linux 中，键盘输入、屏幕输出都被抽象成同一个“终端设备文件”，这个终端设备文件既提供读接口（用户敲的字符）又提供写接口（送到屏幕的文字），因此 0、1、2 三个文件描述符实际上都指向同一个 inode（同一个 struct file），只是分别用于读、写、写。

查看全文

http://www.xdnf.cn/news/17505.html