当前位置：首页 > news >正文

Linux ELF文件详解：深入理解可执行文件格式

news 2025/6/13 0:23:50

今天，我想和大家分享一个非常核心的概念——ELF文件格式。这是Linux系统中可执行文件、目标文件和共享库的标准格式，理解它对于掌握Linux程序的编译、链接和加载过程至关重要。

ELF文件是什么？

ELF (Executable and Linkable Format) 是Linux系统下的可执行与可链接格式，它定义了二进制文件的结构，使操作系统能够正确地加载、执行程序。简单来说，当我们编译C/C++程序后，生成的可执行文件就是ELF格式的。

ELF文件可以分为三种主要类型：

可执行文件：可以直接运行的程序

可重定位文件：编译后的目标文件(.o)，需要链接后才能执行

共享目标文件：动态库(.so)，可以在运行时被动态链接

ELF文件的整体结构

ELF文件的结构可以从两个视角来看：

1. 链接视图（Linking View）

链接视图关注的是如何将多个目标文件链接成一个可执行文件，主要包含以下部分：

2. 执行视图（Execution View）

执行视图关注的是程序如何被加载到内存中执行，主要包含：

ELF文件的主要组成部分

1. ELF头部（ELF Header）

ELF头部位于文件开始处，包含了描述整个文件的基本信息，如：

魔数（Magic Number）：标识文件为ELF格式

文件类型：可执行文件、可重定位文件或共享目标文件

目标机器架构：如x86、ARM等

入口点地址：程序开始执行的位置

程序头表和节头表的位置和大小

我们可以使用readelf -h命令查看ELF头部信息：

$ readelf -h helloELF Header:Magic:   7f 45 4c 46 02 01 01 00 00 00 00 00 00 00 00 00 Class:                             ELF64Data:                              2's complement, little endianVersion:                           1 (current)OS/ABI:                            UNIX - System VABI Version:                       0Type:                              EXEC (Executable file)Machine:                           Advanced Micro Devices X86-64Version:                           0x1Entry point address:               0x401040Start of program headers:          64 (bytes into file)Start of section headers:          13944 (bytes into file)Flags:                             0x0Size of this header:               64 (bytes)Size of program headers:           56 (bytes)Number of program headers:         13Size of section headers:           64 (bytes)Number of section headers:         31Section header string table index: 30

2. 程序头部表（Program Header Table）

程序头部表描述了如何将文件中的段映射到进程的虚拟地址空间，主要用于可执行文件和共享库。每个表项描述一个段或其他必要信息。

使用readelf -l命令可以查看程序头部表：

$ readelf -l helloElf file type is EXEC (Executable file)Entry point 0x401040There are 13 program headers, starting at offset 64Program Headers:Type           Offset             VirtAddr           PhysAddrFileSiz            MemSiz              Flags  AlignPHDR           0x0000000000000040 0x0000000000400040 0x00000000004000400x00000000000002d8 0x00000000000002d8  R      0x8INTERP         0x0000000000000318 0x0000000000400318 0x00000000004003180x000000000000001c 0x000000000000001c  R      0x1[Requesting program interpreter: /lib64/ld-linux-x86-64.so.2]LOAD           0x0000000000000000 0x0000000000400000 0x00000000004000000x0000000000000898 0x0000000000000898  R      0x1000...

3. 节（Sections）

节是ELF文件中存储实际数据的区域，不同的节存储不同类型的数据：

.text：存储程序的可执行代码

.data：存储已初始化的全局变量和静态变量

.bss：存储未初始化的全局变量和静态变量（不占用实际文件空间）

.rodata：存储只读数据，如字符串常量

.symtab：符号表，存储函数和变量的信息

.strtab：字符串表，存储符号名称

.rel.text：代码重定位表

.rel.data：数据重定位表

.debug：调试信息

使用readelf -S命令可以查看所有节的信息：

$ readelf -S helloThere are 31 section headers, starting at offset 0x3678:Section Headers:[Nr] Name              Type             Address           OffsetSize              EntSize          Flags  Link  Info  Align[ 0]                   NULL             0000000000000000  000000000000000000000000  0000000000000000           0     0     0[ 1] .interp           PROGBITS         0000000000400318  00000318000000000000001c  0000000000000000   A       0     0     1[ 2] .note.gnu.build-i NOTE             0000000000400338  000003380000000000000024  0000000000000000   A       0     0     8...

4. 节头表（Section Header Table）

节头表包含了所有节的信息，如名称、大小、类型、位置等。链接器使用这些信息来定位和访问各个节。

ELF文件的加载过程

当我们执行一个ELF可执行文件时，操作系统会经历以下步骤：

读取ELF头部：验证文件格式并获取基本信息
加载程序头部表：了解如何将文件映射到内存
创建内存映射：根据程序头部表将文件的各个段映射到虚拟内存
加载动态链接器：如果程序是动态链接的，加载动态链接器（ld.so）
重定位：解析程序中的符号引用
初始化：执行程序的初始化代码
跳转到入口点：开始执行程序的main函数

ELF文件的实用工具

Linux提供了多种工具来分析和操作ELF文件：

readelf：显示ELF文件的完整信息

objdump：反汇编目标文件

nm：列出符号表信息

strip：移除符号表和调试信息

ldd：显示程序依赖的共享库

objcopy：复制和转换目标文件

实际案例：分析一个简单的C程序

让我们通过一个简单的C程序来展示ELF文件的结构：

// hello.c#include <stdio.h>int global_var = 42;static int static_var = 100;int main() {printf("Hello, ELF world! Global: %d, Static: %d\n", global_var, static_var);return 0;}

编译并分析：

$ gcc -o hello hello.c$ file hellohello: ELF 64-bit LSB shared object, x86-64, version 1 (SYSV), dynamically linked, ...$ readelf -h hello  # 查看ELF头部$ readelf -l hello  # 查看程序头部表$ readelf -S hello  # 查看节头表$ objdump -d hello  # 反汇编代码段$ nm hello          # 查看符号表$ ldd hello         # 查看动态依赖