【Linux】环境变量与程序地址空间详解
前言:欢迎各位光临本博客,这里小编带你直接手撕Linux程序地址空间,文章并不复杂,愿诸君耐其心性,忘却杂尘,道有所长!!!!
**🔥个人主页:IF’Maxue-CSDN博客
🎬作者简介:C++研发方向学习者
📖**个人专栏:
《C语言》
《C++深度学习》
《Linux》
《数据结构》
《数学建模》**⭐️人生格言:生活是默默的坚持,毅力是永久的享受。不破不立,远方请直行!
文章目录
- 一、环境变量:系统的“运行说明书”
- 1. 为什么系统命令不用“找路”?靠PATH!
- 2. 环境变量从哪来?bash“读配置”来的
- 3. 常用环境变量:记这几个就够了
- 4. 操作环境变量:3个常用命令
- 5. 代码里怎么获取环境变量?3种方法
- 方法1:main函数的第三个参数envp
- 方法2:getenv函数(推荐!)
- 方法3:全局变量environ
- 二、程序地址空间:不是内存,是“虚拟地图”
- 1. C程序的地址空间划分
- 2. 关键:程序地址空间 ≠ 物理内存
一、环境变量:系统的“运行说明书”
你可以把环境变量理解成Linux系统的“小记事本”——里面记满了程序运行、系统操作需要的关键信息,比如“去哪找你要运行的程序”“现在登录的是谁”“当前在哪个文件夹”,有了它,系统和程序才知道该“怎么干活”。
1. 为什么系统命令不用“找路”?靠PATH!
你有没有好奇过:输入ls
“列出文件”、pwd
“看当前路径”时,为什么不用像自己写的程序那样输全路径(比如/home/xxx/myprogram
)?答案就是PATH环境变量。
- PATH的作用:专门记录“程序存放路径”的列表。系统执行
ls
这类命令时,会顺着PATH里的路径挨个找,找到对应的程序文件就运行,找不到就提示“命令不存在”。 - 怎么看PATH?用
echo $PATH
(注意$
是“调用环境变量”的符号),就像这张图里展示的:
图里用echo $PATH
输出的一串路径,就是系统找程序的“地图”。 - 验证一下:如果把PATH里的路径清空(比如
PATH=
),再输ls
就会提示“找不到命令”;再用PATH=$PATH:/bin
把/bin
(ls
所在的路径)加回去,ls
又能正常用了,就像这张图:
如果不小心改坏了PATH也别怕——重启电脑后,系统会重新加载配置,PATH就恢复原样了。
2. 环境变量从哪来?bash“读配置”来的
每次你登录Linux,系统会启动一个“命令解释器”——bash
(就是你输命令的窗口)。bash不会凭空生成环境变量,而是去读两个关键配置文件:bashrc
和profile
,从里面加载预设的环境变量。
- 多用户登录的情况:如果10个用户同时登录Linux,就会启动10个bash,每个bash都会读自己的配置文件,所以每个用户的环境变量可以不一样,就像这张图里的调用关系:
3. 常用环境变量:记这几个就够了
除了PATH,还有几个常用的环境变量,用echo $变量名
就能查看,对应这张图里的内容:
环境变量 | 作用(通俗说) | 例子 |
---|---|---|
USER | 当前登录的用户名 | echo $USER 输出 root 或你的用户名 |
HISTSIZE | 保存多少条历史命令 | 默认存1000条,输过的命令都在这 |
HOSTNAME | 这台电脑的“名字” | echo $HOSTNAME 看电脑名 |
PWD | 当前所在的文件夹路径 | 比如在/home ,就输出/home |
比如这张图里的PWD,就是当前的路径:
4. 操作环境变量:3个常用命令
环境变量分两种:本地变量(只有当前bash能用,子进程用不了)和环境变量(子进程也能继承),用以下命令切换和操作:
-
export:把本地变量变成环境变量
比如先定义一个本地变量a=123
,这时候运行子进程(比如自己写的程序)拿不到a
;用export a
之后,a
就变成环境变量,子进程也能访问了,就像这张图:
-
unset:删除环境变量
想删掉某个环境变量,比如a
,就输unset a
,之后echo $a
就看不到值了,对应这张图:
-
set:查看所有变量
输set
能看到所有本地变量和环境变量,方便排查问题。
5. 代码里怎么获取环境变量?3种方法
自己写C程序时,想拿到系统的环境变量,有3种常用方法:
方法1:main函数的第三个参数envp
main函数其实能接3个参数(不是只有int main()
!),第三个参数envp
是个字符串数组,每个元素都是一个环境变量(格式是“变量名=值”):
#include <stdio.h>
// argc:参数个数,argv:命令行参数,envp:环境变量列表
int main(int argc, char *argv[], char *envp[]) {// 循环打印所有环境变量int i = 0;while (envp[i] != NULL) {printf("%s\n", envp[i]);i++;}return 0;
}
就像这张图里的main函数参数说明:
方法2:getenv函数(推荐!)
想直接拿某个环境变量(比如PATH),用getenv("变量名")
最方便,返回值就是变量的值:
#include <stdio.h>
#include <stdlib.h> // getenv需要的头文件int main() {// 拿PATH环境变量的值char *path = getenv("PATH");// 拿USER环境变量的值char *user = getenv("USER");printf("PATH: %s\n", path);printf("USER: %s\n", user);return 0;
}
编译运行后,就能看到PATH和USER的值,对应这张图:
方法3:全局变量environ
系统有个全局二级指针environ
,专门存环境变量,需要用extern
声明后才能用:
#include <stdio.h>// 声明全局变量environ
extern char **environ;int main() {int i = 0;// 循环打印所有环境变量while (environ[i] != NULL) {printf("%s\n", environ[i]);i++;}return 0;
}
就像这张图里的environ说明:
二、程序地址空间:不是内存,是“虚拟地图”
你写C程序时,可能以为指针指向的是“物理内存地址”——其实不是!程序里的地址都是“虚拟地址”,而“程序地址空间”就是系统给进程画的一张“虚拟地图”。
1. C程序的地址空间划分
C程序运行时,代码和数据会被分到不同的“区域”,就像这张图里展示的:
用通俗的话解释这几个区域:
- 代码段:存你的代码(比如
printf
、main
函数),是“只读”的——你不能改代码里的内容,比如字符串常量"hello"
就存在这,像这张图里说的“字符串被编译成代码,只读”:
- 数据段:存全局变量和
static
变量(比如int g_val = 10;
、static int s_val = 20;
),程序一启动就分配空间。 - 堆:存你手动申请的内存(比如
malloc(10)
、new int
),需要自己free
或delete
释放。 - 栈:存函数里的局部变量(比如
int a = 5;
),函数结束后自动释放。
2. 关键:程序地址空间 ≠ 物理内存
很多人会把“程序地址空间”和“物理内存”搞混,其实它们的关系是:
- 程序地址空间 = 虚拟地址空间:是系统给进程分配的“地址范围”(比如0~4GB),进程以为自己独占这部分地址。
- 物理内存:电脑里真实的内存条(比如8GB、16GB),系统会把“虚拟地址”转换成“物理地址”,再去访问真实内存。
就像这张图里强调的:C/C++指针用的都是虚拟地址,程序地址空间是“系统概念”,不是“语言概念”:
简单说:进程拿着“虚拟地址”(地图上的位置),系统帮它找到“物理地址”(真实的房子),这样既能保护内存安全(进程看不到彼此的地址),又能高效利用内存。