当前位置: 首页 > ops >正文

#Linux内存管理# 详细介绍madvise函数的工作原理

madvise() 是 Linux 系统提供的 内存访问模式建议机制,允许进程向内核传递内存使用意图,帮助优化内存管理(如预读、缓存释放等)。下面通过一个读取大文件的代码案例详细说明其工作原理:

 

示例场景:顺序读取大文件

#include <fcntl.h>

#include <sys/mman.h>

#include <sys/stat.h>

#include <stdio.h>

#include <unistd.h>

 

int main() {

    int fd = open("large_file.txt", O_RDONLY); // 打开大文件

    struct stat sb;

    fstat(fd, &sb);

    size_t len = sb.st_size; // 文件大小

 

    // 将文件映射到内存 (只读)

    char *addr = mmap(NULL, len, PROT_READ, MAP_PRIVATE, fd, 0);

    close(fd);

 

    // 关键建议:告知内核将顺序访问内存

    madvise(addr, len, MADV_SEQUENTIAL);

 

    // 顺序访问文件内容 (避免换行符干扰计算)

    size_t sum = 0;

    for (size_t i = 0; i < len; i++) {

        if (addr[i] != '\n') sum += addr[i]; // 伪操作示例

    }

 

    // 清理

    munmap(addr, len);

    printf("Data sum: %zu\n", sum);

    return 0;

}

 

 

madvise() 核心工作流程

 

1. 内核预读优化

 

当设置 MADV_SEQUENTIAL 时:

 

内核提前预读后续内存分页(如顺序预读256KB)

 

后台自动释放已访问过的页面(因顺序访问后不再需要)

 

2. 内存管理调整

 

页缓存策略:内核减少对历史页的缓存(标记为低优先级)

 

换页机制:若内存不足,优先换出已访问过的页面

 

3. 系统调用开销对比

 

策略 未用 madvise 使用 MADV_SEQUENTIAL

预读触发 按需4KB读取 提前读取256KB

缺页中断次数 高 (频繁触发) 减少60%~80%

缓存驻留 全文件缓存 仅保留最新访问区块

总耗时 慢 (1.5x) 快 (基准)

 

其他重要策略说明

 

// 常用advice参数及其作用

madvise(addr, len, MADV_RANDOM); // 随机访问(禁用预读)

madvise(addr, len, MADV_WILLNEED); // 提前加载到内存(预取)

madvise(addr, len, MADV_DONTNEED); // 立即释放物理内存

madvise(addr, len, MADV_FREE); // 异步释放(内存不足时自动回收)

 

 

内核底层机制

 

1.缺页中断处理

 

 进程访问未映射的虚拟页 → 触发缺页中断

 

 内核检查 VMA 的 vm_flags (含 madvise 建议)

 

 根据建议选择预读策略(如 MADV_SEQUENTIAL 触发激进预读)

 

2.页面回收机制

 

# 查看内核回收日志(需启用调试)

dmesg | grep "vmscan"

 

 

内核在内存不足时启动回收

 

MADV_SEQUENTIAL 区域标记为 优先回收

 

3.LRU链表调整

 

活动匿名页链表 (Active_anon) ← 新访问页

     ↓

非活动匿名页链表 (Inactive_anon) ← MADV_SEQUENTIAL访问后的页

     ↓

回收器优先选择此链淘汰

 

 

注意事项

 

1.权限要求:地址必须对齐到页边界(sysconf(_SC_PAGE_SIZE))

 

2.异步性:建议可能延迟生效(MADV_DONTNEED 除外)

 

3.性能敏感:在 GB 级数据处理时效果显著,小数据无必要

 

4.监控工具:

perf stat -e page-faults,dTLB-load-misses ./program

 

 

关键结论:madvise() 是 高性能内存访问的隐式调度器,通过改变内核预读/缓存策略降低缺页中断,在流式处理/数据库场景中可提升30%+效率。

http://www.xdnf.cn/news/16085.html

相关文章:

  • 突发限制下的破局之路:国产之光 Lynx 重构 AI 开发安全壁垒
  • day 33打卡
  • 基于MCP架构的LLM-Agent融合—构建AI Agent的技术体系与落地实践
  • C++(面向对象封装、继承、多态)
  • Hexo - 免费搭建个人博客03 - 将个人博客托管到github,个人博客公开给大家访问
  • 从 Shell 脚本到 Go 应用:使用 Kiro AI 助手完成 Harpoon 项目重构的完整实践
  • OMS监考系统V2版本无法启动问题解决办法
  • 单片机-----基础知识整合
  • 人工智能——Opencv图像色彩空间转换、灰度实验、图像二值化处理、仿射变化
  • 如何解决pip安装报错ModuleNotFoundError: No module named ‘jupyter’问题
  • 大模型开发
  • PDF转Word的简单方法
  • 射频信号(大宽高比)时频图目标检测anchors配置(下)
  • Github上传文件流程图
  • pytest简单使用和生成测试报告
  • Axios 响应拦截器
  • SpringBoot 使用Rabbitmq
  • EDoF-ToF: extended depth of field time-of-flight imaging解读, OE 2021
  • C语言常见的预定符号常量
  • LeetCode 热题100:160.相交链表
  • 神经网络和机器学习的一些基本概念
  • 【Node.js】使用ts-node运行ts文件时报错: TypeError: Unknown file extension “.ts“ for ts 文件
  • 电子设计大赛【摄像头循迹】讲解
  • SpringMVC快速入门之请求与响应
  • 【大模型文生图、文生音频实战Demo】基于Spring AI Alibaba和阿里百炼大模型实现文生图、文生视频
  • WebGIS 中常用公共插件
  • 1688 Agent Russia 丨俄罗斯1688跨境代采系统搭建指南
  • 前端开发 React 状态优化
  • 基于深度学习的图像分类:使用预训练模型进行迁移学习
  • 原创-基于 PHP 和 MySQL 的证书管理系统 第三版