当前位置：首页 > news >正文

Linux 内存管理调试分析：ftrace、perf、crash 的系统化使用

news 2025/6/9 7:43:15

Linux 内存管理调试分析：ftrace、perf、crash 的系统化使用

Linux 内核内存管理是构成整个内核性能和系统稳定性的基础，但这一子系统结构复杂，常常有设置失败、性能展示不良、OOM 杀进程等问题。要分析这些问题，需要一套工具化、实操化的技术路径，也就是 ftrace / perf / crash 等核心分析工具。

本文系统分析这三者如何配合 Linux 内存管理系统使用，应对“分页、物理分配、SLAB、回收、OOM” 等典型场景，帮助实际工程师实现“知其然，知其所以然”。

在这里插入图片描述

一、ftrace: 函数级调用进程观测

完全适用场景：

分析 do_page_fault() 触发流程
查看 __alloc_pages() / kmalloc() 调用堆栈
追踪 kswapd 的执行路径
跟踪 tlb_flush 或 zap_page_range 导致的异常性能开销

基本使用

# 启用 function_graph 跟踪
trace-cmd record -p function_graph -l do_page_fault
trace-cmd report | less

实战示例：深入 `do_page_fault` 缺页分析

在一次用户态访问大数组的性能瓶颈中，我们怀疑访问频繁缺页。

通过 ftrace：

trace-cmd record -p function_graph -l do_page_fault

然后在 report 中确认是否反复触发 handle_mm_fault() → __do_fault() → alloc_pages()。

解析亮点：这是典型的“按需分配”场景，理解虚拟内存页未映射前会触发缺页中断，走 alloc_pages 去真正分配物理页。

面试官想听：你是否能清楚描述 page fault 的真正触发路径、每一级函数做了什么？是否能用 ftrace 工具亲自验证？

实战示例 2：跟踪 `kswapd` 中断页面回收路径

trace-cmd record -p function_graph -l shrink_node

在低内存触发 reclaim 时，你可以看到：
shrink_node → shrink_lruvec → shrink_inactive_list → try_to_unmap → tlb_flush_mmu。

解析亮点：能清楚看出内核是怎样在后台异步 reclaim 页的，这对分析页面回收的成本至关重要。

二、perf: 确实量化的性能分析器

完全适用场景

分析 page fault 高变量原因
分析 slab 分配热点（kmalloc 或 obj_cache 较热）
分析 TLB 失效、cache miss 对性能影响
分析 swap 带来的写回延迟

实战示例：判断 SLAB 是否频繁分配回收

在一次内核模块加载中频繁分配小块内存，怀疑 kmalloc 压力大。

perf top

结果发现 kmalloc/kmem_cache_alloc_node 占比很高。

进一步定位：

perf record -e kmem:kmalloc -a
perf report

解析亮点：你不仅能看到热点函数，还能通过事件采样定位“谁分配得多、在哪里分配”，这才是 perf 真正的价值。

实战示例 2：统计缺页中断和 TLB Miss

perf stat -e page-faults,dTLB-load-misses ./test_app

page-faults 很高，说明访问了大量未映射虚页。
dTLB-load-misses 很高，说明频繁跨页访存，可能是内存碎片严重。

面试官想听：你是否能通过 perf 读出 cache miss、TLB miss 与内存管理之间的性能因果链。

三、crash: 实时和崩溃后的内核内存透视

完全适用场景

分析崩溃前 mm_struct / page / slab 状态
分析正在运行进程内存分布
分析不同 zone 的 free_area 分配情况
分析 Page flags，定位 dirty/unreclaimable 页面

实战示例：OOM 发生时定位原因

系统触发 OOM，dmesg 中仅提示 “invoked oom-killer”，如何找出问题？

crash /usr/lib/debug/vmlinux /proc/kcore

ps -g                     # 查看谁被杀
kmem -s                  # 查看 slab 内存是否泄漏
kmem -z                  # 查看各 zone 空闲状态
vm                       # 检查进程虚拟内存布局

解析亮点：通过 crash 工具还原当时内存整体状态、对象分配情况，进而判断是否因 unreclaimable slab 太大而触发 OOM。

实战示例 2：分析 zone 空闲页不足的原因

kmem -z

输出：Zone Normal 空闲页数只有 4，而 highmem 有上千页，但系统使用默认 GFP_KERNEL（只能分配 Normal），因而无法满足大页请求。

面试官想听：你是否能理解 zone 的内存不可跨分配导致的“假空闲”，以及如何定位。

四、应用场景组合指南

情况一：内存清理性能差，系统卡顿

用 perf stat -e page-faults,dTLB-load-misses
用 ftrace 追踪 do_page_fault/shrink_node
用 crash 分析 zone 分配情况

情况二：内核 OOM Kill 不明原因

dmesg 看 OOM 输出
crash 分析 oom_score 对比
观察 swap + reclaim 操作是否不该触发

情况三：SLAB 分配压力大

perf top 看 kmalloc / cache 热点
crash kmem -s 观察小对象分配热点
分析 slab 是否无法回收，或分配深度

情况四：TLB/Cache 异常导致延迟跳变

perf 分析 dTLB-load-misses, cache-misses
ftrace 跟踪 tlb_flush_mmu()
crash 查看 page.flags 是否为 dirty + active 状态，不能回收

第五、结论

Linux 内存管理子系统的处理路径、分配分析、回收策略和性能特性，都能通过 ftrace / perf / crash 做到系统化分析和跟踪。

从“规模规则 → 观察触发 → 分析排查”的线路出发，将理论知识、性能指标和实际调试完美一体化，才是真正理解 Linux MM 子系统的路径。

查看全文

http://www.xdnf.cn/news/937747.html

3.机器学习-分类模型-线性模型

《深入理解 Nacos 集群与 Raft 协议》系列四：日志复制机制：Raft 如何确保提交可靠且幂等

《Spring Boot 微服务架构下的高并发活动系统设计与实践》

CQF预备知识：Python相关库 -- SciPy 安装

会计-合并-5- 处置交易在合报与个报会计处理

由汇编代码确定switch语句

第13次01：广告及商品数据呈现

(LeetCode 每日一题)386. 字典序排数(递归、深度优先搜索dfs || 递推)

动态生成 PV 的机制：使用 NFS-Client Provisione

深入解析Golang反射机制与高效文件操作实践

TCP相关问题第一篇

Windows权限提升篇数据库篇MYSQLMSSQLORACLE自动化项目

管理数据洪流：自动化处理与归档每日数据文件的策略与实践

BOM（Browser Object Model）核心对象手册

CNN核心机制深度解析：卷积池化原理 PyTorch实现经典网络

MSYS2 环境配置与 Python 项目依赖管理笔记

Z-FOLD: A Frustratingly Easy Post-Training Quantization Scheme for LLMs

MS39531N 是一款正弦驱动的三相无感直流电机驱动器，具有最小振动和高效率的特点

深入理解 Java 的反射、注解与动态代理

基于Python学习《Head First设计模式》第十章状态模式

JavaScript数组扁平化（Array Flattening）全解析：从基础到进阶的9种实现方式及深度对比

C++.OpenGL （17/64）深度测试（Depth Testing）

Python Wheel 打包基本原理详解

LangChain工具集成实战：构建智能问答系统完整指南

RoboDK 自定义机器人

当前市场环境下，软件行业的突围之道：技术演进与商业模式重构

工厂方法模式和抽象工厂方法模式的battle

135. 分发糖果

【P2P】直播网络拓扑及编码模式

【2025年6月8日】Claude 4 国内使用全攻略