Linux 内核性能分析确保成效的关键知识点总结
作者:嵌入式 Jerry
本文基于实际开发和调试经验,总结了一套精准有效的 Linux 内核性能分析技术知识点和工具使用技巧。适合编写内核高效高级功能、分析系统性能端点和处理性能缺陷的工程师阅读和学习。
一、ftrace 原理与实战
1. ftrace 是什么?
ftrace 是内核自带的调试分析工具,基于 tracepoints/函数加针技术,用于分析内核以及内核模块代码的执行路径和性能。
2. 基本操作流程
cd /sys/kernel/debug/tracing
# 选择 tracer 类型
echo function > current_tracer# 设置需要追踪的函数
cat available_filter_functions | grep at24# 设置 ftrace 函数过滤表
for fn in at24_probe at24_read at24_write; doecho $fn >> set_ftrace_filter
done# 启用 trace
echo 1 > tracing_on
# 执行操作触发 probe
# ...
# 关闭 trace
echo 0 > tracing_on# 看 trace 结果
cat trace > /tmp/trace.txt
less /tmp/trace.txt
3. 实际效果
sh-698 [001] ...1. 583.114633: at24_probe <-i2c_device_probe
表明 at24_probe 被 i2c 引擎调用,这种跟踪方式适合分析 driver probe 失败或没有被调用的问题。
4. of_match_table 系列和 bind
通过
echo -n 2-0050 > /sys/bus/i2c/drivers/at24/bind
```触发 probe,实际上是培入 device - driver 结合,使用的是 driver 里 of_match_table 与 device tree 节点的 compatible 对应合。---## 二、内核性能分析工具 slabtop 详解### 1. slabtop 是什么?slabtop 是一个统计 Linux 内核 slab 分配情况的工具,用于分析内核内存分配和应用程序内核对象占用情况,调试内核内存泄漏和内存风爆等问题。### 2. slabtop 输出重点分析```bashActive / Total Objects (% used) : 153931 / 156457 (98.4%)OBJS ACTIVE USE OBJ SIZE SLABS OBJ/SLAB CACHE SIZE NAME29504 29504 100% 0.12K 922 32 3688K kernfs_node_cache
- Active/Total Objects:当前活跃对象和总分配对象数,用于看最大占用者
- CACHE NAME:是哪种对象,如 inode_cache / dentry / kmalloc-128
- OBJ SIZE:每个对象大小
- USE%:表示利用率
3. 什么是 “对象”?
通俗规范:
只要是内核里面分配出的一块定长内存,用于描述运行中系统中的系统组成部件,都可称之为 “对象”。
如一个进程的 task_struct
,一个文件描述符 file
,一个 dentry 节点等等,都是定长内存对象,适合用 slab 分配系统管理。
4. slab 是内存管理知识
是的!Slab 分配器是 Linux 内核 内存管理 中用于小块定长对象分配和回收的高效分配器,属于内核 memory management 模块下级。
三、实战分析策略:我怎样分析性能问题
以实际工程为例:
1. 内核 probe 失败根因分析
- 方法:配合 ftrace 跟踪 driver probe 调用链,分析 of_match_table 是否匹配、driver_register 是否被调用
- 工具:
ftrace
,/sys/bus/i2c/drivers/*/bind
- 分析结果: at24_probe 被调用,但 GPIO 获取失败
2. slabtop 分析内核占用最大的结构体
- 定位 dentry/inode/file 的分配统计
- 调整 /proc/sys/vm/drop_caches 和服务统计进行对比
四、常见问题分析策略和解决方案
问题分类 | 工具/技术 | 解决方案 |
---|---|---|
probe 未触发 | ftrace / driver bind | 分析 match_table 是否匹配 |
内核占用过高 | slabtop / kmemleak | 确定最大占用者,看是否有内存泄漏 |
系统延迟 | perf / trace-cmd | 重点分析均值调用时间和运行线程 |
GPIO/设备失败 | dev_dbg / ftrace | 分析 devm_* 或 gpiod_get 失败原因 |
结论
Linux 内核性能分析需要层级分明:
- 工具层:掌握 ftrace, slabtop, perf 基本用法
- 结构层:分析 driver 构成,对象分配源
- 时间层:观察调用时间和性能点
使用好 ftrace 和 slabtop 类工具,配合对 driver 和 内核结构体的经验分析,才能有效解决系统性能和系统稳定性问题。