当前位置: 首页 > news >正文

Linux 内核性能分析确保成效的关键知识点总结

作者:嵌入式 Jerry

本文基于实际开发和调试经验,总结了一套精准有效的 Linux 内核性能分析技术知识点和工具使用技巧。适合编写内核高效高级功能、分析系统性能端点和处理性能缺陷的工程师阅读和学习。


一、ftrace 原理与实战

在这里插入图片描述

1. ftrace 是什么?

ftrace 是内核自带的调试分析工具,基于 tracepoints/函数加针技术,用于分析内核以及内核模块代码的执行路径和性能。

2. 基本操作流程

cd /sys/kernel/debug/tracing
# 选择 tracer 类型
echo function > current_tracer# 设置需要追踪的函数
cat available_filter_functions | grep at24# 设置 ftrace 函数过滤表
for fn in at24_probe at24_read at24_write; doecho $fn >> set_ftrace_filter
done# 启用 trace
echo 1 > tracing_on
# 执行操作触发 probe
# ...
# 关闭 trace
echo 0 > tracing_on# 看 trace 结果
cat trace > /tmp/trace.txt
less /tmp/trace.txt

3. 实际效果

sh-698     [001] ...1.   583.114633: at24_probe <-i2c_device_probe

表明 at24_probe 被 i2c 引擎调用,这种跟踪方式适合分析 driver probe 失败或没有被调用的问题。

4. of_match_table 系列和 bind

通过

echo -n 2-0050 > /sys/bus/i2c/drivers/at24/bind
```触发 probe,实际上是培入 device - driver 结合,使用的是 driver 里 of_match_table 与 device tree 节点的 compatible 对应合。---## 二、内核性能分析工具 slabtop 详解### 1. slabtop 是什么?slabtop 是一个统计 Linux 内核 slab 分配情况的工具,用于分析内核内存分配和应用程序内核对象占用情况,调试内核内存泄漏和内存风爆等问题。### 2. slabtop 输出重点分析```bashActive / Total Objects (% used)    : 153931 / 156457 (98.4%)OBJS ACTIVE  USE OBJ SIZE  SLABS OBJ/SLAB CACHE SIZE NAME29504  29504 100%    0.12K    922       32      3688K kernfs_node_cache
  • Active/Total Objects:当前活跃对象和总分配对象数,用于看最大占用者
  • CACHE NAME:是哪种对象,如 inode_cache / dentry / kmalloc-128
  • OBJ SIZE:每个对象大小
  • USE%:表示利用率

3. 什么是 “对象”?

通俗规范:

只要是内核里面分配出的一块定长内存,用于描述运行中系统中的系统组成部件,都可称之为 “对象”。

如一个进程的 task_struct,一个文件描述符 file,一个 dentry 节点等等,都是定长内存对象,适合用 slab 分配系统管理。

4. slab 是内存管理知识

是的!Slab 分配器是 Linux 内核 内存管理 中用于小块定长对象分配和回收的高效分配器,属于内核 memory management 模块下级。


三、实战分析策略:我怎样分析性能问题

以实际工程为例:

1. 内核 probe 失败根因分析

  • 方法:配合 ftrace 跟踪 driver probe 调用链,分析 of_match_table 是否匹配、driver_register 是否被调用
  • 工具: ftrace, /sys/bus/i2c/drivers/*/bind
  • 分析结果: at24_probe 被调用,但 GPIO 获取失败

2. slabtop 分析内核占用最大的结构体

  • 定位 dentry/inode/file 的分配统计
  • 调整 /proc/sys/vm/drop_caches 和服务统计进行对比

四、常见问题分析策略和解决方案

问题分类工具/技术解决方案
probe 未触发ftrace / driver bind分析 match_table 是否匹配
内核占用过高slabtop / kmemleak确定最大占用者,看是否有内存泄漏
系统延迟perf / trace-cmd重点分析均值调用时间和运行线程
GPIO/设备失败dev_dbg / ftrace分析 devm_* 或 gpiod_get 失败原因

结论

Linux 内核性能分析需要层级分明:

  • 工具层:掌握 ftrace, slabtop, perf 基本用法
  • 结构层:分析 driver 构成,对象分配源
  • 时间层:观察调用时间和性能点

使用好 ftrace 和 slabtop 类工具,配合对 driver 和 内核结构体的经验分析,才能有效解决系统性能和系统稳定性问题。

http://www.xdnf.cn/news/905545.html

相关文章:

  • Redis 过期了解
  • ​​TLV4062-Q1​​、TLV4082-Q1​​迟滞电压比较器应用笔记
  • MySQL 高级学习篇
  • 【SpringBoot自动化部署】
  • 【WebSocket】SpringBoot项目中使用WebSocket
  • 主流定位技术:Zigbee、蓝牙、UWB、RFID、5G通信介绍及对比
  • Day 41 训练
  • 鸿蒙图片缓存(一)
  • 2025年7月-12月【CISP】考试计划时间
  • 全新Xsens Animate版本是迄今为止最大的软件升级,提供更清晰的数据、快捷的工作流程以及从录制开始就更直观的体验
  • C++11 Move Constructors and Move Assignment Operators 从入门到精通
  • 现代Web安全实践:基于Token与Refresh Token的单点登录(SSO)实现
  • Java常用的判空方法
  • 数据库学习(一)——MySQL基础
  • 信息化安全与自主可控需求:国产飞腾D2000 VPX3U主板设计与实践
  • 多种风格导航菜单 HTML 实现(附源码)
  • 增量式网络爬虫通用模板
  • 嵌入式学习之系统编程(十一)网络编程之协议头,测试命令及工具
  • 可视化图解算法49:滑动窗口的最大值
  • 大话软工笔记—需求工程概述
  • day45_Tensorborad使用介绍
  • 4G网络中频段的分配
  • 进行用户VMware官网注重中一直无法登录,该怎么处理
  • Java下载文件(特殊字符编码处理)
  • 基于React + FastAPI + LangChain + 通义千问的智能医疗问答系统
  • QT: `long long` 类型转换为 `QString` 2025.6.5
  • ruoyi-plus-could 负载均衡 通过 Gateway模块配置负载均衡
  • Curtain MonGuard:智能水印颜色适配,提升屏幕信息安全
  • LabVIEW实时系统数据监控与本地存储
  • C++ 基础特性深度解析