当前位置: 首页 > java >正文

深入 Linux 内核:GPU Runtime Suspend 源码和工作流程全面分析

这是系列文章中第二篇,我们将分析完整的 Linux runtime suspend 操作流程,以 Vivante GPU 为例,展示开发者如何通过内核程序实现和调试 runtime PM 机制。


一、内核中的 Runtime PM 工作流程概览

当调用者执行:

pm_runtime_put(dev);

时,内核开始启动 suspend 流程,简化路径如下:

pm_runtime_put()\_ __pm_runtime_resume()/suspend()\_ queue_work(pm_wq, pm_runtime_work())\_ rpm_suspend()\_ call runtime_suspend(dev)

一切工作通过 workqueue 静态分配执行,最终会调用驱动引擎里的:

const struct dev_pm_ops xxx_pm_ops = {.runtime_suspend = xxx_runtime_suspend,.runtime_resume = xxx_runtime_resume,
};

设备与驱动在 probe 时相关联,这些操作是 runtime PM 作用的基础。


在这里插入图片描述

二、GPU 驱动中如何实现 runtime_suspend()

以 NXP 官方 BSP中 drivers/gpu/imx/gpu2d/gpu2d.c 为例,其 runtime_suspend 代码类似如下:

static int gpu2d_runtime_suspend(struct device *dev)
{struct gpu2d_data *gpu = dev_get_drvdata(dev);clk_disable_unprepare(gpu->clk_axi);clk_disable_unprepare(gpu->clk_ahb);return 0;
}static int gpu2d_runtime_resume(struct device *dev)
{struct gpu2d_data *gpu = dev_get_drvdata(dev);clk_prepare_enable(gpu->clk_axi);clk_prepare_enable(gpu->clk_ahb);return 0;
}static const struct dev_pm_ops gpu2d_pm_ops = {.runtime_suspend = gpu2d_runtime_suspend,.runtime_resume  = gpu2d_runtime_resume,
};static struct platform_driver gpu2d_driver = {.driver = {.name = "imx-gpu2d",.pm = &gpu2d_pm_ops,},.probe = gpu2d_probe,.remove = gpu2d_remove,
};

这段代码表明:

  • GPU2D 设备需要两条时钟线:AHB + AXI
  • runtime_suspend() 释放时钟,用于节能
  • resume() 重新启动 clock ,确保正常运行

实现非常简洁,同时需要确保 clock 名称和 device tree 配置一致。


三、如何验证 runtime_suspend 被调用

1.使用 dev_info()

在 suspend/resume 函数中加上:

dev_info(dev, "runtime suspend enter\n");
dev_info(dev, "runtime resume enter\n");

然后通过 dmesg 观看调用时机记录

2.开启 ftrace 跟踪:
echo 1 > /sys/kernel/debug/tracing/tracing_on
echo dev_pm_* > /sys/kernel/debug/tracing/set_ftrace_filter
echo function > /sys/kernel/debug/tracing/current_tracer
cat /sys/kernel/debug/tracing/trace

四、如何解析 GPU 不能 suspend 的原因?

惊悚一:runtime_status = active
  • 表示尚有使用者依赖,通常是 usage 不为 0
  • 通过:
cat runtime_usage

如果 > 0,表示有场景使用了 pm_runtime_get() 后未 release

惊悚二:未启用 power domain
  • 查看 device tree 中是否定义 power-domains = <&gpu_pd>
  • 查看 /sys/devices/…/power/下是否有 autosuspend_delay_ms
惊悚三:无 .runtime_suspend()
  • 查验 driver 中是否没有 pm_ops 的注册
  • 添加 dev_dbg/dev_info 打印确认

五、最终建议:为什么开发时必须支持 runtime suspend?

  1. 所有裱系统和开源 Linux BSP 都应使用 runtime PM 节能
  2. suspend/resume 是后续 DVFS/power domain 控制的基础
  3. 能够保证屏幕灯消灯后,GPU 和 VPU 都被展示为 suspend ,是面试常问答的背景矩阵

六、小结

本文我们从全局角度解析了 Linux runtime PM 机制的内核流程,以 GPU 驱动为例完整说明了 suspend/resume 函数如何实现,如何调试和怎样分析失效原因。

这是所有 Linux BSP 开发者的基本功夫。

http://www.xdnf.cn/news/6562.html

相关文章:

  • 若依框架Consul微服务版本
  • [原创](计算机数学): 生日概率问题.
  • 电子电器架构 --- Zonal架构正在开创汽车电子设计新时代
  • 小刚说C语言刷题—1700请输出所有的2位数中,含有数字2的整数
  • 天能股份SAP系统整合实战:如何用8个月实现零业务中断的集团化管理升级
  • 升级kafka4.0.0,无ZK版本
  • android 安装openwrt 安正步骤
  • Android trace中CPU的RenderThread与GPU
  • 4.6. 暂退法(Dropout)笔记
  • 【沉浸式求职学习day41】【Servlet】
  • AWS SageMaker vs Bedrock:该选哪个?
  • 在 Visual Studio Code (VSCode) 中配置 MCP(Model Context Protocol)
  • 光学变焦和数字变倍模块不同点概述!
  • 1T 服务器租用价格解析
  • Centos7系统(最小化安装)安装zabbix7版本详细文章、nginx源代码配置、php源代码、mysql-yum安装
  • 基于对抗性后训练的快速文本到音频生成:stable-audio-open-small 模型论文速读
  • Fabric 服务端插件开发简述与聊天事件监听转发
  • 中科曙光服务器监控指标说明
  • 常见面试题
  • 电动流量调节V型球阀生产厂家|高精度耐磨控制阀解决方案-耀圣
  • rocketMQ
  • Unity:延迟执行函数:Invoke()
  • 2024 睿抗机器人开发者大赛CAIP-编程技能赛-本科组(国赛) | 珂学家
  • 深入理解二叉树:遍历、存储与算法实现
  • LIIGO ❤️ RUST 12 YEARS
  • Milvus(24):全文搜索、文本匹配
  • STM32的ADC模块中,**采样时机(Sampling Time)**和**转换时机(Conversion Time),获取数据的时机详解
  • 【leetcode】144. 二叉树的前序遍历
  • Rust 数据结构:String
  • iOS SwiftUI的具体运用实例(SwiftUI库的运用)