当前位置: 首页 > java >正文

DMA:在不同内存空间建立目的地址的情况分析及后果

文章目录

  • 前言
  • 一、DMA RAM Access Cached Address Space (DMA 访问缓存地址空间)
    • 1.1、含义
    • 1.2、潜在问题:数据不一致性
    • 1.3、如何解决/管理
  • 二、DMA RAM Access Non-Cached Address Space (DMA 访问非缓存地址空间)
    • 2.1、含义
    • 2.2、特点
    • 2.3、使用场景
  • 三、总结


前言

DMA,本章主要是想聊下关于DMA在不同内存空间建立目的地址的情况。如 DMA 访问缓存地址空间(Cached Address Space)和非缓存地址空

间(Non-Cached Address Space)的情况。这涉及到 CPU Cache 和 DMA 控制器是如何协同工作(或者不协同工作)的问题,核心就在于数据一致性。

一、DMA RAM Access Cached Address Space (DMA 访问缓存地址空间)

1.1、含义

DMA 控制器将要传输的数据的目标地址或源地址指向了 CPU Cache 管理的内存区域(通常是主 RAM 的一部分,这些部分被配置为可以被缓存)。

1.2、潜在问题:数据不一致性

  • **CPU 写入,DMA 读取:**CPU 将数据写入内存,数据进入 Cache (可能稍后写回主内存)。DMA 控制器直接从主内存读取数据。如果 CPU 的写操作还没有将数据写回主内存(例如,使用了 Write-Back 缓存策略),DMA 读取到的可能是旧数据或无数据。
  • **DMA 写入,CPU 读取:**DMA 控制器将数据写入主内存。CPU 要读取该数据时,CPU 可能会先检查 Cache 中的旧数据。如果该地址的数据之前被 CPU 访问过并缓存在 Cache 中,那么 CPU 读取到的就是 Cache 中的旧数据,而不是 DMA 刚刚写入的新数据。

1.3、如何解决/管理

  • **Cache Coherency Hardware缓存一致性硬件:**许多现代处理器(尤其是多核处理器和包含 DMA 的系统)内置了缓存一致性机制(如:MESI 协议及其变种)。这些机制确保当 DMA 控制器访问一个缓存行的地址时,相关的缓存行会被自动使其失效或置为共享状态,这样 CPU 之后的读取会从主内存获取最新数据,而 DMA 写入的数据也能被 CPU 看到。但是这变相的多出了 CPU 访问主存的时间。
  • **软件干预:**在没有硬件缓存一致性支持的系统中,或者需要精细控制时,软件必须介入:
    1、使缓存行失效
    在 DMA 读取前,显示地告知缓存控制器使包含目标地址的缓存行失效,强制 CPU 从主内存读取。
    2、写回并使失效
    在 DMA 写入前,如果 CPU 可能已经修改了该区域的数据并缓存了,需要先将缓存中的脏数据写回主存,然后使缓存行失效,确保 DMA 写入的是干净的主内存区域。
    3、内存屏障
    确保指令的执行顺序,防止 CPU 或编译器优化导致操作乱序。

二、DMA RAM Access Non-Cached Address Space (DMA 访问非缓存地址空间)

2.1、含义

DMA 控制器将要传输的数据的目标地址或源地址指向了被配置为不可缓存的内存区域。这些区域通常被映射到特定的硬件寄存器、设备内存(如GPU显存、网卡缓存区)或者被明确配置为非缓存的 RAM。

2.2、特点

  • CPU 对这些地址的访问会直接绕过 Cache,每次访问都访问主存。
  • DMA 控制器对这些地址的访问也直接访问主存。
  • 没有缓存一致性问题,因为根本不涉及 Cache,所以 CPU 和 DMA 之间不会因为 Cache 副本和内存副本不同而产生数据不一致的问题。CPU 写入的数据,DMA 一定能读到;DMA 写入的数据,CPU 一定能读到(只要地址正确)。

2.3、使用场景

  • **设备寄存器:**CPU需要直接、实时地读写硬件状态和控制位。
  • **中断向量表:**需要快速响应。
  • 某些需要精确控制访问延迟或避免 Cache 污染的内存区域。
  • 与外部设备交换数据的标准区域(如PCI BAR映射的内存)。

三、总结

特性DMA 访问缓存地址空间 CachedDMA 访问非缓存地址空间 Non-Cached
CPU 访问路径通过 Cache绕过 Cache,直接访问主存
DMA 访问路径直接访问主存直接访问主存
核心问题可能出现 CPU 和 DMA 之间的数据不一致性无缓存一致性问题
数据一致性需要硬件缓存一致性支持,或软件显式管理 失效/写回天然一致,无需特殊处理
性能CPU 访问速度快,Cache 命中时,但管理可能更加复杂CPU 访问速度相对较慢,每次都要访问主存,管理简单
典型用途通用内存数据传输设备寄存器、硬件内存映射、需要精确控制区域

总之,选用哪种方式取决于具体的应用需求:是需要利用 Cache 提高通用内存访问速度,还是需要避免缓存带来的复杂性和潜在一致性问题,确保直接、可靠的主存访问。

http://www.xdnf.cn/news/13155.html

相关文章:

  • 解锁 Nginx Stream 代理—全面掌握 ngx_stream_proxy_module
  • echarts使用笔记
  • java容易被忽略的事情
  • docker 安装运行mysql8.4.4
  • ceph 查看 pg 迁移进度的脚本
  • Oracle SQL*Plus 配置上下翻页功能
  • 大数据零基础学习day1之环境准备和大数据初步理解
  • APP开发好后如何分发内测
  • uniapp+vue2+h5图片下载保存,微信浏览器、非微信浏览器
  • java8 通过方法引用 vo::setLevel将对象的 setter 方法作为参数传递
  • Linux日志管理和时间管理
  • Java多线程实现之Callable接口深度解析
  • PyTorch终极实战:从自定义层到模型部署全流程拆解​
  • 接口测试中缓存处理策略
  • Code Composer Studio快捷键
  • OkHttp 中实现断点续传 demo
  • 【数据结构】图论经典:Dijkstra最短路径算法精解与工程优化
  • 计算机毕业设计微信小程序题库系统 在线答题 题目分类 错题本管理 学习记录查询系统源码+论文+PPT+讲解 基于微信小程序的题库系统设计与实现
  • JavaScript 核心对象深度解析:Math、Date 与 String
  • qt3d自定义生成mesh图形
  • 深度学习小项目合集-视频介绍下自取
  • 计算机系统概述(4)
  • LocalDate类使用
  • 电脑扩展屏幕工具
  • 【完整源码】白泽题库系统:基于PyQt5的智能刷题与考试平台开发全解析
  • 群晖NAS是否有专业的安全防护措施?是否支持无密码登录?
  • Android第十七次面试总结(Java数据结构)
  • 在写外部FLASH的应用时发现一些问题,在这里分享一下我的想法
  • 【OpenCV】双相机结构光成像与图像交叉融合实现【python篇】
  • Spring详解【1】