当前位置: 首页 > news >正文

内存屏障指令

一、理解内存屏障(Memory Barrier)

开发者显然不明白一个事实——程序实际运行时很可能并不完全按照开发者编写的顺序访问内存,因为现代计算机为了提高性能而采取乱序执行,内存乱序访问主要发生在如下两个阶段:

  • 编译时。编译器优化导致内存乱序访问。
  • 执行时。多个 CPU 的交互引起内存乱序访问。

1.1 编译

编译器会把符合人类思维逻辑的高级语言代码(如 C 语言的代码)翻译成符合 CPU 运算
规则的汇编指令。编译器会在翻译成汇编指令时对其进行优化,如内存访问指令的重新排序可
以提高指令级并行效率。然而,这些优化可能会与程序员原始的代码逻辑不符,导致一些错误
发生。编译时的乱序访问可以通过 barrier()函数来规避。
#define barrier() __asm__ __volatile__ ("" ::: "memory")

1.2 执行

于现代处理器普遍采用超标量架构、乱序发射以及乱序执行等技术来提高指令级并行效
率,因此指令的执行序列在处理器流水线中可能被打乱, 与程序代码编写时的序列不一致,这
就产生了程序员错觉——处理器访问内存的次序与代码的次序相同。
另外,现代处理器采用多级存储结构,如何保证处理器对存储子系统访问的正确性也是一
大挑战。


二、内存屏障指令

ARMv8 指令集提供了 3 条内存屏障指令。

2.1 数据存储屏障(Data Memory Barrier, DMB)指令: 仅当所有在它前面的存储器访问操作都执行完毕后, 才提交(commit) 在它后面的访问指令。 DMB 指令保证的是DMB 指令之前的所有内存访问指令和 DMB 指令之后的所有内存访问指令的执行顺序。也就是说, DMB 指令之后的内存访问指令不会被处理器重排到 DMB 指令的前面。 DMB 指令不会保证内存访问指令在内存屏障指令之前完成, 它仅仅保证内存屏障指令前后的内存访问的执行顺序。 DMB 指令仅仅影响内存访问指令、 数据高速缓存指令以及高速缓存管理指令等,并不会影响其他指令(例如算术运算指令等)的顺序。


2.2 数据同步屏障(Data Synchronization Barrier, DSB)指令: 比 DMB 指令要严格一些,仅当所有在它前面的内存访问指令都执行完毕后,才会执行在它后面的指令,即任何指令都要等待 DSB 指令前面的内存访问指令完成。 位于此指令前的所有缓存(如分支预测和 TLB 维护)操作需要全部完成。


2.3 指令同步屏障(Instruction Synchronization Barrier, ISB)指令: 确保所有在 ISB 指令之后的指令都从指令高速缓存或内存中重新预取。 它刷新流水线(flush pipeline)和预取缓冲区后才会从指令高速缓存或者内存中预取 ISB 指令之后的指令。 ISB 指令通常用来保证上下文切换(如 ASID 更改、 TLB 维护操作等)的效果。
 

参考:

什么是内存屏障(Memory Barriers) - CharyGao - 博客园

https://zhuanlan.zhihu.com/p/675488927

http://www.xdnf.cn/news/564103.html

相关文章:

  • 基于JDBC的信息管理系统,那么什么是JDBC呢?
  • VUE3+TS实现图片缩放移动弹窗
  • 10.18 LangChain ToolMessage实战:多轮交互与状态管理全解析
  • Java 项目管理工具:Maven 与 Gradle 的深度对比与选择
  • 定时器的两种实现方式
  • C语言---结构体 、联合体、枚举
  • JavaScript性能优化实战(14):跨端JavaScript性能优化
  • ​C++性能优化的7大核心策略与实战案例
  • qt浏览文件支持惯性
  • AI赋能R-Meta分析核心技术:从热点挖掘到高级模型
  • 【音频】wav文件如何解析编码格式(压缩格式)?
  • 前端开发遇到 Bug,怎么办?如何利用 AI 高效解决问题
  • 电脑中所有word文件图标变白怎么恢复
  • WebSocket 是什么?
  • SQL 数值计算全解析:ABS、CEIL、FLOOR与ROUND函数深度精讲
  • 深入了解redis的哈希槽的知识
  • 关于收集 Android Telephony 网络信息的设计思考
  • 网络基础的介绍
  • 如何提高独立服务器的安全性?
  • 从电商角度设计大模型的 Prompt
  • Java 参数值传递机制
  • 全平台开源电子书阅读器推荐,支持多端同步+AI朗读!支持epub/mobi/azw3/pdf常见电子书格式!
  • PostgreSQL基础操作
  • 29.第二阶段x64游戏实战-技能冷却
  • Node.js 24发布:性能与安全双提升
  • 【Vue篇】重剑无锋:面经PC项目工程化实战面经全解
  • 苹果企业签名为什么会出现授信异常
  • 《从虚拟 DOM 到 Diff 算法:深度解析前端高效更新的核心原理》-简版
  • logits是啥、傅里叶变换
  • day 32