当前位置: 首页 > ai >正文

OpenSHMEM 介绍和使用指南

OpenSHMEM 介绍和使用指南

什么是 OpenSHMEM?

OpenSHMEM 是一个用于并行计算的标准化 API,它提供了一种分区全局地址空间 (PGAS) 编程模型。OpenSHMEM 最初由 Cray 公司开发,后来成为一个开源项目,旨在为高性能计算提供高效的通信接口。

OpenSHMEM 的主要特点包括:

  • 基于单向通信(无需握手)
  • 支持远程内存访问(RMA)
  • 提供集体操作和原子操作
  • 专为高性能计算设计

OpenSHMEM 的核心概念

  1. PE (Processing Element):执行单元,类似于 MPI 中的进程
  2. Symmetric Data:在所有 PE 上具有相同名称和布局的数据
  3. Remote Memory Access:直接访问远程 PE 的内存
  4. Active Messages:将数据与处理程序一起发送

安装 OpenSHMEM

OpenSHMEM 有多种实现,以下是几种常见的:

  1. Open MPI 的 OpenSHMEM 实现

    sudo apt install openmpi-bin libopenmpi-dev
    
  2. Sandia OpenSHMEM (SOS)
    从 https://github.com/Sandia-OpenSHMEM/SOS 获取源代码并编译

  3. Cray OpenSHMEM:通常在 Cray 系统上预装

基本使用

简单的 OpenSHMEM 程序结构

#include <shmem.h>
#include <stdio.h>int main(void) {shmem_init();int mype = shmem_my_pe();  // 获取当前 PE 的 IDint npes = shmem_n_pes();  // 获取 PE 的总数printf("Hello from PE %d of %d\n", mype, npes);shmem_finalize();return 0;
}

编译和运行

使用 Open MPI 的实现:

oshcc -o hello hello.c
oshrun -np 4 ./hello

常用 OpenSHMEM 操作

1. 对称内存分配

int* shared_var = (int*)shmem_malloc(sizeof(int));
*shared_var = 0;
shmem_barrier_all();  // 确保所有 PE 都完成了初始化

2. 远程内存访问 (Put/Get)

// PE 0 发送数据到 PE 1
if (mype == 0) {int value = 42;shmem_int_put(shared_var, &value, 1, 1);  // 将 value 放入 PE 1 的 shared_var
}shmem_barrier_all();if (mype == 1) {printf("PE 1 received: %d\n", *shared_var);
}

3. 原子操作

// 所有 PE 对一个共享变量进行原子加
shmem_int_atomic_add(shared_var, mype+1, 0);  // 在 PE 0 的 shared_var 上加上 mype+1shmem_barrier_all();if (mype == 0) {printf("Total sum: %d\n", *shared_var);  // 应该输出 1+2+...+npes
}

4. 集体操作

int local_data = mype + 1;
int global_sum;shmem_int_sum_to_all(&global_sum, &local_data, 1, 0, 0, npes, NULL);printf("PE %d: global sum is %d\n", mype, global_sum);  // 所有 PE 输出相同的结果

高级特性

  1. 非阻塞操作

    shmem_put_nbi(dest, src, len, pe);  // 非阻塞 put
    shmem_quiet();  // 等待所有非阻塞操作完成
    
  2. 信号量

    long* lock = shmem_malloc(sizeof(long));
    shmem_set_lock(lock);  // 获取锁
    // 临界区代码
    shmem_clear_lock(lock);  // 释放锁
    
  3. 远程原子操作

    int fetched = shmem_int_fetch_add(remote_var, 1, pe);  // 原子加并返回旧值
    

性能优化建议

  1. 尽量减少同步操作(如 shmem_barrier_all
  2. 使用非阻塞操作和批量操作
  3. 合理利用对称内存布局
  4. 根据网络特性调整通信粒度

资源

  1. OpenSHMEM 官方规范
  2. OpenSHMEM 参考实现
  3. Sandia OpenSHMEM (SOS)
  4. Open MPI 的 OpenSHMEM 实现

OpenSHMEM 特别适合需要频繁进行远程内存访问的应用程序,如图算法、稀疏线性代数和某些类型的机器学习算法。

http://www.xdnf.cn/news/6212.html

相关文章:

  • contains方法的实现对比
  • Java 源码 HashMap源码分析
  • ConcurrentHashMap
  • GeoServer发布WMTS详细过程
  • javaScript简单版
  • 详解Windows(十三)——Windows防火墙
  • k8s监控方案实践补充(一):部署Metrics Server实现kubectl top和HPA支持
  • ESG时代,EcoVadis认证如何提升企业国际竞争力
  • 苍穹外卖--菜品分页查询
  • 优雅的请求接口(java)
  • 制造业降本增效的核心要素
  • 通过SMTP协议实现Linux邮件发送配置指南
  • 0514得物、0509滴滴面试总结复盘
  • 20250514 无限空间,当 a(t)→0,所有‌物理距离‌ d→0 ‌,这个状态是什么,是无限大的无限致密状态吗
  • 什么是临时对象?临时对象在什么情况下产生?
  • 网络检测工具InternetTest v8.9.1.2504 单文件版,支持一键查询IP/DNS、WIFI密码信息
  • 自营交易考试中,怎么用“黄昏之星”形态做出漂亮反转单?
  • 2025年文化传播、心理学与公共管理国际会议(CPPM 2025)
  • unordered_map和unordered的介绍和使用
  • 解密企业级大模型智能体Agentic AI 关键技术:MCP、A2A、Reasoning LLMs- consistency is the key
  • acwing 1488. 最短距离 超级源点 最短路 堆优化Dijkstra
  • Grafana变化趋势:Graph面板
  • SDIO EMMC中ADMA和SDMA简介
  • Linux常用命令40——alias设置命令别名
  • numpy 中数组的广播
  • 打破边界,智评未来:AI如何重塑学科交叉融合的评价体系?
  • 深度伪造对知识产权保护的新挑战与应对之策
  • 算法题(146):最大子段和
  • 山东大学软件学院软件工程计算机图形学复习笔记(2025)
  • 现代计算机图形学Games101入门笔记(四)