当前位置：首页 > backend >正文

CUDA编程11 - CUDA异步执行介绍

backend 2025/9/2 13:59:34

CPU 和 GPU 是两个独立的处理器，CPU负责逻辑处理，调用CUDA API，GPU 负责大规模并行计算。当在CPU上调用CUDA API（比如数据拷贝）时，通常是异步的，调用会立刻返回，CPU不会等待GPU完成，GPU会把请求放到stream流中按顺序执行。这样可以让CPU和GPU并行工作。

一：概述

CUDA Stream 是一条GPU命令队列，同一条GPU命令队列中的任务按顺序执行，比如下面这个调用会严格按顺序执行。

cudaMemcpyAsync(H2D) -> kernel -> cudaMemcpyAsync(D2H)

不同Stream之间（stream0， stream1，...）的任务，可能并行执行（取决于GPU硬件）。

CUDA Event 是插在 Stream 里的“标记点”，主要用途是“计时”， “查询进度”，“同步” 等。举例：

cudaEventRecord(start, 0);
// 一些 GPU 操作
cudaEventRecord(stop, 0);
cudaEventElapsedTime(&ms, start, stop);

http://www.xdnf.cn/news/19539.html

相关文章：

Java 不支持在非静态内部类中声明静态 Static declarations in inner classes are not supported异常处理

elasticsearch中文分词器analysis-ik使用

Uniapp 生命周期详解：页面生命周期 vs 应用生命周期（附实战示例）

大模型应用开发面试实录：LLM原理、RAG工程与多Agent场景化落地解析

gh-pages部署github page项目

DAY 20 奇异值SVD分解-2025.9.1

计组（2）CPU与指令

（ssh客户端）远程连接工具windterm使用教程（ssh工具、远程工具）

MiniCPM-V-4.5：重新定义边缘设备多模态AI的下一代视觉语言模型

飞腾2000+/64核 PCIE扫描异常问题排查

COM组件——ServicedComponent 类

【架构师干货】系统架构设计

Vue3 + MQTT + 高德地图实现车辆在线状态与实时位置更新

云手机和云游戏之间有着哪些区别？

qData 数据中台【开源版】发布 1.0.4 版本，全面升级数据清洗与资产管理能力

使用LoadBalancer替换Ribbon（五）

使用C#语言基于FTP协议进行文件夹上传下载

ansible知识点总结1

C/C++ Linux系统编程：进程通讯完全指南，管道通讯、共享内存以及消息队列

Linux之Docker虚拟化技术（三）

nacos微服务介绍及环境搭建

Oracle 查询有哪些用户提示用户名密码无效

AI 入门指南：从 “听不懂人话” 到 “比你懂你”，人工智能到底是个啥？

shell编程函数、数组与正则表达式

网络与信息安全有哪些岗位：（13）安全服务工程师 / 顾问

pip不是内部或外部命令的问题怎么解决？

基于.NET Framework 4.0的FTP文件传输类

【云存储桶安全】怎么满足业务需求，又最大程度上满足信息安全要求呢？

构建深度学习音频识别模型：从数据预处理到性能评估

【K8s】整体认识K8s之监控与升级/ETCD的备份和恢复/kustomization/CRD