当前位置: 首页 > web >正文

GPU加速与非加速的深度学习张量计算对比Demo,使用PyTorch展示关键差异


import torch
import time

# 创建大型随机张量 (10000x10000)
tensor_size = 10000
x_cpu = torch.randn(tensor_size, tensor_size)
x_gpu = x_cpu.cuda()  # 转移到GPU

# CPU矩阵乘法
start = time.time()
result_cpu = torch.mm(x_cpu, x_cpu.t())
cpu_time = time.time() - start

# GPU矩阵乘法
torch.cuda.synchronize()  # 确保GPU计时准确
start = time.time()
result_gpu = torch.mm(x_gpu, x_gpu.t())
torch.cuda.synchronize()
gpu_time = time.time() - start

print(f"CPU计算时间: {cpu_time:.4f}秒")
print(f"GPU计算时间: {gpu_time:.4f}秒")
print(f"加速比: {cpu_time/gpu_time:.1f}倍")
 

http://www.xdnf.cn/news/12234.html

相关文章:

  • 面试总结一
  • 微服务架构下的服务注册与发现:Eureka 深度解析
  • Dify源码教程:账户和密码传递分析
  • 十六进制数字接收的方式
  • Linux程序运行日志总结
  • 面试题:SQL 中如何将 多行合并为一行(合并行数据为列)?
  • 第46节:多模态分类(图像+文本)
  • 学习路之PHP--webman安装及使用
  • 11.MySQL事务管理详解
  • 十八、【用户认证篇】安全第一步:基于 JWT 的前后端分离认证方案
  • 物流瘫痪预警:亚马逊多仓爆仓,卖家如何抢占夏季性价比市场?
  • 【Android基础回顾】五:AMS(Activity Manager Service)
  • 【Java Web】9.Maven高级
  • AI编程助手入门指南:GitHub Copilot、Cursor与Claude的安装与基础使用
  • [ Qt ] | 与系统相关的操作(三):QFile介绍和使用
  • 零碳园区:多维构建绿色标杆,开启美丽中国新纪元
  • 抑郁症患者数据分析
  • Redis大量key集中过期怎么办
  • 环境变量深度解析:从配置到内核的全链路指南
  • DAY 22 Kaggle 比赛
  • 简化复杂系统的优雅之道:深入解析 Java 外观模式
  • 无人机军用与民用技术对比分析
  • C++自定义简单的内存池
  • 数据分析实战2(Tableau)
  • 极昆仑HybridRAG方案:突破原生 RAG 瓶颈,开启大模型应用新境界
  • 企业管理中,商业智能BI主要做哪些事情?
  • 优化学习笔记
  • 网络安全面试题目(无答案)
  • OrCAD X Capture CIS设计小诀窍系列第二季--03.如何在Capture中输出带有目录和元器件信息的PDF
  • 数数科技正式加入上海市人工智能协会,共筑DATA×AI新基建