当前位置: 首页 > news >正文

torch.matmul() VS torch.einsum()

torch.matmul():标准的矩阵乘法

  • 向量-向量(点积)

    a = torch.randn(3)  # [3]
    b = torch.randn(3)  # [3]
    c = torch.matmul(a, b)  # 点积,标量输出
    
  • 矩阵-向量

    A = torch.randn(3, 4)  # [3, 4]
    x = torch.randn(4)     # [4]
    y = torch.matmul(A, x) # [3]
    
  • 矩阵-矩阵

    A = torch.randn(3, 4)  # [3, 4]
    B = torch.randn(4, 5)  # [4, 5]
    C = torch.matmul(A, B) # [3, 5]
    
  • 批量矩阵乘法(更高维张量)

    A = torch.randn(2, 3, 4)  # [B, M, K]
    B = torch.randn(2, 4, 5)  # [B, K, N]
    C = torch.matmul(A, B)     # [B, M, N]
    

    torch.einsum:爱因斯坦求和约定(更通用的张量运算工具)

  • 矩阵乘法

    A = torch.randn(3, 4)
    B = torch.randn(4, 5)
    C = torch.einsum("ik,kj->ij", A, B)  # 等价于 A @ BA = torch.randn(2, 3, 4)  # [B, M, K]
    B = torch.randn(2, 4, 5)  # [B, K, N]
    C = torch.einsum("bik,bkj->bij", A, B)  # [B, M, N]a = torch.randn(3)
    b = torch.randn(3)
    c = torch.einsum("i,i->", a, b)  # 点积,标量输出
    
  • 转置

    A = torch.randn(3, 4)
    B = torch.einsum("ij->ji", A)  # 等价于 A.T
    
  • 对角线提取

  • 张量收缩(Tensor Contraction)(高阶张量乘法)

    A = torch.randn(2, 3, 4, 5)
    B = torch.randn(2, 4, 5, 6)
    C = torch.einsum("abcd,abde->abce", A, B)  # 对 d 维度收缩
    
  • 广播运算

torch.matmultorch.einsum
灵活性仅支持矩阵乘法类操作支持任意张量运算(转置、收缩等)
可读性直观(A @ B需要熟悉爱因斯坦求和约定
性能高度优化(推荐用于标准矩阵乘法)灵活但可能稍慢
广播支持
批量处理自动支持需显式指定批量维度
http://www.xdnf.cn/news/575533.html

相关文章:

  • 2025上半年软考准考证打印入口已开放!
  • ubuntu24.04+RTX5090D 显卡驱动安装
  • 支持向量存储:PostgresSQL及pgvector扩展详细安装步骤!老工程接入RAG功能必备!
  • 认知计算:迈向人类级智能的 AI 新范式
  • 关于对DDOS攻击的防御方法都有哪些?
  • EasyPan 使用及功能优化
  • 操作系统内存管理深度剖析:从虚拟内存机制到前沿技术探索
  • Spyglass:CDC官方Hands-on Training(一)
  • 什么是质量管理的核心要素?人、机、料、法、环、测解析
  • C++(26): 标准库 <queue>
  • 【原创】instagram 批量下载工具
  • 【优秀三方库研读】在 quill 开源库 Backend.h 知识点
  • docker面试题(3)
  • 滚珠丝杆的承载力是多少?
  • BISS0001 PIR红外感应IC:高性能热释电信号处理解决方案
  • MIMO 检测(6)--基于QR分解的ML检测器
  • 红杉资本2025 AI 峰会之Cybersecurity
  • 开源免费抓包工具:ProxyPin 的详细使用
  • Cross-Mix Monitoring for Medical Image Segmentation With Limited Supervision
  • 界面控件 Kendo UI 在各行业的应用实践:如何解决业务痛点,提升系统效能
  • [每日一题] 3356. 零数组变换ii
  • 常见的网络服务的枚举和利用 | TryHackMe | Network services 1/2
  • 【MySQL】表的内连和外连
  • svn 提交后报错 : is scheduled for addtion,but is missing
  • 总结一个编程的学习方式~
  • 【Linux基础I/O】文件调用接口、文件描述符、重定向和缓冲区
  • stack--oj2
  • 《国家高等教育智慧平台:重塑学习新时代》
  • java基础 之 Hash家族(一)
  • M|攻壳机动队2.0