当前位置: 首页 > ops >正文

GPGPU基本概念

1、标量计算

        数据定义:标量即为单个数据;
计算模式:D = A * B + C,A、B、C、D均为标量;
数据类型:INT、INT32、FP32、FP32;
计算单元:cuda core。

2、向量计算

        数据定义:可理解为一维数组;
计算模式:D = A * B + C,A、B、C、D均为向量;
数据类型:INT、INT32、FP32、FP32;
计算单元:cuda core。

3、矩阵计算

        数据定义:可理解为二维数组;
计算模式:D = A * B + C,A、B、C、D均为矩阵;
数据类型:INT、INT32、FP32、FP32;
计算单元:cuda core。

4、张量计算

        数据定义:可理解为多维数组;
计算模式:D = A * B + C,A、B、C、D均为向量;
数据类型:INT、INT32、FP32、FP32;
计算单元:tensor core,tensor core提供GEMM(Genernal Matrix Multiply);
举例说明:如RGB三通道彩色图片,有Width/High/Channel三个坐标。

5、CNN

        卷积神经网络(Convolutional Neural Network)

  • 层级结构:输入层->(卷积层->激活函数->池化层)*N->全连接层->批归一化层->丢弃层;
  • 卷积层:提取局部特征(如边缘、纹理);
  • 激活层:引入非线性,使网络能拟合复杂函数;
  • 池化层:降维、平移不变性、减少计算量;
  • 全连接层:整合全局特征用于分类/回归;
  • 批归一化层:加速训练、减少对初始化的敏感度;
  • 丢弃层:训练时随机屏蔽部分神经元(如比例0.5),减少过拟合。

    6、RNN

            循环神经网络(Recurrent Neural Network)

    7、GNN

            图神经网络(Graph Neural Network)

    8、卷积计算

            卷积计算示意图如下,可见卷积计算的主要内容为乘加运算:

    9、激活

    • 作用:引入非线性,使网络能拟合复杂函数;
    • 常用类型ReLU:f(x)=max⁡(0,x)f(x)=max(0,x),缓解梯度消失,计算高效;
      Leaky ReLU:允许负值斜率(如0.01x),缓解神经元死亡;
      Sigmoid/Tanh:少用于中间层(易饱和),多用于输出层(如二分类)。

    10、池化

    • 功能:降维、平移不变性、减少计算量;
    • 类型最大池化(Max Pooling):取窗口内最大值(保留显著特征);
                 平均池化(Average Pooling):取窗口均值(平滑特征);
    • 参数:窗口大小(如2×2)、步长(通常等于窗口大小)。
    http://www.xdnf.cn/news/16375.html

    相关文章:

  • PiscCode实现从图像到字符艺术
  • Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现PCB上二维码检测识别(C#代码UI界面版)
  • 北大区块链技术与应用 笔记
  • 虚拟机ubuntu20.04共享安装文件夹
  • AI驱动的金融推理:Fin-R1模型如何重塑行业决策逻辑
  • docker搭建部署 onlyoffice 实现前端集成在线解析文档解决方案
  • elasticsearch 倒排索引原理详解
  • LeetCode 923.多重三数之和
  • 面试150 数字范围按位与
  • 第六章 JavaScript 互操(3)JS调用.NET
  • Ubuntu服务器安装与运维手册——操作纯享版
  • 算法竞赛阶段二-数据结构(37)数据结构动态链表list
  • CLAP文本-音频基础模型: LEARNING AUDIO CONCEPTS FROM NATURAL LANGUAGE SUPERVISION
  • 机器学习的算法有哪些?
  • Jmeter的元件使用介绍:(八)断言器详解
  • Android网络框架封装 ---> Retrofit + OkHttp + 协程 + LiveData + 断点续传 + 多线程下载 + 进度框交互
  • 【C++】论如何封装红黑树模拟实现set和map
  • haproxy七层代理(知识点+相关实验部署)
  • 面试150 只出现一次的数字Ⅱ
  • [AI8051U入门第十一步]W5500-服务端
  • 点击劫持:潜藏在指尖的安全陷阱
  • 腾讯云AI代码助手CodeBuddy开发指导
  • bash的特性-命令和文件自动补全
  • 深度学习中的计算图与自动微分原理:静态图与动态图的实现差异
  • 【Oracle】Oracle分区表“排雷“指南:当ORA-14400错误找上门时如何优雅应对
  • 关于GateWay网关
  • 显式等待和隐式等待的区别
  • 【星野AI】minimax非活动时间充值优惠漏洞
  • 基于springboot的图书借阅系统
  • 《计算机组成原理与汇编语言程序设计》实验报告二 基本数字逻辑及汉字显示