当前位置: 首页 > backend >正文

处理图像的深度神经网络(DNN)有哪些呢?

我按应用领域经典结构类别来总结一下:


✅ 一、图像处理常见任务

任务类型所用网络
图像分类CNN、ResNet、VGG、DenseNet、EfficientNet
目标检测R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD、RetinaNet
图像分割U-Net、FCN、DeepLab系列、SegNet、Mask R-CNN
图像生成GAN、DCGAN、Pix2Pix、CycleGAN、StyleGAN
超分辨率SRCNN、ESPCN、EDSR、SRGAN
图像风格迁移VGG-based Style Transfer、AdaIN、CycleGAN
图像重建/去噪DnCNN、UNet、RED-Net、AutoEncoder
特征提取/对比学习SimCLR、MoCo、BYOL、ResNet变体

✅ 二、按模型结构分类

1. 卷积神经网络(CNN类)
  • LeNet-5:最早用于手写数字识别。
  • AlexNet:2012年ImageNet冠军,开启深度CNN时代。
  • VGG16 / VGG19:结构简单但层数深,卷积核固定为3×3。
  • GoogLeNet (Inception):使用不同大小卷积核组合,提升特征提取能力。
  • ResNet:引入残差结构(skip connection),解决深层网络退化问题。
  • DenseNet:每层连接所有前面层的输出,增强特征传播。
  • EfficientNet:通过复合缩放策略提高效率和精度。
2. Transformer结构(Vision Transformer类)
  • ViT (Vision Transformer):将图像划分为patch,再输入Transformer。
  • Swin Transformer:采用局部窗口注意力和层次结构,兼顾精度和效率。
  • DeiT:数据高效版ViT,适合小数据训练。
3. 混合结构
  • ConvNeXt:融合CNN与Transformer优点的结构。
  • CoaT、T2T-ViT、MobileViT:针对小模型场景优化的混合架构。

✅ 三、生成与对抗模型(用于图像生成、重建)

  • AutoEncoder / Variational AutoEncoder (VAE)
  • GAN(生成对抗网络)
    • DCGAN:最基本的生成式网络
    • Pix2Pix / CycleGAN:用于图像翻译、风格迁移
    • StyleGAN / StyleGAN2:用于超清图像生成、人脸合成

✅ 四、语义分割网络(像素级任务)

  • FCN(Fully Convolutional Network)
  • U-Net / U-Net++
  • DeepLabV3 / V3+
  • Mask R-CNN:目标检测+分割二合一

http://www.xdnf.cn/news/222.html

相关文章:

  • 基于n8n的AI应用工作流原理与技术解析
  • android编译使用共享缓存
  • java基础问题
  • 用DeepSeek制作会议记录
  • 【Pandas】pandas DataFrame where
  • 自动驾驶安全模型研究
  • SuperMap iClient3D for WebGL 如何加载WMTS服务
  • 5.1 城市给水排水管道工程
  • Flutter异常Couldn‘t find dynamic library in default locations
  • 关于GPU的涡轮散热与被动散热
  • SpringBoot私人西服系统开发与设计
  • 利用deepseek+Mermaid画流程图
  • Day94 | 灵神 | 二叉树 统计二叉树中好点的数目
  • Javaweb实操(一)—Servlet实现单表的CRUD操作
  • 利用 SSRF 和 Redis 渗透
  • transformer-词嵌入和位置嵌入详解
  • postman使用设置
  • 2025 年第十五届 MathorCup竞赛赛题浅析-助攻快速选题
  • Qt工具栏中添加按钮QAction
  • 内网穿透服务器—FRP
  • 深入理解分布式缓存 以及Redis 实现缓存更新通知方案
  • 基于Ubuntu22.04和OpenCV4.5.4的物联网人脸识别考勤机
  • java线程池原理及使用和处理流程
  • 隐马尔可夫模型(HMM)与序列标注任务详解
  • hadoop三大组件的结构及各自的作用
  • Python作业4 文本词云统计,生成词云
  • 欣佰特携数十款机器人相关前沿产品,亮相第二届人形机器人和具身智能行业盛会
  • 在国产麒麟Kylin Linux Advanced Server V10中使用QT5开发环境并支持中文输入
  • SimBody安装
  • AI中台系统设计方案探讨