当前位置: 首页 > ai >正文

常见的卷积神经网络列举

经典的卷积神经网络(CNN)在深度学习发展史上具有重要地位,以下是一些里程碑式的模型及其核心贡献:


1. LeNet-5(1998)

  • 提出者:Yann LeCun
  • 特点
    • 首个成功应用于手写数字识别(MNIST)的CNN。
    • 结构:卷积层 + 池化层(当时用Subsampling) + 全连接层。
    • 使用Tanh激活函数,后续被ReLU取代。
  • 意义:奠定了CNN的基本结构。

2. AlexNet(2012)

  • 提出者:Alex Krizhevsky 等(Geoffrey Hinton团队)
  • 特点
    • 赢得ImageNet竞赛(ILSVRC 2012),top-5错误率大幅降低至15.3%。
    • 引入ReLU激活函数解决梯度消失。
    • 使用Dropout防止过拟合。
    • 首次采用GPU加速训练(双GPU并行)。
  • 意义:开启CNN在计算机视觉的黄金时代。

3. VGGNet(2014)

  • 提出者:牛津大学Visual Geometry Group
  • 特点
    • 核心思想:小卷积核(3×3)堆叠替代大卷积核,减少参数并增强非线性。
    • 常用版本:VGG-16 和 VGG-19(数字代表层数)。
    • 结构规整,易于迁移学习。
  • 意义:证明了深度的重要性,设计理念影响后续模型。

4. GoogLeNet(Inception v1, 2014)

  • 提出者:Google团队
  • 特点
    • 提出Inception模块:并行多尺度卷积(1×1、3×3、5×5)和池化,通过1×1卷积降维。
    • 引入辅助分类器缓解梯度消失。
    • 参数量仅为AlexNet的1/12,效率极高。
  • 后续改进:Inception v2/v3(BN、分解卷积)、v4(结合ResNet)。

5. ResNet(2015)

  • 提出者:何恺明等(Microsoft Research)
  • 特点
    • 残差连接(Residual Block):解决深层网络梯度消失问题,允许训练超过1000层的网络。
    • 赢得ILSVRC 2015,top-5错误率3.57%(超越人类水平)。
    • 变体:ResNeXt(分组卷积)、DenseNet(密集连接)。
  • 意义:成为现代CNN的基础结构。

6. 其他重要变体

  • MobileNet(2017):深度可分离卷积,轻量化设计。
  • EfficientNet(2019):复合缩放(深度/宽度/分辨率平衡)。
  • SENet(2017):通道注意力机制(Squeeze-and-Excitation模块)。

总结

模型核心贡献应用场景
LeNet-5首个CNN结构手写数字识别
AlexNetReLU/Dropout/GPU训练大规模图像分类
VGGNet小卷积核堆叠迁移学习基础
GoogLeNetInception多尺度模块高效计算
ResNet残差连接解决深度问题极深层网络设计

这些模型推动了CNN在图像分类、目标检测(如Faster R-CNN)、语义分割(如U-Net)等任务中的应用。

http://www.xdnf.cn/news/4338.html

相关文章:

  • 用go从零构建写一个RPC(仿gRPC,tRPC)--- 版本1(Client端)
  • Umi+React+Xrender+Hsf项目开发总结
  • 基于Django汽车数据分析大屏可视化系统项目
  • SSHv2 密钥交换(Key Exchange)详解
  • 体育培训的实验室管理痛点 质检LIMS如何重构体育检测价值链
  • TikTok 矩阵运营新手实操保姆级教程 2.0 版本
  • 从一次被抄袭经历谈起:iOS App 安全保护实战
  • 【AWS+Wordpress-准备阶段】AWS注册+创建EC2实例
  • Scrapy框架之Scrapyd部署及Gerapy分布式爬虫管理框架的使用
  • 记录学习《手动学习深度学习》这本书的笔记(十)
  • 协方差与皮尔逊相关系数:从定义到应用的全面解析
  • isNotBlank和isNotEmpty有什么区别?
  • Python学习笔记--FastAPI入门常规操作
  • penEuler操作系统结合豆包测试github仓库8086-Emulator项目
  • react中的用法——setDisabled dva dispatch effects
  • leetcode 160. 相交链表
  • os梳理5——第五章:存储器管理
  • 汽车免拆诊断案例|车辆行驶中急加速车身抖动故障排除 2 例
  • C# NX二次开发:投影曲线和偏置曲线UFUN函数详解
  • Redis--哈希类型
  • 深度学习中的autograd与jacobian
  • C++ 日志系统实战第四步:设计与代码实现详解
  • 从0开始学习大模型--Day03--Agent规划与记忆
  • “胖都来”商标申请可以通过注册不!
  • 如何应对客户在验收后提出新需求?
  • ESP32蓝牙开发笔记(十四)
  • Zsh + iTerm2搭配使用教学,非常舒服,macOS
  • 系统架构-云原生架构设计
  • 14前端项目----登录/注册
  • 【强化学习】#4 蒙特卡洛方法