当前位置: 首页 > news >正文

深度学习图像处理篇之AlexNet模型详解

AlexNet模型详解


文章目录

  • AlexNet模型详解
  • 一、AlexNet网络由来
  • 二、AlexNet网络及其亮点
    • 1.什么叫过拟合?
    • 2.Dropout随机失活
    • 3.卷积后矩阵大小计算公式
  • 三、AlexNet网络模型结构



一、AlexNet网络由来

AlexNet是2012年ISLVRC 2012(ImageNet Large Scale Visual Recognition Challenge)竞赛的冠军网络,分类准确率由传统的 70%+提升到 80%+。它是由Hinton和他的学生Alex Krizhevsky设计的。也是在那年之后,深度学习开始迅速发展。

二、AlexNet网络及其亮点

在这里插入图片描述
1.首次使用GPU进行网络加速训练。
2.使用ReLU激活函数。
3.使用了 LRN 局部响应归一化。
4.在全连接层的前两层中使用了Droupout随机失活神经元操作,以减少过拟合。

1.什么叫过拟合?

过拟合的根本原因是模型复杂度过高,训练数据量不足,存在大量噪声或异常值,导致拟合的函数完美的预测训练集,但对新数据的测试集预测结果差。过度的拟合了训练数据,而没有考虑到泛化能力。
在这里插入图片描述

2.Dropout随机失活

Dropout 主要用于 深度神经网络(DNN) 和 卷积神经网络(CNN) 中,尤其在数据量不足或网络结构较复杂时,能够有效避免过拟合。
Dropout优点:
1.防止过拟合
2.提高泛化能力
3.简便且高效
使用Dropout的方式在网络正向传播的过程中随机失活一部分神经元:

在这里插入图片描述
(左图为未使用Dropout的正向传播,右图为使用Dropout后的正向传播)

3.卷积后矩阵大小计算公式

N = ( W - F + 2P ) / S + 1

1.W为输入图片的大小为W✖W
2.F为卷积核的大小为F✖F
3.P指的是填充,即padding
4.S指的是步幅

三、AlexNet网络模型结构

下表为AlexNet网络各个卷积层和池化层的参数:
在这里插入图片描述
Conv1
卷积核大小:11✖11
卷积核数量:96(在AlexNet中,使用了两块GPU,因此卷积核数量为48✖2=96)
填充:[1,2](在上下两测填充1,在左右两侧填充为2)
步幅:4
输入的图像为[224,224,3],输出的特征矩阵shape:[55,55,96]
shape:N=(224-11+2✖2)/4+1=55

Maxpool1
卷积核大小:3✖3
填充:0
步幅:2
输入的特征矩阵shape:[55,55,96],输出的特征矩阵shape:[27,27,96]
shape:N=(55-3+2✖0)/2+1=27
(池化层的作用是减小输出的空间矩阵,并不会改变输入的通道数,因此在经过池化层的操作后,输入矩阵的通道数=输出矩阵的通道数)

Conv2
卷积核大小:5✖5
卷积核数量:128✖2=256
填充:2
步幅:1
输入的特征矩阵shape:[27,27,96],输出的特征矩阵shape:[27,27,256]
shape:N=(27-5+2✖2)/1+1=27

Maxpool2
卷积核大小:3✖3
填充:0
步幅:2
输入的特征矩阵shape:[27,27,256],输出的特征矩阵shape:[13,13,256]
shape:N=(27-3+2✖0)/2+1=13

Conv3
卷积核大小:3✖3
卷积核数量:192✖2=384
填充:1
步幅:1
输入的特征矩阵shape:[13,13,256],输出的特征矩阵shape:[13,13,384]
shape:N=(13-3+2✖1)/1+1=13

Conv4
卷积核大小:3✖3
卷积核数量:192✖2=384
填充:1
步幅:1
输入的特征矩阵shape:[13,13,384],输出的特征矩阵shape:[13,13,384]
shape:N=(13-3+2✖1)/1+1=13

Conv5
卷积核大小:3✖3
卷积核数量:128✖2=256
填充:1
步幅:1
输入的特征矩阵shape:[13,13,384],输出的特征矩阵shape:[13,13,256]
shape:N=(13-3+2✖1)/1+1=13

Maxpool3
卷积核大小:3✖3
填充:0
步幅:2
输入的特征矩阵shape:[13,13,256],输出的特征矩阵shape:[6,6,256]
shape:N=(13-3+2✖0)/2+1=6

FC1
unit_size: 2048✖2=4096
(unit_size为全连接层节点个数,因为有两块GPU,所以节点个数翻倍)

FC2
unit_size: 2048✖2=4096

FC2
unit_size: num_classes
(num_classes为我们需要的分类数目)

下图为AlexNet网络的结构图:
在这里插入图片描述

http://www.xdnf.cn/news/1241695.html

相关文章:

  • 【PHP】对比两张图片的相似度
  • WPF 按钮背景色渐变
  • 服务器的Mysql 集群技术
  • linux下docker安装ollama
  • Petalinux快捷下载
  • 部署 Kibana 8.2.2 可视化管理 Elasticsearch 8.2.2 集群
  • RabbitMQ--介绍
  • 【深度学习新浪潮】近三年零样本图像分类研发进展调研
  • 文件与目录操作命令
  • MySQL 基本操作入门指南
  • Apache IoTDB(3):时序数据库 IoTDB Docker部署实战
  • [GYCTF2020]FlaskApp
  • Nginx vs Spring Cloud Gateway:限流功能深度对比与实践指南
  • 直角坐标系里的四象限对NLP中的深层语义分析的积极影响和启示
  • spring boot开发中的资源处理等问题
  • 怎样推动AI技术在人机协同中的发展?
  • RTSP/RTMP播放器超低延迟实战:无人机远控视觉链路的工程实践
  • vue3+vue-flow制作简单可拖拽可增删改流程图
  • Qt 自动无法加载数据库为空
  • Go语言select
  • 开源的现代数据探索和可视化平台:Apache Superset 使用 Docker Compose
  • 笔记本电脑联想T14重启后无法识别外置红米屏幕
  • 如何手动打包 Linux(麒麟系统)的 Qt 程序
  • JVM学习专题(四)对象创建过程
  • 【Spring Boot 】Spring Boot + OpenAI API 万能集成模板,实现快速集成AI
  • sqli-labs通关笔记-第30关GET字符注入(WAF绕过 双引号闭合 手工注入+脚本注入两种方法)
  • AI Agents漏洞百出,恶意提示等安全缺陷令人担忧
  • 高防服务器租用的作用都有哪些?
  • 随笔之 ClickHouse 列式分析数据库安装注意事项及基准测试
  • 【BUUCTF系列】[SUCTF 2019]EasySQL1