当前位置: 首页 > web >正文

深度学习入门(十三):加深网络

首先要认识一点,深度学习是加深了层的深度神经网络。

加深网络

首先回顾前面,我们了解了构成神经网络的各种层、学习时的有效方法、对图像特别有效的CNN、参数的最优化方法等。这些都是深度学习中的重要技术。

更深层的网络

在这里插入图片描述
如图所示的是一个CNN,但是它比之前的所有网络都要深。这里使用的卷积层是3X3的小型滤波器,特点是随着层的加深,通道数变大。此外,插入了池化层,以逐渐减小中间数据的空间大小;并且后面的全连接层中使用了Dropout层。
这个网络使用He初始值作为权重的初始值,使用Adam更新权重参数。因此总共具有以下特点:

• 基于3×3的小型滤波器的卷积层。
• 激活函数是ReLU。
• 全连接层的后面使用Dropout层。
• 基于Adam的最优化。
• 使用He初始值作为权重初始值。

所以可以说这是一个加深的神经网络,使用了多个之前提到的技术。这个网络的识别精度高达99%,只有在极其严苛的情况下才会识别失败,连人眼也无法识别出。也就是说,这样经过训练的神经网络可以达到和人眼识别近似一样的效果,因此可以说存在巨大的可能性。

进一步提高识别精度

对于MNIST数据集,层不用特别深就获得了(目前)最高的识别精度。一般认为,这是因为对于手写数字识别这样一个比较简单的任务,没有必要将网络的表现力提高到那么高的程度。因此,可以说加深层的好处并不大。

集成学习、学习率衰减、Data Augmentation(数据扩充)等都有助于提高识别精度。尤其是数据扩充,方法简单而效果显著。
Data Augmentation基于算法“人为地”扩充输入图像(训练图像)。具体地说,如图所示,对于输入图像,通过施加旋转、垂直或水平方向上的移动等微小变化,增加图像的数量。这在数据集图像数量有限时尤其有效。
在这里插入图片描述
除了如图所示的变形之外,Data Augmentation还可以通过其他各种方法扩充图像,比如裁剪图像的 “crop处理”、将图像左右翻转的“flip 处理”(只在不需要考虑图像对称性的情况下有效)等。
对于一般的图像,施加亮度等外观上的变化、放大缩小等尺度上的变化也是有效的。

加深层的动机

加深层的重要性理论研究还不够透彻。但是有几点可以从过往的研究和实验中得以解释(虽然有一些直观)。
首先,从以ILSVRC为代表的大规模图像识别的比赛结果中可以看出加深层的重要性,因为从前几名看,他们的方法多是基于深度学习的,并且有逐渐加深网络的层的趋势。也就是说,可以看到层越深,识别性能也越好。
加深层的一个好处是可以减少网络的参数数量。与没有加深层的网络相比,加深了层的网络可以用更少的参数达到同等水平(或者更强)的表现力。
在这里插入图片描述
如图示是5X5卷积的例子
在这里插入图片描述
如图是两次重复3X3卷积的例子。
明显可以看到:一次5×5的卷积运算的区域可以由两次3×3的卷积运算抵充。并且,相对于前者的参数数量25(5×5),后者一共是18(2×3×3),通过叠加卷积层,参数数量减少了。而且,这个参数数量之差会随着层的加深而变大。

加深层的另一个好处就是使学习更加高效。与没有加深层的网络相比,通过加深层,可以减少学习数据,从而高效地进行学习。具体地说,在前面的卷积层中,神经元会对边缘等简单的形状有响应,随着层的加深,开始对纹理、物体部件等更加复杂的东西有响应。
通过加深网络,就可以分层次地分解需要学习的问题。因此,各层需要学习的问题就变成了更简单的问题。
通过加深层,可以分层次地传递信息,这一点也很重要。

这里需要注意的是,近几年的深层化是由大数据、计算能力等即便加深层也能正确地进行学习的新技术和环境支撑的。

http://www.xdnf.cn/news/9111.html

相关文章:

  • 【通用智能体】Dify API 文件上传功能: 两种传参方式的API传参方式
  • 《算法笔记》13.2小节——专题扩展->树状数组(BIT) 问题 D: 数列-训练套题T10T3
  • ArcGIS Pro 3.4 二次开发 - 几何引擎
  • AI时代新词-零样本学习(Zero-Shot Learning):AI的未来趋势
  • Queue 与 Deque 有什么区别?
  • FFMPEG-FLV-MUX编码
  • 洛谷 P3374 【模板】树状数组 1(线段树解法)
  • 【小白AI教程】大模型知识扫盲通识
  • 图片文件未正确加载​—— Webpack 无法正确解析图片,生成了一个空的 Base64 URL
  • 人工智能100问☞第33问:什么是计算机视觉?
  • 力扣HOT100之回溯:17. 电话号码的字母组合
  • MyBatis 动态 SQL 详解:灵活构建强大查询
  • 开源 FcDesigner 表单设计器组件事件详解
  • JavaScript面试题之深浅拷贝
  • PBX、IP PBX、FXO 、FXS 、VOIP、SIP 的概念解析以及关系
  • SpringAI(GA):Tool工具整合—快速上手
  • [7-1] ADC模数转换器 江协科技学习笔记(14个知识点)
  • 开源软件协议大白话分类指南
  • [yolov11改进系列]基于yolov11引入自注意力与卷积混合模块ACmix提高FPS+检测效率python源码+训练源码
  • 常见算法题目4 - 给定一个字符串,判断是否为有效的括号
  • 鸿蒙桌面快捷方式开发
  • 进程通信(管道,共享内存实现)
  • 【unity游戏开发——编辑器扩展】Gizmos可视化辅助工具
  • Leetcode 1924. 安装栅栏 II
  • RabbitMQ 集群与高可用方案设计(二)
  • PyTorch实战(7)——生成对抗网络(Generative Adversarial Network, GAN)实践详解
  • 黑龙江云前沿-服务器托管
  • CentOS7安装 htop(100% 可以安上)
  • 使用VuePress开发日志
  • Redis与Lua脚本深度解析:原理、应用与最佳实践