当前位置: 首页 > backend >正文

Neural Network Layer|神经网络的层

-----------------------------------------------------------------------------------------------

这是我在我的网站中截取的文章,有更多的文章欢迎来访问我自己的博客网站rn.berlinlian.cn,这里还有很多有关计算机的知识,欢迎进行留言或者来我的网站进行留言!!!

-----------------------------------------------------------------------------------------------

一、神经网络的层的定义

神经网络的层(Neural Network Layer)是构成深度学习模型的基本组件,每一层由多个神经元(或节点)组成,负责对输入数据进行特定计算(如加权求和、非线性激活等),并将结果传递到下一层。通过堆叠不同的层(如输入层、隐藏层、输出层),神经网络能够逐步提取和组合特征,最终完成分类、回归等任务。

通俗理解

可以把神经网络的层想象成工厂的流水线:每一层就像一道加工工序,原始数据(比如图片)经过第一层简单处理(比如识别边缘),再到下一层组合更复杂的特征(比如眼睛、鼻子),最后输出结果(比如“这是一只猫”)。层数越多,网络能学到的特征就越抽象和高级!


二、神经网络的计算过程

1. 输入层

1F85D8CF-B5B2-4FE3-A6EA-5375CD8907DD.png

  1. 输入层:向量x⃗。[197, 184, 136, 214]


2. 隐藏层

有三个神经元,每一个神经元都要接收输入层的所输入的数字,然后进行一个函数计算。

  • 图中使用的是Sigmoid函数进行计算。这种函数用于神经元计算的就叫做激活函数。

  • 其中三个神经元所算出来的值分别是:[0.3,0.7,0.2],然后这个向量结果继续输入到第二层隐藏层。

  • 这个 [1],[2] 的含义分别是隐藏层的编号,其中输入层为 [0]


3. 输出层

814A12AC-9B96-49AD-ACC1-3CB1E0103BC6.png

有一个神经元,把隐藏层计算出来的结果输入到输出,然后进行一个函数计算。

  • 图中使用的是Sigmoid函数进行计算。

  • 这个神经元所算出来的值分别是:[0.84],然后这个向量结果输出。

  • 这个 [1],[2] 的含义分别是隐藏层的编号,其中输入层为 [0]。这里注意的是,输出层的 w1[2] 和 b1[2] 中是用该层的w和b,而不是上一层的,所以标识了 [2],但是 a[1] 是用第一层输出的结果,所以标识了 [1]


4. 输出结果

725B82FA-8508-4BA3-99A7-ABF90F65B889.png

最终输出的结果为 0.84,然后可以根据这个来进行计算分类


三、多层神经网络的计算过程

D3E6030A-F753-4C91-9B7B-B645E8B9B26D.png

这里也是和上面的同理,只是经过的隐藏层数增多

不过要特别注意的是:要清楚知道每一层中的神经元用的 w ,b , a 用的是哪个。


例子:手写数字识别

194B4BF7-EB35-4C73-825B-C4331C2A65EB.png

1. 网络结构
  • 输入层:接收手写数字图像(如数字 "8"、"2"、"1" 的示例)。

  • 隐藏层

    • Layer 1:25 个隐藏单元(神经元)。

    • Layer 2:15 个隐藏单元。

  • 输出层(Layer 3):

    • 1 个输出单元,预测输入图像为手写数字 "1" 的概率。

    • 标签(label)为二分类形式(0 或 1)。

2. 数学表达
  • 每个隐藏神经元的计算使用激活函数 g(未明确类型,可能是 Sigmoid 或 ReLU):

    F4756E0D-7181-45EE-BA4D-53D3FD27F609.png

    • wi[1]:第 1 层第 i 个神经元的权重向量。

    • x⃗:输入特征向量。

    • bi[1]:第 1 层第 i 个神经元的偏置。

3. 关键说明
  • 输出层:直接输出概率值(如 "是数字 1" 的概率)。

  • 表格中的 : 符号表示未完全展示的神经元连接。


前向传播

神经网络的层(图五).png

  1. 数据流动方向:输入 → 第一层(25个神经元)→ 第二层(15个神经元)→ 输出层

  2. 每层计算

    • 输入数字图片

    • 第一层处理完输出25个值(a¹)

    • 第二层处理完输出15个值(a²)

    • 输出层最终给出1个概率值(a³)

  3. 结果判断

    • 输出值>0.5 → 是数字"1"

    • 输出值≤0.5 → 不是"1"


四、单层神经网络与多层神经网络对比

对比项

单层神经网络

多层神经网络

结构

只有输入层和输出层

包含输入层、多个隐藏层和输出层

能力

只能解决线性可分问题

可以解决复杂的非线性问题

计算量

计算量小,训练速度快

计算量大,训练速度慢

特征提取

需要人工设计特征

可以自动学习多层次特征

适用场景

简单分类/回归任务

图像识别、自然语言处理等复杂任务

 ----------------------------------------------------------------------------------------------

这是我在我的网站中截取的文章,有更多的文章欢迎来访问我自己的博客网站rn.berlinlian.cn,这里还有很多有关计算机的知识,欢迎进行留言或者来我的网站进行留言!!!

-----------------------------------------------------------------------------------------------

http://www.xdnf.cn/news/17932.html

相关文章:

  • Latex使用了期刊templates但是字体样式不对
  • Vue 3.5+ Teleport defer 属性详解:解决组件渲染顺序问题的终极方案
  • 数字化与人工智能的崛起及其社会影响研究报告
  • CentOS 7 一键部署 上Maria Database(MariaDB)10.3.38 安装手册(避开 Oracle 19c 路径)
  • UE5多人MOBA+GAS 46、制作龙卷风技能
  • draw.io编辑 UML 类图
  • Cohere 开发企业级大型语言模型(LLM)
  • css实现圆角+边框渐变+背景半透明
  • 开源数据发现平台:Amundsen Frontend Service React 配置 Flask 配置 Superset 预览集成
  • DeepResearch开源与闭源方案对比
  • python线程学习
  • 日语学习-日语知识点小记-进阶-JLPT-N1阶段蓝宝书,共120语法(2):11-20语法
  • 深入解析C++ STL链表(List)模拟实现
  • 【C++】类和对象——默认成员函数(中上)
  • OpenCV安装及配置
  • 【C 学习】06-算法程序设计举例
  • 基于51单片机的智能吊灯
  • 零改造迁移实录:2000+存储过程从SQL Server滑入KingbaseES V9R4C12的72小时
  • Obot MCP 网关:用于安全管理 MCP 服务器采用的开源平台
  • 大模拟 Major
  • 《吃透 C++ 类和对象(中):const 成员函数与取地址运算符重载解析》
  • Horse3D游戏引擎研发笔记(六):在QtOpenGL环境下,仿Unity的材质管理Shader绘制四边形
  • 复杂度扫尾+链表经典算法题
  • 《P1194 买礼物》
  • JAVA 关键字
  • OpenCV---getStructuringElement 结构元素获取
  • MySQL知识点(上)
  • LLaMA Factory 是一个简单易用且高效的大型语言模型(Large Language Model)训练与微调平台。
  • 推荐一款高性能状态机管理解决方案
  • 专题三_二分_x 的平方根