当前位置: 首页 > ai >正文

SAE层、BPNN层结合的深度学习模型

Early Fault Detection of Machine Tools Based on Deep Learning and Dynamic Identification
Bo Luo , Haoting Wang , Hongqi Liu, Bin Li, and Fangyu Peng
IEEE TRANSACTIONS ON INDUSTRIAL ELECTRONICS, VOL. 66, NO. 1, JANUARY 2019

一 SAE层 (栈式自编码器层 - Stacked Autoencoder Layer)

功能:特征学习引擎 / 无监督组件。 它的主要工作是自动挖掘数据背后的深层结构和模式,提炼出更“好”的特征。

1.1 核心思想

自编码器: 一个需要压缩再解压数据的网络。由编码器,解码器组成。

训练目标: 让重建数据原始输入数据尽可能接近(最小化如均方误差MSE)。训练成功后,意味着“编码” 部分(即SAE层的输出)有效地代表了原始数据的核心特征。

栈式: 不是一个单独的SAE层,而是多层SAE层堆叠

1.2 构建过程

(1)用原始数据训练第一个自编码器,得到第一层特征表示 (h1)。

(2)把这层特征表示 (h1) 作为输入,训练第二个自编码器,得到更抽象的第二层特征表示 (h2)。

(3)重复此过程,层层叠加。

效果: 每层学习上一层特征的更抽象、更高级的表示。最终顶层SAE层的输出 (h_final) 就是整个栈提取的“精华”特征向量。

1.3 特点

无监督学习: 训练SAE层(微调前)不需要数据标签。

特征提取高手: SAE层不是为了最终的预测任务(如分类) 而训练,而是为了学习更好的输入数据表示方式。它输出的特征通常是低噪、紧凑、具有判别性的。

层叠结构: 由多层(多个)自编码器顺序堆叠构成。

位置: 通常在深度学习模型的前半部分/输入端

SAE层就像一个经验丰富的分析师团队(第一层分析师看微观数据 -> 第二层整合小组结论 -> … -> 顶层首席分析师)。他们不需要事先知道最终任务,专注于提炼数据报告的核心要点

二 BPNN层 (反向传播神经网络层)

 功能:任务执行者 / 监督学习组件。 它的工作是利用输入的特征(例如SAE层提取的特征),完成具体的预测任务(分类、回归等)。

2.1 核心思想

标准前馈神经网络: BPNN层指的是一层或多层普通的全连接神经网络(Dense/Fully-Connected Layer)

  • 它接收输入(可以是原始数据,但最好是像SAE层输出的优质特征)。
  • 通过加权求和 + 激活函数进行计算。
  • 输出最终的预测结果(如类别标签、预测值)。

 

反向传播:

训练的核心算法是“反向传播误差” 。

前向: 输入数据通过网络计算得到预测结果。

计算误差: 预测结果与实际标签(监督任务的“答案”)比较,算出损失值

反向: 依据损失值,从输出层倒推回去  计算网络中每一层权重(连接强度) 对损失值的贡献(梯度) 。

更新权重: 使用梯度下降 等优化算法,沿着梯度相反方向小幅调整所有权重,目标是使下次预测的损失值更小(预测更准)。

结构: 一个BPNN层(如隐藏层或输出层)就是由一组神经元构成,对来自上层所有神经元的信息进行加权组合并通过激活函数。一个完整的BPNN结构通常包括:

输入层 -> (隐藏层1 -> 隐藏层2 -> … ) -> 输出层

2.2 特点

监督学习: 需要数据标签 来计算预测结果的误差,从而指导权重更新。

万能函数逼近器: 理论上,只要有足够的层和神经元,BPNN(多层感知机)可以逼近任何复杂的非线性函数。

任务导向: 直接负责解决具体的预测任务(比如识别图像是猫还是狗,预测明天气温)。

位置: 通常在深度学习模型的后半部分/输出端。在SAE+BPNN模型中,紧接在SAE层之后

 

BPNN层就像一个决策者(比如基金经理)。他接收分析师团队(SAE层)提交的核心报告 (h_final 特征),结合市场知识(网络权重)。根据实际投资结果(标签),不断反思调整自己的决策逻辑(反向传播更新权重),目标是做出最正确的买卖决策(最终预测结果)。

三 二者在组合模型中的关系 (SAE+BPNN)

(1)SAE层打基础(前端): 无监督地、逐层地学习输入数据,一层层提取出高质量的高级特征 h_final。它的目标是“理解”数据本身的结构。(特征学习)

(2)BPNN层做应用(后端): 接收SAE层学到的优质特征 h_final 作为它的输入,然后利用BP算法,在带标签的数据指导下进行训练,最终解决特定的监督任务(分类/回归) 。它的目标是“执行”特定的判断或预测。(任务执行)

优势

(1)SAE层学到的强大特征输入,让BPNN层可以更简单、更快速、更准确地进行后续的监督学习和预测。

(2)SAE层的无监督预训练有助于解决网络较深时可能遇到的梯度消失/爆炸等训练难题(尤其在深度学习初期)。

(3)SAE特征通常更具鲁棒性(抗噪、对无关变化不敏感)。

四 总结

SAE层 = 无监督特征提取器。它像工厂的原材料精炼车间,把原始杂乱的数据“矿石”一步步提炼成纯净、标准化、高价值的“特征成品” (h_final)。

BPNN层 = 监督任务执行器。它像工厂的成品装配和质检车间。接收精炼好的“特征成品”,根据设计图纸和监督员的反馈(标签),不断优化自己的组装流程(权重),最终输出能满足客户要求的终极产品(预测结果)。

http://www.xdnf.cn/news/14206.html

相关文章:

  • C++ 环境配置
  • XRecorder:安卓录屏,轻松高效
  • 嵌入式PADS中Route布线操作与实现
  • OVS Faucet Tutorial笔记(下)
  • 动手学深度学习Pytorch版(李沐)(5-7章)
  • 使用STM32设置GPIO中断
  • 20250611题解
  • 抖音蓝牙遥控器芯片方案、自拍器蓝牙芯片方案 简易版 io控制
  • 高精度模板
  • 【Spring源码核心篇-08】spring中配置类底层原理和源码实现
  • torchsummary库中的summary()函数
  • Kerberos快速入门之基本概念与认证基本原理
  • OpenLayers 创建坐标系统
  • Flower框架中noise_multiplier与clipped_count_stddev的关系
  • [智能客服project] AI代理系统 | 意图路由器
  • pikachu靶场通关笔记30 文件包含01之本地文件包含
  • Typecho安装后后台 404 报错解决
  • CMake实践: 以开源库QSimpleUpdater为例,详细讲解编译、查找依赖等全过程
  • Reqable・API 抓包调试 + API 测试一站式工具
  • 17_Flask部署到网络服务器
  • 【软测】接口测试 - 用postman测试软件登录模块
  • 微机原理与接口技术,期末冲刺复习资料(汇总版)
  • Linux进程间通信(IPC)详解:从入门到理解
  • H5 技术与定制开发工具融合下的数字化营销新探索
  • 高效录屏工具推荐:从系统自带到专业进阶
  • 函数调用过程中的栈帧变化
  • 普通Dom转换为可拖拽、最大化、最小化窗口js插件
  • 【在线五子棋对战】六、项目结构设计 工具模块实现
  • 【unitrix】 1.6 数值类型基本结构体(types.rs)
  • 商用油烟净化器日常维护的标准化流程