当前位置: 首页 > news >正文

机器学习:反向神经元传播公式推导

首先,我们有正向传播的公式:
qk+1,i=∑j=1nkwk+1,i,j⋅rk,j+bk+1,i q_{k+1,i}=\sum_{j=1}^{n_{k}} w_{k+1,i,j}\cdot r_{k,j}+b_{k+1,i} qk+1,i=j=1nkwk+1,i,jrk,j+bk+1,i

∂l∂wk,i,j=∂l∂qk,i⋅∂qk,i∂wk,i,j=∂l∂qk,i⋅rk−1,j \begin{aligned} \frac{\partial l}{\partial w_{k,i,j}}&= \frac{\partial l}{\partial q_{k,i}}\cdot\frac{\partial q_{k,i}}{\partial w_{k,i,j}}\\ &=\frac{\partial l}{\partial q_{k,i}}\cdot r_{k-1,j} \end{aligned} wk,i,jl=qk,ilwk,i,jqk,i=qk,ilrk1,j

∂l∂bk,i=∂l∂qk,i⋅∂qk,i∂bk,i=∂l∂qk,i \begin{aligned} \frac{\partial l}{\partial b_{k,i}} &=\frac{\partial l}{\partial q_{k,i}}\cdot\frac{\partial q_{k,i}}{\partial b_{k,i}}\\ &=\frac{\partial l}{\partial q_{k,i}} \end{aligned} bk,il=qk,ilbk,iqk,i=qk,il

观察这个式子:

qk+1,i=∑j=1nkwk+1,i,j⋅rk,j+bk+1,i q_{k+1,i}=\sum_{j=1}^{n_{k}} w_{k+1,i,j}\cdot r_{k,j}+b_{k+1,i} qk+1,i=j=1nkwk+1,i,jrk,j+bk+1,i

我们考察 rk,jr_{k,j}rk,jqk+1,iq_{k+1,i}qk+1,i 的影响,发现:
∂qk+1,i∂rk,j=wk+1,i,j \frac{\partial q_{k+1,i}}{\partial r_{k,j}} =w_{k+1,i,j} rk,jqk+1,i=wk+1,i,j

进而:

∂qk+1,i∂qk,j=∂qk+1,i∂rk,j⋅∂rk,j∂qk,j=wk+1,i,j⋅fk′(qk,j) \begin{aligned} \frac{\partial q_{k+1,i}}{\partial q_{k,j}} &= \frac{\partial q_{k+1,i}}{\partial r_{k,j}} \cdot \frac{\partial r_{k,j}}{\partial q_{k,j}} \\ &= w_{k+1,i,j} \cdot f_k^{'}(q_{k,j}) \end{aligned} qk,jqk+1,i=rk,jqk+1,iqk,jrk,j=wk+1,i,jfk(qk,j)

因此:

δk,j=∂l∂qk,j=∂l∂qk+1,i⋅∂qk+1,i∂qk,j=δk+1,i⋅∂qk+1,i∂qk,j \begin{aligned} \delta_{k,j} = \frac{\partial l}{\partial q_{k,j}} &= \frac{\partial l}{\partial q_{k+1,i}} \cdot \frac{\partial q_{k+1,i}}{\partial q_{k,j}} \\ &= \delta_{k+1,i} \cdot \frac{\partial q_{k+1,i}}{\partial q_{k,j}} \\ \end{aligned} δk,j=qk,jl=qk+1,ilqk,jqk+1,i=δk+1,iqk,jqk+1,i

最后,由于每一个神经元对下一层有多条影响路径,所以对其求和,并带入
∂qk+1,i∂qk,j\frac{\partial q_{k+1,i}}{\partial q_{k,j}}qk,jqk+1,i

δk,j=∂l∂qk,j=∑i=1nk+1∂l∂qk+1,i⋅∂qk+1,i∂qk,j=fk′(qk,j)⋅∑i=1nk+1δk+1,i⋅wk+1,i,j \begin{aligned} \delta_{k,j}= \frac{\partial l}{\partial q_{k,j}} &= \sum_{i=1}^{n_{k+1}} \frac{\partial l}{\partial q_{k+1,i}} \cdot \frac{\partial q_{k+1,i}}{\partial q_{k,j}} \\ &= f_k^{'}(q_{k,j}) \cdot \sum_{i=1}^{n_{k+1}} \delta_{k+1,i} \cdot w_{k+1,i,j} \end{aligned} δk,j=qk,jl=i=1nk+1qk+1,ilqk,jqk+1,i=fk(qk,j)i=1nk+1δk+1,iwk+1,i,j

l=L(rT1,rT2,...rTnT,y1,y2,...ynT)l=L(r_{T1}, r_{T2}, ... r_{Tn_T}, y_1, y_2, ... y_{n_T})l=L(rT1,rT2,...rTnT,y1,y2,...ynT)

∂l∂qTi=∂l∂rTi⋅∂rTi∂qTi=∂l∂rTi⋅fT′(qTi) \begin{aligned} \dfrac{\partial l}{\partial q_{Ti}}&=\dfrac{\partial l}{\partial r_{Ti}}\cdot\dfrac{\partial r_{Ti}}{\partial q_{Ti}}\\ &=\dfrac{\partial l}{\partial r_{Ti}}\cdot f_T^{'}(q_{Ti}) \end{aligned} qTil=rTilqTirTi=rTilfT(qTi)

http://www.xdnf.cn/news/1095625.html

相关文章:

  • 网安-解决pikachu-rce乱码问题
  • 企业使用银河麒麟系统下载vscode显示界面不全
  • swift开发,关于应用、页面、视图的生命周期
  • WIFI协议全解析05:WiFi的安全机制:IoT设备如何实现安全连接?
  • 【数据结构】时间复杂度和空间复杂度
  • 解析LLM层裁剪:Qwen实战指南
  • XMAPP MySQL 启动后自动停止
  • Java-69 深入浅出 RPC 单体架构 垂直架构 分布式架构 微服务架构
  • 堆的应用(讲解超详细)
  • 学习软件测试的第十四天(移动端)
  • ElementUI:高效优雅的Vue.js组件库
  • 【HarmonyOS Next之旅】DevEco Studio使用指南(四十二) -> 动态修改编译配置
  • Eigen中四元数、欧拉角、旋转矩阵、旋转向量之间的转换
  • 解锁医疗新视界:医患共决策时间轴AI可视化工具
  • HighReport报表工具开始支持BS报表设计器
  • msf复现永恒之蓝
  • 不止于快:金士顿XS2000移动固态硬盘如何重塑你的数字生活
  • 32多串300A保护板测试仪:新能源电池安全的核心守护者
  • 服务器组件与 Actions:重塑 React 数据交互
  • Linux 内核日志中常见错误
  • 前端开发资源压缩与请求优化
  • 编译OpenHarmony-4.0-Release RK3566 报错
  • 鸿蒙开发文档
  • Linux入门篇学习——Linux 工具之 make 工具和 makefile 文件
  • 观成科技:基于自监督学习技术的恶意加密流量检测方案
  • 论文精读(一)| 量子计算系统软件研究综述
  • 图书管理系统(完结版)
  • Redis数据安全性分析
  • 心智模式:觉察思维定势,突破决策盲区
  • 【QT】文件、多线程、网络相关内容