当前位置: 首页 > web >正文

Mlp-Mixer-BiGRU故障诊断的python代码合集

     

    谈起 MLP-Mixer 之前,我们先了解一下 MLP 结构,即多层感知机(Multi-layer Perceptrons),理论上一定复杂程度的 MLP 可以拟合任何函数的,但是代价是大量的计算开销和参数量,这给纯 MLP 的模型发展造成了阻碍。之前提出的 CNN、RNN 就是通过将 Inductive Bias(归纳偏置) 引入模型里,从而能在计算资源有限、数据有限的情况下能取得很好的结果。

不管怎么说,MLP-Mixer 证明了古老结构 MLP 的能力,视觉领域形成了 MLP --> CNN --> Transformer --> MLP 的轮回,一时间后续很多基于 MLP 的工作如雨后竹笋般频出,如 ResMLP、CycleMLP、gMLP、ViP、ConvMLP 等。

流程解析

我们来看一下 MLP-Mixer 的总体结构把,这里我们直接看代码来理解;

     

  部分核心代码:

class PatchEmbed(nn.Layer):""" Patch Embedding Layer"""def __init__(self,img_size=224,patch_size=16,in_chans=3,embed_dim=768,norm_layer=None,flatten=True,):super().__init__()img_size = (img_size, img_size)patch_size = (patch_size, patch_size)self.img_size = img_sizeself.patch_size = patch_sizeself.grid_size = (img_size[0] // patch_size[0],img_size[1] // patch_size[1])self.num_patches = self.grid_size[0] * self.grid_size[1]self.flatten = flattenself.proj = nn.Conv2D(in_chans,embed_dim,kernel_size=patch_size,stride=patch_size)self.norm = norm_layer(embed_dim) if norm_layer else Identity()def forward(self, x):B, C, H, W = x.shapeassert (H == self.img_size[0]), f"Input image height ({H}) doesn't match model ({self.img_size[0]})."assert (W == self.img_size[1]), f"Input image width ({W}) doesn't match model ({self.img_size[1]})."x = self.proj(x)if self.flatten:x = x.flatten(2).transpose([0, 2, 1])  # BCHW -> BNCx = self.norm(x)return x

      本代码在Mlp-Mixer算法的基础上融合Bigru,构成了Mlp-Mixer-BiGRU新型算法。该算法基于pytorch,数据来源为公开轴承数据集。数据集上,本模型表现良好。MLP-MIXER和MLP-MIXER-BIGRU两者置于同一合集中,供大家学习使用。

  希望对大家有所帮助,需要的朋友欢迎关注共重号:年轻的战场ssd,回复 Mlp-Mixer-BiGRU   。一起交流,学习进步!!!

http://www.xdnf.cn/news/7237.html

相关文章:

  • LLMs:《POE报告:2025年春季人工智能模型使用趋势》解读
  • 实习记录小程序|基于SSM+Vue的实习记录小程序设计与实现(源码+数据库+文档)
  • 涉密载体管控系统|DW-S402系统组成
  • 【LLM MoE】论文分享No.11:DeepSeekMoE
  • 前缀和——中心数组下标
  • Leetcode 3552. Grid Teleportation Traversal
  • 【开源分享】健康饮食管理系统(双端+论文)
  • 2- PyTorch
  • 如何使用 Apple 提供的 benchmark 工具
  • 深入解析Spring Boot与Spring Cloud在微服务架构中的实践
  • 卷积神经网络进阶:转置卷积与棋盘效应详解
  • 常见的请求头(Request Header)参数
  • 学习黑客Active Directory 入门指南(四)
  • 代码随想录哈希表part02(二)
  • 学习黑客Active Directory 入门指南(一)
  • 【iOS(swift)笔记-9】WKWebView无法访问网络
  • 微服务项目->在线oj系统(Java版 - 1)
  • Python数据分析三剑客:NumPy、Pandas与Matplotlib安装指南与实战入门
  • 政务数据分类分级标准规范全解析
  • 标准差和方差是什么
  • 【GESP】C++三级真题 luogu-B3926 [GESP202312 三级] 单位转换
  • 【藏经阁】加密机服务完整解决方案,包含客户端+服务端
  • “二维前缀和”算法原理及模板
  • 知网高级检索不显示来源类别解决方法
  • 对称加密与非对称加密在 JWT 中的应用详解
  • C++模板进阶使用技巧
  • el-scrollbar 获取滚动条高度 并将滚动条保持在低端
  • mysql数据库故障排查方案
  • 批量处理 Office 文档 高画质提取图片、视频、音频素材助手
  • httpx[http2] 和 httpx 的核心区别及使用场景如下