当前位置: 首页 > news >正文

RNN、LSTM、Transformer推荐博文

最近在了解RNN、LSTM、transformer的相关原理,看了一些博文,下面做一点记录,以方便自己或者感兴趣的朋友查阅。
如果后续看到别的好的,也可能会更新或者添加在评论里。

RNN:
1.【循环神经网络(RNN)从零开始完整教程】
里面有个小实践,正弦波序列预测。代码格式非常规范,很容易理解。
使用pytorch实现

2.一步一步学RNN:从入门到实践指南
从基础到稍微深一点的应用,都给出了一些小实践。
使用tensorflow实现

3.Pytorch循环神经网络(RNN)快速入门与实战
对语句解释十分详细,文中提到的文章也都很不错,有空可以看看。
使用pytorch实现了对航线的预测。
代码中,有个画3D图的环节,如果不能正常画出3D图,需要把这句话ax = Axes3D(fig) 改成ax = fig.add_subplot(111, projection=‘3d’),原语句出问题的原因是,matplotlib新版的用法更加规范
另,plt画图需要用到中文时,记得下中文文字库,不然容易显示错误。要不直接title、label之类全部用英文。

4.循环神经网络(RNN)
这个网站(名叫菜鸟教程)还蛮推荐的,还有很多其他资源。
这篇里面对结构的解释蛮简介的,基本结构形式的代码也有基本展示。要是结构图能有图示就更好了。

LSTM:
LSTM是在RNN基础上,为了解决梯度消失和爆炸的问题,主要引入输入门、遗忘门、输出门。RGU则是对LSTM的简化
1.一个很有名的blog
介绍LSTM基本原理的blog

2.理解Pytorch中LSTM的输入输出参数含义
对参数的维度、语句等有一个较好的解释

Transformer:
1.【超详细】【原理篇&实战篇】一文读懂Transformer
这篇博文的参考文章也非常多,建议可以看看。

2.三万字最全解析!从零实现Transformer(小白必会版😃)
非常详细,有的不懂的,可以边看边搜,代码过一遍,理解会好很多。
这个作者在他别的博文里,还写了一些实践,有时间可以试试。

http://www.xdnf.cn/news/1215991.html

相关文章:

  • USRP捕获手机/路由器数据传输信号波形(上)
  • HTML应用指南:利用POST请求获取全国公牛门店位置信息
  • Unity UI的未来之路:从UGUI到UI Toolkit的架构演进与特性剖析(5)
  • Python 使用pandas库实现Excel字典码表对照自动化处理
  • macOS安装配置Unbound DNS完整指南
  • 学习日志22 python
  • docker 安装elasticsearch
  • QT笔记--》QMenu
  • CSS 工作原理
  • Java 笔记 封装(Encapsulation)
  • [硬件电路-106]:模拟电路 - 电路为什么会出现不同的频率特性?元件频率依赖性、信号传输路径、电路拓扑结构、外部因素
  • 微信小程序中实现页面跳转的方法
  • MySQL的单行函数:
  • C++ 中 NULL 与 nullptr 有什么区别?
  • rsync+sersync实现文件实时同步
  • Spark的宽窄依赖
  • 第七章:进入Redis的SET核心
  • 重生之我在暑假学习微服务第五天《Docker部署项目篇》
  • 【人工智能99问】混合专家模型(MoE)是如何训练的?(18/99)
  • pytorch小记(三十三):PyTorch 使用 TensorBoard 可视化训练过程(含完整示例)
  • LLM—— 基于 MCP 协议(SSE 模式)的工具调用实践
  • 30道JS高频经典笔试题集合+详解(一)
  • 华为昇腾×绿算全闪存缓存释放澎湃潜能
  • 【LeetCode】链表反转实现与测试
  • 比特币挖矿的能源消耗和环保问题
  • 关于“LoggerFactory is not a Logback LoggerContext but Logback is on ......“的解决方案
  • C++代码题部分(1)
  • LLM 模型部署难题的技术突破:从轻量化到分布式推理的全栈解决方案
  • AutoSAR(MCAL) --- ADC
  • Linux虚拟内存