当前位置: 首页 > news >正文

transformer 编码器层

编码器层

目标

  • 了解编编码器层的作用
  • 掌握编码器层的实现过程

作用
作为编码器的组成单元, 每个编码器完成一次对输入特征提取的过程, 即编码过程

编码器部分

代码实现
import torch.nn as nnfrom transformer_test.attention import clones
from transformer_test.sub_layer_connection import SubLayerConnectionclass EncoderLayer(nn.Module):def __init__(self, size, self_attn, feed_forward, dropout):super(EncoderLayer, self).__init__()self.self_attn = self_attnself.feed_forward = feed_forwardself.dropout = dropoutself.laysers = clones(SubLayerConnection(size, dropout), 2)self.size = self.sizedef forward(self, x, mask):x = self.laysers[0](x, lambda x: self.self_attn(x, x, x, mask))return self.laysers[1](x, self.feed_forward)

编码器

目标

  • 了解编码器的作用
  • 掌握编码器的实现过程

作用
编码器用于对输入进行指定的特征提取过程, 也称为编码, 由N个编码器堆叠而成

代码实现
import torch.nn as nnfrom transformer_test.attention import clones
from transformer_test.layer_norm import LayerNormclass Encoder(nn.Module):def __init__(self, layer, N):""":param layer: 编码器层:param N: 编码器层的个数"""super(Encoder, self).__init__()# clones 函数克隆N个编码器self.layers = clones(layer, N)# 初始化规范化层, 用在编码器最后self.norm = LayerNorm(layer.size)def forward(self, x, mask):""":param x: 输入:param mask: 屏蔽:return:"""# 循环执行N个编码器for layer in self.layers:x = layer(x, mask)return self.norm(x)
http://www.xdnf.cn/news/89497.html

相关文章:

  • 聊天交友APP聊天系统框架搭建
  • 【Linux禁用历史命令】
  • RK3588 Buildroot 新建板级DTS
  • JAVA线程池ThreadPoolExecutor说明
  • 树莓派超全系列教程文档--(40)树莓派config.txt旧版GPIO控制、超频及条件过滤器
  • 【Spring】依赖注入的方式:构造方法、setter注入、字段注入
  • ProxySQL如何支持高并发读写请求
  • ubuntu 安装 redis server
  • 技术能力和关系比较实在没有可比性
  • 【同轴线共焦传感器原理】
  • Tree Shaking 原理
  • [原创](现代Delphi 12指南):[macOS 64bit App开发]:在Mac App Store外创建、部署与公证
  • 【AI面试】分类模型 之 随机森林
  • UWB定位技术在钢铁厂行业中的创新应用与价值实践
  • Linux:简单自定义shell
  • Unity使用反射进行Protobuf(CS/SC)协议,json格式_002
  • Python 常用Web框架对比
  • 乐视系列玩机---乐视2 x620 x628等系列线刷救砖以及刷写第三方twrp 卡刷第三方固件步骤解析
  • Spring 中 @Component, @Repository, @Service的区别
  • 电商场景下Elasticsearch集群与分片(Sharding)的ELK安装配置指南
  • qemu如何支持vpxor %xmm0,%xmm0,%xmm0(百度AI)
  • ACI multipod 一、组网概要
  • 【自然语言处理与大模型】如何知道自己部署的模型的最大并行访问数呢?
  • 「数据可视化 D3系列」入门第十二章:树状图详解与实践
  • Docker 快速入门教程
  • XPath 介绍
  • Ubuntu与Linux的关系
  • Linux虚拟机中 编译Linux源码 记录
  • 给 20GB 文件“排排坐”——详解外部排序
  • 鸿蒙NEXT开发定位工具类 (WGS-84坐标系)(ArkTs)