当前位置：首页 > ai >正文

从0搭建Transformer

ai 2025/7/15 4:28:30

首先是位置编码组件：

import torch
import torch.nn as nn
import mathclass PositonalEncoding(nn.Module):def __init__ (self, d_model, dropout, max_len=5000):super(PositionalEncoding, self).__init__()self.dropout = nn.Dropout(p=dropout)# [[1, 2, 3],# [4, 5, 6],# [7, 8, 9]]pe = torch.zeros(max_len, d_model)# [[0],# [1],# [2]]position = torch.arange(0, max_len, dtype = torch.float).unsqueeze(1)div_term = torch.exp(torch.arange(0, d_model, 2).float() * (-math.log(10000.0) / d_model))pe[:, 0::2] = torch.sin(position * div_term)pe[:, 1::2] = torch.cos(position * div_term)pe = pe.unsqueeze(0)# 位置编码固定，不更新参数# 保存模型时会保存缓冲区，在引入模型时缓冲区也被引入self.register_buffer('pe', pe)def forward(self, x):# 不计算梯度x = x + self.pe[:, :x.size(1)].requires_grad_(False)

http://www.xdnf.cn/news/3404.html

相关文章：

逻辑回归的多分类实战：以鸢尾花数据集为例

STL之vector容器

MySQL 索引不生效的情况

【Linux】Linux基础概念

树状数组 + 线段树

Java学习手册：Spring Security 安全框架

多模态人工智能研究：视觉语言模型的过去、现在与未来

51单片机驱动矩阵键盘

SPOJ 11576 TRIP2 - A Famous King’s Trip 【Tarjan+欧拉回路】

Python清空Word段落样式的方法

PINNs案例——多介质分区温度场

c++环境和vscode常用的一些有用插件

菲索旋转齿轮法：首次地面光速测量的科学魔术

Spring Boot 集成 Elasticsearch 的详细步骤

Arduino按键开关编程详解

Ubuntu 安装 MySQL8

Mybatis学习笔记

pytest——参数化

btrace1.0使用方法

AE模板 300个故障干扰损坏字幕条标题动画视频转场预设

VulnHub-DC-2靶机

【数据结构】励志大厂版·初阶（复习+刷题）：栈与队列

【Unity 游戏开发】角色控制模块技术要点拆解

详细介绍Python-pandas-DataFrame全部 *功能* 函数

【人工智能】图神经网络（GNN）的推理方法

模型之FIM（Fill-In-the-Middle）补全

ADG网络故障恢复演练

tiktok web X-Bogus X-Gnarly 分析

FreeRTOS任务管理与通信机制详解