Day 9-2: Transformer翻译实例演示 - 翻译的基础设施
Day 9-2: Transformer翻译实例演示 - 翻译的基础设施
核心概念:理解Transformer机制
什么是Transformer?
首先明确Transformer不是训练过程,而是神经网络架构:
Transformer = 神经网络结构设计
- 架构: 由Encoder和Decoder组成的网络结构
- 编码器(Encoder): 理解输入句子的语义内容
- 解码器(Decoder): 基于理解生成输出句子
- 注意力机制: 连接编码和解码的桥梁
- 词嵌入: 理解文字含义
- 输出: 理解文字含义
训练 vs 使用 - 关键概念区分
阶段一:训练阶段(学习过程)
- 目标: 让Transformer学会翻译规律
- 输入: 中英文对照句子数百万对