当前位置: 首页 > backend >正文

31.Encoder-Decoder(Seq2Seq)

常见网络结构

在这里插入图片描述

  • One2One
    固定大小的输入,固定大小的输出。如:图像分类任务,输入固定大小图片,输出一个类别。
    在这里插入图片描述

  • One2Many
    固定大小的输入,不固定大小的输出。如:看图说话、用词造句。

在这里插入图片描述

  • Many2One
    不固定的输入,固定的输出。如:语句情感分析、文章分类、视频分类
    在这里插入图片描述
    在这里插入图片描述

  • Many2Many同步
    固定长度的序列,输出等长的序列。如:词性标注、字符级预测、视频帧级分类
    在这里插入图片描述

  • Many2Many异步——Seq2Seq
    不固定输入,不固定输出。如:机器翻译、命题作文、语音识别。
    在这里插入图片描述

Encoder-Decoder

编码器-解码器架构:不固定输入,不固定输出。分为编码和解码两个部分:编码器处理输入序列,经过一个隐藏层输出向量。解码器把向量作为输入,输出新序列。
在这里插入图片描述

训练时

Decoder并不是把当前时刻的输出,作为下一时刻的输入。训练阶段的Decoder,输入时刻为目标序列(橙色)。
意为:如果在输出am的位置,输出的不是am,而是is。那么,下一时刻的输入(橙色am位置),依然为am。
其实好理解,这是训练阶段,他做错了,你需要纠正他。这个过程叫做Teacher Forcing。
在这里插入图片描述

预测时

decoder的当前输入,作为下一时刻输出。

在这里插入图片描述

http://www.xdnf.cn/news/18786.html

相关文章:

  • Docker详细学习
  • 【Protues仿真】定时器
  • 构建智能提示词工程师:LangGraph 的自动化提示词生成流程
  • [在实践中学习] 中间件理论和方法--Redis
  • WPF基于LiveCharts2图形库,实现:折线图,柱状图,饼状图
  • Python爬虫实战:研究开源的高性能代理池,构建电商数据采集和分析系统
  • Pycharm
  • ​告别复杂计划!日事清推出脑图视图,支持节点拖拽与聚焦模式,让项目管理更直观​
  • MySQL 入门
  • 虚幻5引擎:我们是在创造世界,还是重新发现世界?
  • 基于SpringBoot的摄影跟拍约拍预约系统【2026最新】
  • [CS创世SD NAND征文] CS创世CSNP1GCR01-AOW在运动控制卡中的高可靠应用
  • 神经网络参数量计算详解
  • 如何用企业微信AI解决金融运维难题,让故障响应快、客服专业度高
  • EB_NXP_K3XX_GPIO配置使用
  • 深入理解内存屏障(Memory Barrier):现代多核编程的基石
  • Java大厂面试实战:从Spring Boot到微服务架构的全链路技术拆解
  • 破解VMware迁移难题的技术
  • 给高斯DB写一个函数实现oracle中GROUPING_ID函数的功能
  • 性能瓶颈定位更快更准:ARMS 持续剖析能力升级解析
  • Docker Compose 使用指南 - 1Panel 版
  • NR --PO计算
  • nginx代理 flink Dashboard、sentinel dashboard的问题
  • 数据结构(时空复杂度)
  • 论文阅读(四)| 软件运行时配置研究综述
  • 推荐系统学习笔记(十四)-粗排三塔模型
  • iOS 审核 4.3a【二进制加固】
  • Web前端开发基础
  • sdi开发说明
  • Python在语料库建设中的应用:文本收集、数据清理与文件名管理