当前位置: 首页 > news >正文

【每天一个知识点】embedding与representation

“Embedding(嵌入)”与“Representation(表示)”在机器学习、自然语言处理(NLP)、图神经网络等领域常被使用,它们密切相关,但语义上有一定区别。


一、定义

1. Representation(表示)
  • 广义概念:指将现实世界中某种对象(如文本、图像、节点等)转换为机器可以处理的数学形式,通常是向量或张量。

  • 形式:可以是稀疏的(如one-hot向量),也可以是稠密的;可以是人为设计的特征,也可以是学习得到的。

举例:

  • One-hot编码是最简单的表示方法。

  • TF-IDF、词袋模型是手工设计的表示方法。

  • 用BERT提取出的句向量也是一种表示。

2. Embedding(嵌入)
  • 狭义子集:embedding是representation的一种,通常指低维、稠密、连续空间中的向量表示,是通过学习从高维稀疏空间“嵌入”到低维稠密空间的过程。

  • 学习方式:通常是通过模型自动学习得到的表示,比如Word2Vec、Node2Vec、BERT等。

举例:

  • Word2Vec为词学习得到的300维稠密向量,就是词的embedding。

  • 图中的节点embedding是将每个节点嵌入到一个低维空间,保留结构与语义信息。


二、对比总结

项目Representation(表示)Embedding(嵌入)
定义一切形式的特征表示一种低维、稠密的特征表示
范围广义概念,包含embeddingrepresentation的子集
维度可高可低(如one-hot是高维稀疏)通常低维
是否稠密可稠密也可稀疏通常稠密
生成方式可人工设计或模型学习通常通过模型学习
示例TF-IDF、BERT向量、图特征Word2Vec、Node2Vec、Transformer输出向量


三、一句话总结

所有的embedding都是representation,但不是所有的representation都是embedding。

http://www.xdnf.cn/news/526897.html

相关文章:

  • 关于 Web 漏洞原理与利用:2. XSS(跨站脚本攻击)
  • Scala 访问修饰符
  • java基础-关键字:static、单例模式
  • JDBC指南
  • 【线下沙龙】NineData x Apache Doris x 阿里云联合举办数据库技术Meetup,5月24日深圳见!
  • [[春秋云境] Privilege仿真场景
  • ElasticSearch 8.x 快速上手并了解核心概念
  • 比较两个用于手写体识别的卷积神经网络(CNN)模型
  • PostgreSQL基本用法
  • 谷歌 NotebookLM 即将推出 Sparks 视频概览:Gemini 与 Deep Research 加持,可生成 1 - 3 分钟 AI 视频
  • 前缀和——和为K的子数组
  • 光纤克尔非线性效应及其在光通信系统中的补偿教程-3.2 克尔效应
  • 分布式与集群:概念、区别与协同
  • 没有 Mac,我如何用 Appuploader 完成 iOS App 上架
  • RabbitMQ的简介
  • React集成百度【JSAPI Three】教程(002):设置不同的环境效果
  • 数据结构(二) 线性表
  • java中的Servlet4.x详解
  • 湖北理元理律师事务所观察:债务服务中的“倾听者价值”
  • 深入解析Spring Boot与Kafka集成:构建高效消息驱动微服务
  • APP小程序抓包和下游代理
  • 云原生攻防2(Docker基础补充)
  • 2.微服务-配置
  • Fines for Parking vs. Free News
  • 云计算与大数据进阶 | 26、解锁云架构核心:深度解析可扩展数据库的5大策略与挑战(下)
  • Kotlin 协程
  • MySQL故障排查
  • 高效掌握二分查找:从基础到进阶
  • LED太阳光模拟器与氙灯太阳光模拟器的性能区别
  • Protobuf协议生成和使用