当前位置: 首页 > news >正文

【面试题】BPE和WordPiece的区别?

一句话金句: BPE看频率,WordPiece看概率。

通俗解释:
两者都是把单词拆成更小子词的方法,但决定“合并哪两个部分”的策略不同。

  • BPE (Byte-Pair Encoding): 像一个统计员。它只做一件事:找到语料中最常挨在一起的两个符号(或子词),然后把它们合并起来。它一直重复这个过程,直到词汇表达到预定大小。

    • 例子: 如果 "e""s" 经常连在一起出现,它们就会被合并成 "es"
  • WordPiece (BERT在用): 像一个精算师。它的策略更聪明:合并那些能最大程度提升语言模型概率的相邻符号对。简单说,就是合并后,让整个数据看起来更“通顺”、更“合理”。

    • 例子: 合并 "un""##able""unable",会比合并其他组合让整个句子的可能性提升得更多。

面试得分点:

  • 著名代表: GPT家族用BPE,BERT家族用WordPiece。
  • 视觉区别: WordPiece会给单词中间的子词加上 ## 前缀(如 ##ing)来标记,BPE通常不加。

http://www.xdnf.cn/news/1444969.html

相关文章:

  • Anaconda3出现Fatal error in launcher: Unable to create process using.....问题
  • STM32CubeMX + HAL 库:基于 I²C 通信的 BMP280气压海拔测量
  • 【超详细】别再看零散的教程了!一篇搞定Gitee从注册、配置到代码上传与管理(内含避坑指南最佳实践)
  • PS大神级AI建模技巧!效率翻倍工作流,悄悄收藏!
  • Wan系列模型解析--详细架构图
  • 机器学习在Backtrader多因子模型中的应用
  • 美团龙猫利用expat库实现的保存xml指定范围数据到csv的C程序
  • TypeScript 泛型入门(新手友好、完整详解)
  • XSENS VISION NAVIGATOR助力智能城市自动化清洁机器人精确导航
  • TLSF内存算法适配HTOS
  • 【Unity UGUI Canvas(画布)(1)】
  • 【音视频】FMP4 介绍
  • 【正点原子K210连载】第三十一章 音频FFT实验 摘自【正点原子】DNK210使用指南-CanMV版指南
  • 【论文阅读】-《THE JPEG STILL PICTURE COMPRESSION STANDARD》
  • Android 接入deepseek
  • 关于ES中文分词器analysis-ik快速安装
  • k8s使用StatefulSet(有状态)部署单节点 MySQL方案(使用本地存储)
  • 【Bug】Nexus无法正常启动的五种解决方法
  • SuperMap GIS基础产品FAQ集锦(20250901)
  • Elasticsearch 数字字段随机取多值查询缓慢-原理分析与优化方案
  • 504 Gateway Timeout:服务器作为网关或代理时未能及时获得响应如何处理?
  • 揭秘设计模式:优雅地为复杂对象结构增添新功能-访问者模式
  • go语言面试之Goroutine详解
  • Linux使用-Linux系统管理
  • WPF里的几何图形Path绘制
  • 硬件驱动C51单片机——裸机(1)
  • 三、Scala方法与函数
  • 【面试场景题】1GB 大小HashMap在put时遇到扩容的过程
  • 安卓系统中IApplicationThread.aidl对应的是哪个类
  • 智慧交通管理信号灯通信4G工业路由器应用