当前位置：首页 > news >正文

【面试题】BPE和WordPiece的区别？

news 2025/9/4 9:13:38

一句话金句： BPE看频率，WordPiece看概率。

通俗解释：
两者都是把单词拆成更小子词的方法，但决定“合并哪两个部分”的策略不同。

BPE (Byte-Pair Encoding)： 像一个统计员。它只做一件事：找到语料中最常挨在一起的两个符号（或子词），然后把它们合并起来。它一直重复这个过程，直到词汇表达到预定大小。
- 例子： 如果 "e" 和 "s" 经常连在一起出现，它们就会被合并成 "es"。
WordPiece (BERT在用)： 像一个精算师。它的策略更聪明：合并那些能最大程度提升语言模型概率的相邻符号对。简单说，就是合并后，让整个数据看起来更“通顺”、更“合理”。
- 例子： 合并 "un" 和 "##able" 成 "unable"，会比合并其他组合让整个句子的可能性提升得更多。

面试得分点：

著名代表： GPT家族用BPE，BERT家族用WordPiece。
视觉区别： WordPiece会给单词中间的子词加上 ## 前缀（如 ##ing）来标记，BPE通常不加。

http://www.xdnf.cn/news/1444969.html

相关文章：

Anaconda3出现Fatal error in launcher: Unable to create process using.....问题

STM32CubeMX + HAL 库：基于 I²C 通信的 BMP280气压海拔测量

【超详细】别再看零散的教程了！一篇搞定Gitee从注册、配置到代码上传与管理（内含避坑指南最佳实践）

PS大神级AI建模技巧！效率翻倍工作流，悄悄收藏！

Wan系列模型解析--详细架构图

机器学习在Backtrader多因子模型中的应用

美团龙猫利用expat库实现的保存xml指定范围数据到csv的C程序

TypeScript 泛型入门（新手友好、完整详解）

XSENS VISION NAVIGATOR助力智能城市自动化清洁机器人精确导航

TLSF内存算法适配HTOS

【Unity UGUI Canvas(画布)（1）】

【音视频】FMP4 介绍

【正点原子K210连载】第三十一章音频FFT实验摘自【正点原子】DNK210使用指南-CanMV版指南

【论文阅读】-《THE JPEG STILL PICTURE COMPRESSION STANDARD》

Android 接入deepseek

关于ES中文分词器analysis-ik快速安装

k8s使用StatefulSet(有状态)部署单节点 MySQL方案(使用本地存储)

【Bug】Nexus无法正常启动的五种解决方法

SuperMap GIS基础产品FAQ集锦(20250901)

Elasticsearch 数字字段随机取多值查询缓慢-原理分析与优化方案

504 Gateway Timeout：服务器作为网关或代理时未能及时获得响应如何处理？

揭秘设计模式：优雅地为复杂对象结构增添新功能-访问者模式

go语言面试之Goroutine详解

Linux使用-Linux系统管理

WPF里的几何图形Path绘制

硬件驱动C51单片机——裸机（1）

三、Scala方法与函数

【面试场景题】1GB 大小HashMap在put时遇到扩容的过程

安卓系统中IApplicationThread.aidl对应的是哪个类

智慧交通管理信号灯通信4G工业路由器应用