当前位置: 首页 > java >正文

语音识别指标计算 WER

目录

CER(Character Error Rate)

WER = Word Error Rate(词错误率)

🧮 WER 计算方式

📌 示例

✅ 理解要点


CER(Character Error Rate)

语音识别中的 CER(Character Error Rate) 是衡量语音识别系统准确性的一个重要指标,表示预测文本与参考文本在字符级别上的差异程度。

CER(Character Error Rate)定义:
CER 是编辑距离(Levenshtein 距离)与参考文本字符总数的比值:

语音识别 WER 是什么意思

WER = Word Error Rate(词错误率)

在语音识别(ASR, Automatic Speech Recognition)领域,WER 是一个常用的性能评估指标,全称是:WER = Word Error Rate(词错误率)


🧮 WER 计算方式

WER 是通过比较 识别结果(Hypothesis)真实文本(Reference) 之间的差异来计算的,公式如下:

WER=S+D+IN\text{WER} = \frac{S + D + I}{N}WER=NS+D+I​

其中:

  • S(Substitutions):替换错误数(识别成了其他词)

  • D(Deletions):漏识别的词数

  • I(Insertions):多识别出的词数

  • N:真实文本中的词总数(即 Reference 中的词数)


📌 示例

假设真实文本是:

我 爱 自然语言处理

识别结果是:

我 喜欢 语言 处理

对比:

  • “爱” → “喜欢”:1 个替换(S)

  • “自然” 被删掉:1 个删除(D)

  • 没有额外多出的词:0 个插入(I)

  • 总词数 N = 4

则:

WER=1(S)+1(D)+0(I)4=0.5=50%\text{WER} = \frac{1(S)+ 1(D)+ 0(I)}{4} = 0.5 = 50\%WER=41(S)+1(D)+0(I)​=0.5=50%


✅ 理解要点

  • WER 越低越好,0% 表示识别完全正确

  • 常见语音识别模型,比如 Whisper、Kaldi、Wav2Vec2,在高质量数据上 WER 可以低至 5% 以下。

  • 对于方言、多语种或嘈杂环境,WER 通常会高一些。

http://www.xdnf.cn/news/16537.html

相关文章:

  • Java-泛型类的定义与使用
  • 24. 了解过 webp 吗
  • 如何进行DAP-seq的数据挖掘,筛选验证位点
  • Django 视图详解(View):处理请求与返回响应的核心
  • CenterOS8.5三台机器配置互信
  • 图解MySQL-小林code笔记
  • 排水管网实时监测筑牢城市安全防线
  • 本地大语言模型部署指南
  • Dify 工作流深度解析与实战指南
  • 重复文件清理工具,附免费链接
  • RWA 正当红,是 DeFi 的终点、拐点,还是新起点?
  • 常用设计模式系列(十四)—模板方法模式
  • HTML响应式SEO公司网站源码
  • 电脑开机不显示网卡的原因
  • 微算法科技(NASDAQ:MLGO)利用基于区块链的机器学习模型进行交易分类,实现交易数据的匿名化
  • Python 列表内存存储本质:存储差异原因与优化建议
  • ubnutu网络
  • Excel常用函数大全,非常实用
  • 旋变转换电路
  • Vue组件通信的终极指南
  • 【数据库】使用Sql Server将分组后指定字段的行数据转为一个字段显示,并且以逗号隔开每个值,收藏不迷路
  • uniapp,uview 报错:Not Found:Page[2][-1;-1,8,0,28] at view.umd.min.js:1
  • 从fork到exit:剖析Linux进程的诞生、消亡机制
  • 阿里云通义灵码深度解析:AI编程时代的技术革命与实践探索
  • 计算机毕设分享-基于SpringBoot的健身房管理系统(开题报告+前后端源码+Lun文+开发文档+数据库设计文档)
  • Windows---动态链接库Dynamic Link Library(.dll)
  • Java AI面试实战:Spring AI与RAG技术落地
  • Rust赋能智能土木工程革新
  • 【LeetCode 热题 100】51. N 皇后——回溯
  • Java面试全方位解析:从基础到AI的技术交锋