当前位置：首页 > java >正文

语音识别指标计算 WER

java 2025/7/30 9:23:10

CER（Character Error Rate）

WER = Word Error Rate（词错误率）

🧮 WER 计算方式

📌 示例

✅ 理解要点

CER（Character Error Rate）

语音识别中的 CER（Character Error Rate） 是衡量语音识别系统准确性的一个重要指标，表示预测文本与参考文本在字符级别上的差异程度。

CER（Character Error Rate）定义：
CER 是编辑距离（Levenshtein 距离）与参考文本字符总数的比值：

语音识别 WER 是什么意思

WER = Word Error Rate（词错误率）

在语音识别（ASR, Automatic Speech Recognition）领域，WER 是一个常用的性能评估指标，全称是：WER = Word Error Rate（词错误率）

🧮 WER 计算方式

WER 是通过比较 识别结果（Hypothesis） 和 真实文本（Reference） 之间的差异来计算的，公式如下：

WER=S+D+IN\text{WER} = \frac{S + D + I}{N}WER=NS+D+I

其中：

S（Substitutions）：替换错误数（识别成了其他词）
D（Deletions）：漏识别的词数
I（Insertions）：多识别出的词数
N：真实文本中的词总数（即 Reference 中的词数）

📌 示例

假设真实文本是：

我爱自然语言处理

识别结果是：

我喜欢语言处理

对比：

“爱” → “喜欢”：1 个替换（S）
“自然” 被删掉：1 个删除（D）
没有额外多出的词：0 个插入（I）
总词数 N = 4

则：

WER=1（S）+1（D）+0（I）4=0.5=50%\text{WER} = \frac{1（S）+ 1（D）+ 0（I）}{4} = 0.5 = 50\%WER=41（S）+1（D）+0（I）=0.5=50%

✅ 理解要点

WER 越低越好，0% 表示识别完全正确。
常见语音识别模型，比如 Whisper、Kaldi、Wav2Vec2，在高质量数据上 WER 可以低至 5% 以下。
对于方言、多语种或嘈杂环境，WER 通常会高一些。

查看全文

http://www.xdnf.cn/news/16537.html

Java-泛型类的定义与使用

24. 了解过 webp 吗

如何进行DAP-seq的数据挖掘，筛选验证位点

Django 视图详解（View）：处理请求与返回响应的核心

RWA 正当红，是 DeFi 的终点、拐点，还是新起点？

常用设计模式系列（十四）—模板方法模式

HTML响应式SEO公司网站源码

电脑开机不显示网卡的原因

微算法科技(NASDAQ：MLGO)利用基于区块链的机器学习模型进行交易分类，实现交易数据的匿名化

Python 列表内存存储本质：存储差异原因与优化建议

【数据库】使用Sql Server将分组后指定字段的行数据转为一个字段显示，并且以逗号隔开每个值，收藏不迷路

uniapp，uview 报错：Not Found：Page[2][-1；-1,8,0,28] at view.umd.min.js:1

从fork到exit：剖析Linux进程的诞生、消亡机制

阿里云通义灵码深度解析：AI编程时代的技术革命与实践探索

计算机毕设分享-基于SpringBoot的健身房管理系统（开题报告+前后端源码+Lun文+开发文档+数据库设计文档）

Windows---动态链接库Dynamic Link Library（.dll）

Java AI面试实战：Spring AI与RAG技术落地

Rust赋能智能土木工程革新

【LeetCode 热题 100】51. N 皇后——回溯

Java面试全方位解析：从基础到AI的技术交锋

CER（Character Error Rate）

WER = Word Error Rate（词错误率）

🧮 WER 计算方式

📌 示例

✅ 理解要点

相关文章：