当前位置: 首页 > ai >正文

Voice Conversion语音转换

语音转换(Voice Conversion, VC)是一种技术,允许将一个说话者的声音转换为另一个说话者的声音,同时保留内容。

Preserved:content内容

语音转换的应用:转换说话人,说话风格,提升可懂度,数据增强。

在实际应用中,常常是直接将源语音(T)转换为目标语音(T’),并通过声码器(Vocoder)实现。

声码器的选择:规则基础(Griffin-Lim算法)或深度学习(如WaveNet)。

一、Feature Disentangle特征解耦

组件

描述

内容编码器

处理语音的内容信息。

说话者编码器

处理说话者的声音特征。

解码器

生成目标语音。

假设我们知道需要训练出的说话人,使用说话人信息,对于speaker encoder,我们可以使用one-hot编码替换。但是这样的issue是预训练编码器面临有新说话者时的挑战,可能需要使用说话者嵌入。

Adversarial Training对抗训练

通过对抗训练降低说话者分类器的准确性,使内容编码器学习如何“欺骗”说话者分类器。

这里的speaker classifier是在对抗训练,因为希望提取内容信息,说话人分类器分类效果不好,说明内容编码器提取效果好。


IN:实例规范化,每个通道减去均值,使得均值为0,除以方差,以去除说话人信息。

AdaIN:自适应实例规范化

Issue:如果在训练时,使用内容编码器和说话人编码器编码的说话人是同一个,那么在编码不同说话人时合成质量不好。

2nd Stage Training两阶段训练

这里的speaker classifier并不是对抗,而是在判断是哪个说话人,鉴别器才是在对抗,合成的语音想要欺骗鉴别器,而鉴别器要将合成的语音识别出来。

在两阶段训练中,还有一个patcher补丁,它合成的语音对一些读音缺失信息进行补充

Only learn the patcher in the 2nd stage

二、Direct Transformation直接转换法

能够在没有成对数据的情况下有效工作。

Cycle GAN

为什么还有G(Y to X)因为判别器D(Y)根据某些特征判断合成的语音是否属于speaker Y,但是在这种情况下很可能生成器为了使判别器将结果判断为speaker Y,放弃应该保留的信息,因此为了保证保留需要的信息,加入G(Y to X)。

Issue:如果有N个speaker,需要N*(N-1)次合成,且一旦有新的speaker加入需要全部重新训练一遍。

Strat GAN

没有固定生成器和判别器,只需要这一个架构就可以。

http://www.xdnf.cn/news/9034.html

相关文章:

  • PHP:赋能Web开发的经典语言与未来演进
  • XSS跨站脚本攻击的原理、危害与防御
  • 基于PDF流式渲染的Word文档在线预览技术
  • 用MMdetection框架训练自己的数据集(全流程实战)
  • GitAny - 無需登入的 GitHub 最新倉庫檢索工具
  • AbMole| Erastin(571203-78-6,M2679,铁死亡诱导剂)
  • 基于MATLAB的大规模MIMO信道仿真
  • 系统架构中的限流算法(一)
  • 两个Ubuntu机器,设置共享目录实时同步
  • React的单向数据绑定
  • 力扣热题-有向图中最大颜色值
  • 二十八、面向对象底层逻辑-SpringMVC九大组件之ViewResolver接口设计
  • ASCII码对应表
  • call的作用是什么,为什么要使用它?
  • AI工具使用的最佳实践,如何通过AI工具提高创作与工作效率
  • react基础知识(下)
  • A-9 OpenCasCade读取STEP文件中的NURBS曲面
  • 知道Metasploit 吗?
  • C 语言学习笔记(指针6)
  • shell之通配符及正则表达式
  • 题目 3334: 蓝桥杯2025年第十六届省赛真题-园艺
  • 解锁MCP:AI大模型的万能工具箱
  • 《狂野时代》获第78届戛纳影展特别奖
  • 用深度学习提升DOM解析——自动提取页面关键区块
  • AtCoder Beginner Contest 407
  • Kubernetes--主机启用防火墙
  • 告别延迟!modbus tcp转profine网关助力改造电厂改造升级
  • mvn-help 插件clean install 后本地mvn库没重新生成jar包
  • Word VBA 教程|一键将 PNG/JPG 图片插入每一页(浮于文字上方,固定大小)
  • 如何把 Microsoft Word 中所有的汉字字体替换为宋体?