当前位置: 首页 > ai >正文

TTS:F5-TTS 带有 ConvNeXt V2 的扩散变换器

1,项目简介

F5-TTS 于英文生成领域表现卓越,发音标准程度在本次评测软件中独占鳌头。再者,官方预设的多角色生成模式独具匠心,能够配置多个角色,一次性为多角色、多情绪生成对话式语音,别出心裁。

  • 最低配置:无需显卡,CPU亦可推理生成
  • 据说耗时是所有TTS中最低的
  • 项目地址:https://github.com/SWivid/F5-TTS

2,项目启动

【傻瓜式启动】

conda create -n f5-tts python=3.10
conda activate f5-tts
pip install torch==2.4.0+cu124 torchaudio==2.4.0+cu124 --extra-index-url https://download.pytorch.org/whl/cu124
pip install f5-ttsf5-tts_infer-gradio --port 7860 --host 0.0.0.0

【部署式启动】

  • 服务端:socket_server.py
  • 客户端:socket_client.py

3,功能支持

 E2/F5 TTS 只能功能:

  • F5-TTS(通过流式匹配模仿流利、忠实语音的童话故事机)
  • E2 TTS(令人尴尬的简单完全非自回归零样本 TTS)

http://www.xdnf.cn/news/6858.html

相关文章:

  • bitmap/hyperloglog/GEO详解与案例实战
  • 永久免费!专为 Apache Doris 打造的可视化数据管理工具 SelectDB Studio V1.1.0 重磅发布!
  • C语言程序设计期末复习
  • 初探Reforcement Learning强化学习【QLearning/Sarsa/QCN】
  • 强化学习中,frames(帧)和 episodes(回合)
  • 【Mysql】详解InnoDB存储引擎以及binlog,redelog,undolog+MVCC
  • 多指标组合策略
  • 微信小程序开发
  • 数学复习笔记 18
  • Codex与LangChain结合的智能代理架构:重塑软件开发的未来
  • python打卡day28
  • 管理前端项目依赖版本冲突导致启动失败的问题的解决办法
  • muduo库EventLoopThread模块详解——C++
  • DeepSeek快速指南:提升效率,告别内耗
  • Windows运维工具批处理版
  • [前端高频]数组转树、数组扁平化、深拷贝、JSON.stringifyJSON.parse等手撕
  • sizeof 和strlen的对比
  • 【C++ - 仿mudou库one thread one loop式高并发服务器实现】
  • 聊一聊如何确保接口文档的完整性和准确性
  • 深度学习中ONNX格式的模型文件
  • Linux——MySQL用户管理与链接
  • OpenAI Agent调用MCP Server案例分析
  • JavaScript【4】数组和其他内置对象(API)
  • 如何在 Windows 10 或 11 中安装 PowerShellGet 模块?
  • 【软考中级软件设计师】进程管理
  • Windows/MacOS WebStorm/IDEA 中开发 Uni-App 配置
  • Unable to get end effector tips from jmg
  • UDP三种通信方式
  • Harmony开发 List、Grid拖动自定义排序实现
  • 车载诊断架构 --- 核心网关流控制机制需求