当前位置: 首页 > backend >正文

seamless_communication,facebook推出的开源语音翻译项目

Seamless Communication‌是由Facebook Research开发的一个开源项目,旨在提供先进的语音和文本翻译功能,支持多国语音。

今天试着来复现下。

1、首先下载代码。

git clone https://github.com/facebookresearch/seamless_communication

2、按照步骤执行

cd demopip install -r requirements.txt

但是 demo下面没有环境安装文件啊,这个需要进入到m4tv2下面执行。下面还有个v1的,为什么不进v1呢?因为没跑成功v1。

图片

3、执行运行文件

python app.py

4、报错了,如图:

图片

然后研究git上面的步骤,发现少执行了一步。再执行下

pip install .

5、执行成功,继续执行第三步。

图片

6、执行后会默认下载模型文件,默认地址在/home/user/app/model下面,当然也可以去app.py文件下面修改默认下载地址。

图片

7、接着就运行成功了。

图片

有些警告,但是不影响。

8、浏览器打开上面地址

图片

可以上传个语音文件试试,效果还是不错的。

大家在搭建的过程中有什么问题的话欢迎留言,大家一起讨论学习。

http://www.xdnf.cn/news/4561.html

相关文章:

  • 代码随想录算法训练营 Day39 动态规划Ⅶ 打家劫舍
  • 数据可视化:php+echarts实现数据可视化(包含echart安装引入)
  • 数据压缩实现案例
  • 以pytest_addoption 为例,讲解pytest框架中钩子函数的应用
  • RAG技术体系问题的系统性总结
  • C++并发编程完全指南:从基础到实践
  • BBDM学习笔记
  • Spring Boot 中 AOP 的自动装配原理
  • C语言复习笔记--自定义类型
  • Nacos源码—5.Nacos配置中心实现分析二
  • QT高级(1)QTableView自定义委托集合,一个类实现若干委托
  • C——函数递归
  • 软考冲刺——OSPF简答题
  • 仿真系统-学生选课管理
  • 数字化转型是往哪转?怎么转?
  • 第35周Zookkeeper+Dubbo Dubbo
  • 【前端笔记】CSS 选择器的常见用法
  • Cron 用法
  • 数据管道的解耦艺术:Dagster I/O管理器实现存储与逻辑分离
  • 第二章:MySQL 索引优化与高级应用
  • python的异常处理
  • CODESYS开发环境下的快捷键和软件操作汇总
  • 《C++ Templates》:有关const、引用、指针的一些函数模板实参推导的例子
  • Ubuntu 安装 Keepalived
  • Linux 系统的进阶指令详解
  • 【软件设计师:算法】3.排序算法
  • 微信小程序pinia的应用
  • 对redis的深入了解
  • 【每日刷题】第2天
  • 互联网大厂Java求职面试:AI集成与云原生架构设计