seamless_communication,facebook推出的开源语音翻译项目
Seamless Communication是由Facebook Research开发的一个开源项目,旨在提供先进的语音和文本翻译功能,支持多国语音。
今天试着来复现下。
1、首先下载代码。
git clone https://github.com/facebookresearch/seamless_communication
2、按照步骤执行
cd demo
pip install -r requirements.txt
但是 demo下面没有环境安装文件啊,这个需要进入到m4tv2下面执行。下面还有个v1的,为什么不进v1呢?因为没跑成功v1。
3、执行运行文件
python app.py
4、报错了,如图:
然后研究git上面的步骤,发现少执行了一步。再执行下
pip install .
5、执行成功,继续执行第三步。
6、执行后会默认下载模型文件,默认地址在/home/user/app/model下面,当然也可以去app.py文件下面修改默认下载地址。
7、接着就运行成功了。
有些警告,但是不影响。
8、浏览器打开上面地址
可以上传个语音文件试试,效果还是不错的。
大家在搭建的过程中有什么问题的话欢迎留言,大家一起讨论学习。