当前位置: 首页 > ops >正文

【20min 急速入门】使用Demucs进行音轨分离

  1. 创建环境
conda create --name mujica python=3.10
  1. 下载加速依赖

先用nvidia-smi检查机器使用的独显版本, 然后从pytorch官网下载对应的GPU版torch, torchaudio

比如我的是12.2, 就下载11.8版本的

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
  1. 下载音频处理依赖
conda install -c conda-forge ffmpeg

FFmpeg 是一个开源的音视频处理工具库,可以用于​​解码、编码、转码、混流、分离、流媒体处理​​等操作,如果要处理mp3等格式,必须先下载。

  1. 安装demucs
pip install demucs
  1. 使用
demucs --mp3 <filename>

之后就会在当前文件夹下生成一个seperate文件夹, 里面有分离的四音轨数据

.
├── fog.mp3
└── separated└── htdemucs└── fog├── bass.mp3├── drums.mp3├── other.mp3└── vocals.mp3
http://www.xdnf.cn/news/16838.html

相关文章:

  • Redis7 String类型数据
  • 【iOS】KVO
  • MyBatisPlus之CRUD接口(IService与BaseMapper)
  • 28Rsync免密传输与定时备份
  • 关于Web前端安全防御XSS攻防的几点考虑
  • Spring Boot 全 YAML 配置 Liquibase 教程
  • C++之vector类的代码及其逻辑详解 (中)
  • DockerFile文件执行docker bulid自动构建镜像
  • CMake指令:mark_as_advanced
  • Python序列去重高级指南:保持顺序的高效去重技术
  • 错误: 找不到或无法加载主类 原因: java.lang.ClassNotFoundException
  • 云原生三剑客:Kubernetes + Docker + Spring Cloud 实战指南与深度整合
  • 分类任务当中常见指标 F1分数、recall、准确率分别是什么含义
  • 类似 Pixso 但更侧重「网页 / 软件界面设计」「前后端可视化开发」的工具
  • 【贪心】P11112 [ROI 2024] 机器人物流 (Day 1)|普及+
  • 基于python多光谱遥感数据处理、图像分类、定量评估及机器学习方法应用
  • Java函数式编程之【Stream终止操作】【下】【二】【收集器toMap()】【叁参数收集操作collect()】
  • Maven项目和Spring项目的异同
  • 企业资产|企业资产管理系统|基于springboot企业资产管理系统设计与实现(源码+数据库+文档)
  • Docker容器中文PDF生成解决方案
  • 计算机网络:为什么IPv6没有选择使用点分十进制
  • Pytorch-02数据集和数据加载器的基本原理和基本操作
  • Matplotlib - Python图表可视化利器
  • 面试小总结
  • vue引入阿里巴巴矢量图库的方式
  • 内网穿透系列十:高性能内网穿透工具 rathole,支持Docker一键部署
  • ubuntu 系统风扇控制软件 CoolerControl
  • AI驱动SEO关键词智能进化
  • Ubuntu18网络连接不上也ping不通网络配置问题排查与解决方法
  • Python 第一阶段测试题 答案及解析