当前位置: 首页 > news >正文

【开源软件推荐】 SmartSub,一个可以快速识别视频/音频字幕的工具

背景介绍

我就说Github上面能找到好东西吧

事情是这样的

我最近在用PC端的剪映剪辑视频

需要用到它的语音转字幕功能

转完之后,导出的时候

发现 赫然有一项字幕识别的会员权益

我寻思看看什么价格

不贵的话就充了

好家伙,这不看不知道,一看吓一跳

599?一年?

连续包年首年也需要399的啊喂!

我…就用个转字幕,其他功能基本上都用不上的

真不划算啊

但凡250以内我还考虑一下

手动加字幕,那也有点太累了

寻找替代方案

Github 上去搜搜

关键字:

语音转文本, 语音转字幕, voice to srt

反正用这几个关键字结合搜索了一下

大概有了点认知,目前市面上比较流行的语音转文本的方案

基本上都是基于 openaiwhisper 模型的,可以离线运行

发现神器:妙幕SmartSub

最终筛选出来这个应用

妙幕SmartSub

是个跨平台客户端工具,完全开源免费,在Github上已经有 2.6k 的 star 了

截止到现在已经有 194个commit 了,更新频率很高,上次提交是在 一周前

界面样式也还挺好看,视频和音频都支持

做了模型整合,也有适合国内宝宝体质的镜像模型

还支持接入百度火山deepseek等大模型服务对字幕进行翻译

这是官方的特性

如何选择模型

就是它了!

下载安装

下载也很方便, Realease页面有不同系统的安装包,下载安装即可

https://github.com/buxuku/SmartSub/releases

作者也很贴心的加上了夸克网盘的下载链接

使用教程

安装之后打开,先下载几个模型

模型的选择和注意事项上文已经提到过,更详细的请查看官方 Github 仓库说明文档

如果遇到下载比较慢的情况,建议切换至国内模型镜像站点

模型下载完之后,上传你的视频或者音频,在左侧菜单栏选择模型,开始任务

我用的 large-v3-turbo-q8_0 模型,亲测效果巨好,5分多钟音频 22秒 就识别完成了,又快又准

校对与导出

识别完成之后可以点击校对按钮,弹出校对模块

这里会在播放的时候,实时定位到哪一行字幕。

太细节了吧!!!

校对无误后点击保存

字幕文件默认跟你导入的音视频文件在一个根目录下

字幕导入剪映

接下来打开剪映,选择文本 - 导入本地字幕

将校对完成后的字幕文件 .srt 拖入剪映字幕中

完活儿~


如果对您有所帮助,还请不要忘了点个关注呦

http://www.xdnf.cn/news/1136881.html

相关文章:

  • JavaScript进阶篇——第八章 原型链、深浅拷贝与原型继承全解析
  • 性能优化实践:Modbus 在高并发场景下的吞吐量提升(二)
  • 【Linux】第一个小程序—进度条
  • 自动化技术在造纸行业的应用:EtherCAT转PROFIBUS DP解决方案
  • 【中等】题解力扣22:括号生成
  • MyUI1.0全新现代化 Vue.js 组件库框架上线
  • HCIE - 云计算拿下后的职业选择如何规划?
  • 摩尔投票法:高效寻找数组中的多数元素
  • 基于在线地图的路径规划测评对比-综合对比城区、农村及城乡结合处的导航
  • 阿里云-通义灵码:隐私保护机制—为数据安全筑起铜墙铁壁
  • DolphinScheduler 如何高效调度 AnalyticDB on Spark 作业?
  • Flutter在Android studio运行出现Error: Entrypoint is not a Dart file
  • SpringBoot 使用MyBatisPlus
  • web APIs(更新中)
  • 【机器学习实战【七】】机器学习特征选定与评估
  • 聚类算法原理与应用(一):K-means聚类算法原理
  • 基础算法题
  • 如何轻松玩转多线程高并发?
  • Install Docker Engine on UbuntuMySQL
  • cdh6.3.2的hive使用apache paimon格式只能创建不能写报错的问题
  • Python包测试全攻略:从单元测试到持续集成
  • ZKmall开源商城架构助力增长:多端流量聚合与用户体验
  • GitHub开源轻量级语音模型 Vui:重塑边缘智能语音交互的未来
  • Python 网络爬虫 —— 提交信息到网页
  • 音视频同步技术初剖析:原理、实现与FFmpeg分析
  • CrewAI与LangGraph:下一代智能体编排平台深度测评
  • 深度学习前置知识
  • PyTorch边界感知上下文神经网络BA-Net在医学图像分割中的应用
  • ubuntu基础搭建
  • 基于dcmtk的dicom工具 第二章 图像接受StoreSCP(2)