当前位置: 首页 > news >正文

音频转文字-在线工具包及使用记录

资料来源:https://zhuanlan.zhihu.com/p/269603431(多种方案)
视频教程:https://www.youtube.com/watch?v=L1H5ov4WTBg

https://github.com/openai/whisper

// 创建虚拟环境
python -m venv myvnev// 激活虚拟环境
source myvnev/bin/activatepip install --upgrade pip
升级pip,在虚拟环境安装package的工具安装openai-whisper
pip install -U  openai-whisper -i https://pypi.tuna.tsinghua.edu.cn/simple// 安装brew
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"// 安装ffmpeg
brew install ffmpeg
// 安装setuptools-rust
pip install setuptools-rust
pip show setuptools-rust 检测// 编译 替换xx-filePath
whisper xx-filePath --language Chinese --model base --device mps --output_format srt --output_dir ~/Desktop// --device mps 去掉去执行CPU
whisper xx-filePath --language Chinese --model base --output_format srt --output_dir ~/Desktop

https://github.com/ggml-org/whisper.cpp
这个只支持wav格式,可能更快吧

sh ./models/download-ggml-model.sh large-v3-turbo// 模型下载地址:
https://huggingface.co/ggerganov/whisper.cpp/tree/main// 验证执行命令(只能识别wav文件,需要ffmpeg提前转译):
./build/bin/whisper-cli -m models/ggml-large-v3.bin -f samples/jfk.wav  -osrt ~/Desktop/large-v3.srt// ffmpeg转wav
ffmpeg -i input.mp3 -ar 16000 -ac 1 -c:a pcm_s16le output.wav
http://www.xdnf.cn/news/424531.html

相关文章:

  • 提示词设计模板(基于最佳实践)
  • Datawhale PyPOTS时间序列5月第1次笔记
  • 2025 3D工业相机选型及推荐
  • Elecron 相关介绍以及常见的面试问题
  • 【MapReduce入门】深度解析MapReduce:定义、核心特点、优缺点及适用场景
  • 1950-2024年中国区域的积温数据(大于10°)
  • 2025最新出版 Microsoft Project由入门到精通(七)
  • Unity 2D 行走动画示例工程手动构建教程-AI变成配额前端UI-完美游戏开发流程
  • 5月13日day24日打卡
  • 完成springBoot+vue项目时学习到的知识点
  • 嵌入式STM32学习——外部中断EXTI与NVIC的基础练习⭐
  • 机试刷题:进制转换3
  • 【Pandas】pandas DataFrame cummin
  • 蓝桥杯 11.日志统计
  • 亚远景-基于ASPICE的汽车供应链质量管控培训
  • 网站遭受扫描攻击,大量爬虫应对策略
  • C++伯罗奔尼撒箭阵 全国信息素养大赛复赛决赛 C++小学/初中组 算法创意实践挑战赛 内部集训模拟题详细解析
  • springboot2.7.18 升级到3.1.5过程
  • Ubuntu 22.04.5 LTS 系统中配置仓库源
  • Gartner《如何有效融合Data Fabric 与Data Mesh数据战略》学习心得
  • 【TDengine源码阅读】DLL_EXPORT
  • 【设备管理—磁盘调度算法】
  • 【FMMT】基于模糊多模态变压器模型的个性化情感分析
  • 动态引入document.write的脚本
  • 出于PCB设计层面考虑,连排半孔需要注意哪些事项?
  • 5. 动画/过渡模块 - 交互式仪表盘
  • talk-linux 不同用户之间终端通信
  • C++ 基础知识
  • C++—特殊类设计设计模式
  • 汇添富基金徐寅喆:低利率环境下的短债基金投资策略