当前位置: 首页 > ds >正文

Unreal5 从入门到精通之如何实现 离线语音识别

文章目录

    • 前言
    • 将语言服务器作为外部进程运行
    • UE 项目设置
    • 开始捕获语音
    • 同时运行服务器进程和游戏进程
    • 将 SoundWave 而不是麦克风作为输入
    • 将数据发送到语言服务器节点的工作原理
    • 详细文档

前言

今天我们要说的是一个语音转文本(STT)的插件 Offline Speech Recognition, 它支持离线识别我们的录音或者实时语音输入,然后以文本形式输出。这种插件一般都是在线的,即语音处理都是在服务器处理。但是这个插件可以支持本地部署服务器,所以支持离线处理音频。
在这里插入图片描述

将语言服务器作为外部进程运行

首先我们需要下载服务器,可以在云端或本地服务器上运行单个语言服务器,并且由于它是多线程的,它可以同时处理多个客户端。
1.在此处 下载最新版本。
2.运行vls.exe ,它是asr_server.exe的用户界面
注意:asr_server.exe是真实服务器,无需 GUI 即可运行它

http://www.xdnf.cn/news/7739.html

相关文章:

  • Map更简洁的编码构建
  • 【jzxxoj编程:4420: 寻找自我3】2022-1-30
  • 【免杀】C2免杀技术(七)远程线程注入
  • 使用SQLite Expert个人版VACUUM功能修复数据库
  • 【Linux】第二十一章 管理存储堆栈
  • 如何处理 collation 导致的索引失效 | OceanBase SQL调优实践
  • Redis中的事务和原子性
  • 汽车充电过程中--各个电压的关系(DeepSeek)
  • Dockerfile 实战:编写高效镜像的最佳实践与常见误区
  • AR 开启昆虫学习新视界,解锁奇妙微观宇宙
  • 重构研发效能:项目管理引领软件工厂迈向智能化
  • 汽车生产中的测试台连接 – EtherCAT 转CANopen高效的网关通信
  • PyTorch中单卡训练、DataParallel(DP)和DistributedDataParallel(DDP)
  • Python数据可视化再探——Matplotlib模块 之二
  • 香港科技大学(广州)智能制造理学硕士招生宣讲会——深圳大学专场
  • Android 万能AI证件照 v1.3.2
  • Python打卡训练营day27-函数-装饰器
  • 数据要素如何重构人力资本升级
  • HTML页面渲染过程
  • 【Linux】第二十三章 控制启动过程
  • 汇川PLC通过Profinet转ModbusTCP网关读取西门子PLC数据案例
  • 【c# 中 == 和jave 的== 区别】
  • idea中,git的cherry-pick怎么用
  • Linux:库与链接
  • 基于Qwen3-7B FP8与基石智算打造高性能本地智能体解决方案
  • 佰力博科技与您浅谈低温介电材料特性及应用分析
  • 基于 STM32 单片机的实验室多参数安全监测系统设计与实现
  • 怎样解决photoshop闪退问题
  • OpenCV图像边缘检测
  • 第12天-Python+Qt5开发实战:10大经典案例与深度解析