当前位置: 首页 > news >正文

【评测】免费体验dify工作流模式下腾讯语音转文字speech2text服务

回到目录

【评测】免费体验dify工作流模式下腾讯语音转文字speech2text服务

0. dify本地化部署

可以参考《2.2. win10的wsl环境下调试dify的api后端服务(20250511发布)》

1. 配置tencent cloud

1.1. 腾讯云官网申请免费api key

腾讯云官网可以申请到免费的体验key
在这里插入图片描述

[图1]

1.2. dify配置Model Provider

dify管理页面的配置项目,可以设置tencent的语音转文字服务,其中 api key包括APPID、SecretID、SecretKey三部分
在这里插入图片描述

[图2]

2. 创建工作流workflow

2.1. 创建工作流

在工作室 创建一个工作流,名称 testAudio
在这里插入图片描述
[图3]

2.2. 配置组件

添加一个SPEECH TO TEXT组件,MODEL选择 tencent(tencent)
在这里插入图片描述
[图4]

2.3. 配置文件参数

开始图标,可以配置输入的mp3文件参数
在这里插入图片描述
[图5]

3. 运行流程

3.1. 右上角run图标

运行workflow流程,首先插入一个mp3文件,点击”start Run"按钮
在这里插入图片描述

[图6]

3.2. 查看结果

在TRACING页面的output可以查看到文本信息
在这里插入图片描述
[图7]

4. 测试情况

中文普通话的歌曲准确率高,外语基本无法识别,粤语和闽南语待找到MP3素材再作测试。

回到目录

http://www.xdnf.cn/news/441847.html

相关文章:

  • 软件逆向基础-CE篇
  • 剖析提示词工程中的递归提示
  • 安全合规检查开源项目ComplianceAsCode/content详解及操作系统新产品开发适配指南
  • upload-labs通关笔记-第5关 文件上传之.ini绕过
  • 探索AI新领域:生成式人工智能认证(GAI认证)助力职场发展
  • 全流量解析:让安全防御从“被动挨打”升级为“主动狩猎”
  • 一分钟了解大语言模型(LLMs)
  • 濒危仙草的重生叙事:九仙尊米斛花节如何以雅集重构中医药文化IP
  • NNLM神经网络语言模型总结
  • react中安装依赖时的问题 【集合】
  • Android Studio Meerkat与Gradle构建工具升级实战指南
  • 2025年中国主流DevOps平台对比分析:Gitee、阿里云效与GitLab CE的技术适配与合规实践全景解读
  • excel使用笔记
  • Qt笔记---》.pro中配置
  • 【IDEA】注释配置
  • 西门子WinCC Unified PC的GraphQL使用手册
  • 常见排序算法及其java实现
  • 《Python星球日记》 第69天:生成式模型(GPT 系列)
  • JVM学习专题(二)内存模型深度剖析
  • STMCubeMX使用TB6612驱动编码轮并进行测速
  • 微信开发者工具里面模拟操作返回、录屏、网络速度、截屏等操作
  • 94. 二叉树的中序遍历详解:迭代法核心逻辑与出入栈模拟
  • 关于数据湖和数据仓的一些概念
  • 深入解析JVM字节码解释器执行流程(OpenJDK 17源码实现)
  • 44、私有程序集与共享程序集有什么区别?
  • 工具学习_模糊测试
  • 中天互联在数据采集方面有哪些优势?
  • 初探 Skynet:轻量级分布式游戏服务器框架实战
  • 二叉树——层序遍历
  • MCU程序加密保护(二)ID 验证法 加密与解密