当前位置: 首页 > news >正文

大模型面试回答,介绍项目

1. 模型准备与转换(PC端/服务器)

  • 你先在PC上下载或训练好大语言模型(如HuggingFace格式)。
  • 用RKLLM-Toolkit把模型转换成瑞芯微NPU能用的专用格式(.rkllm),并可选择量化优化。
  • 把转换好的模型文件拷贝到开发板(如RK3588)上。

2. 板端部署与启动

  • 在开发板上,分别启动三个主要服务/模块:
  1. ASR(语音识别)服务:实时采集麦克风音频,把语音转成文字。
  1. LLM(大模型)服务:接收ASR识别的文字,理解并生成智能回复。
  1. TTS(语音合成)服务:把LLM生成的文字回复转成语音,最后通过扬声器播放。

3. 模块间通信

  • 各模块之间通过ZeroMQ(消息队列)进行通信,互相传递数据,流程如下:
  • ASR识别出文字后,发给LLM模块。
  • LLM模块生成回复后,发给TTS模块。
  • TTS模块合成语音后,通知ASR模块可以继续采集。

4. 用户交互闭环

  • 用户说一句话,ASR模块识别成文字。
  • LLM模块理解这句话,生成智能回复。
  • TTS模块把回复变成语音,扬声器播放出来。
  • 用户听到回复,可以继续说下一句话,流程循环往复。

三、举个例子

  1. 你说:“今天天气怎么样?”
  1. ASR模块识别成文字:“今天天气怎么样?”
  1. LLM模块收到后,生成回复:“今天天气晴,气温25度。”
  1. TTS模块把这句话合成语音,扬声器播放出来:“今天天气晴,气温25度。”
  1. 你听到后,可以继续提问,系统继续响应。
http://www.xdnf.cn/news/1193689.html

相关文章:

  • 高性能网络DPDK、RDMA、XDP初探
  • URL与URI:互联网世界的“门牌号“与“身份证“
  • 网络编程2(应用层协议,传输层协议)
  • 「iOS」————继承链与对象的结构
  • SWC 深入全面讲解
  • 口腔助手|口腔挂号预约小程序|基于微信小程序的口腔门诊预约系统的设计与实现(源码+数据库+文档)
  • GitHub的免费账户的存储空间有多少?
  • 基于深度学习的图像分类:使用Capsule Networks实现高效分类
  • 网安-中间件-Redis未授权访问漏洞
  • 根本是什么
  • LeetCode 854:相似度为 K 的字符串
  • Flutter控件归纳总结
  • Jenkins运行pytest时指令失效的原因以及解决办法
  • useCallback/useMemo
  • 大模型蒸馏(distillation)---从DeepseekR1-1.5B到Qwen-2.5-1.5B蒸馏
  • ARM SMMUv3控制器注册过程分析(八)
  • 二分函数 lower_bound upper_bound
  • 21-ospf多区域
  • 【Bluedroid】btif_av_sink_execute_service之服务器禁用源码流程解析
  • Apache Doris Data Agent 解决方案:开启智能运维与数据治理新纪元
  • 2025年入局苹果Vision Pro开发:从零到发布的完整路线图
  • LeetCode 刷题【15. 三数之和】
  • 如何关闭Windows自动更新?【图文详解】win10/win11关闭自动更新
  • CentOS 7 安装 MySQL 8.4.6(二进制包)指南
  • Linux——线程同步
  • CT、IT、ICT 和 DICT区别
  • 【架构】Docker简单认知构建
  • 【科研绘图系列】R语言绘制误差连线散点图
  • 秋招Day19 - 分布式 - 分布式事务
  • 生产环境使用云服务器(centOS)部署和使用MongoDB