当前位置: 首页 > news >正文

【阿里云大模型高级工程师ACP习题集】2.4 自动化评测答疑机器人的表现(⭐️⭐️⭐️ 重点章节!!!)

习题集:

  1. 【单选题】在使用Ragas评估RAG应用时,Answer Correctness指标计算中,语义相似度是通过以下哪种方式得到的?( )
    A. 大模型直接判断
    B. 计算文本向量的余弦相似度
    C. 对比文本词汇重合度
    D. 统计文本字数差异

  2. 【多选题】当Context recall指标得分较低时,可采取的优化措施有( )。
    A. 检查知识库内容是否完备
    B. 更换性能更强的大模型
    C. 更换embedding模型
    D. 改写query

  3. 【单选题】在评估RAG应用检索召回效果时,Context precision指标侧重评估的是( )。
    A. 检索到的参考信息与问题的相关性
    B. 检索到的参考信息中与准确答案相关条目的排名和占比
    C. 有多少相关参考资料被检索到
    D. 生成的答案与检索到的参考资料的事实一致性

  4. 【多选题】以下哪些是Ragas中用于评估生成环节的指标?( )
    A. Answer Correctness
    B. Answer Relevancy
    C. Faithfulness
    D. Context Recall

  5. 【单选题】在计算Answer Correctness指标的事实准确度时,Ragas通过大模型将answer与ground_truth分别生成各自的观点列表,对于生成的观点,若在对方观点列表中找不到依据,会被添加到( )。
    A. TP列表
    B. FP列表或FN列表
    C. 仅FP列表
    D. 仅FN列表

  6. 【多选题】关于自动化测试机制,以下说法正确的有( )。
    A. 可以完全替代人工评估
    B. 大模型可用于检测答疑机器人的回复是否准确回答了问题
    C. 目前已有的简单测试方法能完美检测大模型的幻觉问题
    D. 可通过建立测试机制自动对一批问题进行测试

  7. 【单选题】在使用Ragas计算Context recall指标时,其计算过程中由大模型将ground_truth分解成观点列表,若ground_truth为“张伟是教研部的成员且负责大数据课程”,可能生成的观点列表是( )。
    A. [“张伟是教研部的成员且负责大数据课程”]
    B. [“张伟是教研部的成员”, “负责大数据课程”]
    C. [“张伟”, “教研部”, “大数据课程”]
    D. [“张伟是教研部的”, “张伟负责大数据课程”]

  8. 【多选题】在基于Ragas指标的优化策略中,当Answer correctness指标得分较低,而Context recall和Context precision分数较高时,可尝试的优化方法有( )。

http://www.xdnf.cn/news/111637.html

相关文章:

  • 数据结构-图
  • HOW - Code Review 流程自动化
  • 学习threejs,使用EffectComposer后期处理组合器(采用RenderPass、ShaderPass渲染通道),案例一
  • 17.第二阶段x64游戏实战-人工遍历二叉树结构
  • 给git配置SSH(github,gitee)
  • 【前端】【业务场景】【面试】在前端项目中,当涉及大量数据渲染时,如何提高渲染性能并避免页面卡顿?
  • uniapp 安卓离线本地打包,Android Studio生成apk包
  • 27、Session有什么重⼤BUG?微软提出了什么⽅法加以解决?
  • Linux 命令行与 vi/vim 编辑器完全指南
  • continue插件实现IDEA接入本地离线部署的deepseek等大模型
  • 想要从视频中提取背景音乐怎么搞?其实视频提取音频非常简单
  • 金融系统上云之路:云原生后端架构在金融行业的演化与实践
  • 以太网的mac帧格式
  • 基于Vulkan Specialization Constants的材质变体系统
  • 第三篇:Django创建表关系及生命周期流程图
  • Java后端开发面试题(含答案)
  • java kafka
  • 初始https附带c/c++源码使用curl库调用
  • Java 调用webservice接口输出xml自动转义
  • 关于 xpath 查找 XML 元素的一点总结
  • 2025新版懒人精灵零基础及各板块核心系统视频教程-全分辨率免ROOT自动化开发
  • Docker从0-1搭建个人云盘(支持Android iOS PC)
  • 关于Safari浏览器在ios<16.3版本不支持正则表达式零宽断言的解决办法
  • 汽车自动驾驶介绍
  • OpenHarmony 开源鸿蒙北向开发——hdc工具使用及常用命令(持续更新)
  • 数据库进阶之MySQL 程序
  • ARINC818协议一些说明综述
  • onlyoffice8.3.3发布了-豆豆容器市场同步更新ARM64版本
  • 【CAPL实战:以太网】对IPv4报文的Payload部分进行分片并创建分片包
  • 从Kafka读取数据