【阿里云大模型高级工程师ACP习题集】2.2 扩展答疑机器人的知识范围
练习题
-
【单选题】在RAG应用的建立索引过程中,文本向量化的主要目的是( )。
A. 将文本转换为计算机能理解的数字形式,便于比较相似度
B. 对文本进行分类
C. 去除文本中的噪声数据
D. 提取文本中的关键词 -
【多选题】以下属于RAG应用中建立索引步骤的有( )。
A. 文档解析
B. 文本分段
C. 模型训练
D. 存储索引 -
【单选题】在使用LlamaIndex创建RAG应用时,
SimpleDirectoryReader('./docs').load_data()
函数的作用是( )。
A. 从指定目录读取文件并解析为document对象
B. 从网络加载数据
C. 创建索引
D. 设置提问引擎 -
【多选题】在RAG应用的检索生成阶段,为提高检索准确性,可以采取的方法有( )。
A. 使用性能强大的embedding模型
B. 做重排(rerank)
C. 句子窗口检索
D. 增加大模型的训练数据 -
【单选题】在RAG应用中,存储索引的主要作用是( )。
A. 增加响应速度,避免重复建立索引步骤
B. 备份数据
C. 便于对数据进行分类管理
D. 提高大模型的理解能力 -
【多选题】关于RAG应用中的多轮对话,以下说法正确的有( )。
A. 与直接向大模型发起多轮对话机制相同
B. 直接将用户输入与文本段进行相似度比较可能会丢失历史对话信息
C. 业界常用方法是通过大模型基于历史对话信息改写用户问题
D. LlamaIndex无法实现RAG应用的多轮对话 -
【单选题】在使用LlamaIndex创建RAG应用时,
VectorStoreIndex.from_documents
函数内部不包含以下哪个操作( )。
A. 文本分段
B. 建立索引
C. 文本向量化
D. 文档解析 -
【多选题】在创建RAG应用时,以下哪些是需要配置的关键参数( )。
A. API Key
B. embedding模型
C. 文本生成模型
D. 数据库连接字符串 -
【单选题】在RAG应用中,
Ope