当前位置: 首页 > ops >正文

大型语言模型(LLM)的技术面试题

大型语言模型(LLM)的技术面试题

目录

    • 大型语言模型(LLM)的技术面试题
      • 一、提示校准:减轻提示学习中的偏见
      • 二、矢量存储的适用场景
      • 三、模型与人类价值观对齐的技术
      • 四、RLHF中的Reward Hacking
      • 五、微调效果的关键影响因素:预训练模型架构与大小
      • 六、Transformer自注意力机制:衡量单词重要性
      • 七、子词算法(如BPE、WordPiece):限制词汇量
      • 八、Adaptive Softmax:利用Zipf定律提升效率
      • 九、推理参数“温度(Temperature)”:控制输出随机性
      • 十、跨GPU训练技术:FSDP(Fully Sharded Data Parallel)

在这里插入图片描述

一、提示校准:减轻提示学习中的偏见

原理:提示校准(Prompt calibration)通过调整提示词的表述方式,减少模型输出中的固有偏见,而非修改模型本身或训练数据。它聚焦于优化输入指令的中立性和精确性,从而引导模型生成更公平的结果。
举例:若要通过LLM筛选简历,原始提示可能包含“优先考虑年轻候选人”,这隐含年龄偏见。通过提示校准,可调整为“根据岗位要求匹配候选人技能,不考虑年龄因素”,使模型输出更符合公平原则。

二、矢量存储的适用场景

原理:矢量存储用于存储文本的语义向量(捕获语义信息),主要支持需要外部知识检索的任务(如RAG系统)。但并非所有文本任务都需要——仅依赖文本自身上下文即可完成的任务无需矢量存储。
无需矢量存储的场景举例

http://www.xdnf.cn/news/15421.html

相关文章:

  • 【机器人】REGNav 具身导航 | 跨房间引导 | 图像目标导航 AAAI 2025
  • 【算法-BFS 解决最短路问题】探索BFS在图论中的应用:最短路径问题的高效解法
  • docker停止所有容器和删除所有镜像
  • 【Docker基础】Dockerfile指令速览:高级构建指令详解
  • 闲庭信步使用图像验证平台加速FPGA的开发:第十六课——图像五行缓存的FPGA实现
  • 常见的 Commit 描述 分类及示例
  • 2025-07-15通过边缘线检测图像里的主体有没有出血
  • 2025-07-15 李沐深度学习6——Softmax回归
  • 实测两款效率工具:驾考刷题和证件照处理的免费方案
  • vscode里面怎么配置ssh步骤
  • 算法学习笔记:22.贪心算法之霍夫曼编码 ——从原理到实战,涵盖 LeetCode 与考研 408 例题
  • JavaScript进阶篇——第三章 箭头函数核心
  • 17. 什么是 webSocket ?
  • 面试遇到的问题
  • 项目总体框架(servlet+axios+Mybatis)
  • Qt图形视图框架5-状态机框架
  • 【Python进阶】深度复制——deepcopy
  • 【人工智能】通过 Dify 构建智能助手
  • JavaScript书写基础和基本数据类型
  • 8:从USB摄像头把声音拿出来--ALSA大佬登场!
  • 算法训练营day18 530.二叉搜索树的最小绝对差、501.二叉搜索树中的众数、236. 二叉树的最近公共祖先
  • 迁移学习:知识复用的智能迁移引擎 | 从理论到实践的跨域赋能范式
  • 【前端:Typst】--let关键字的用法
  • 排序树与无序树:数据结构中的有序性探秘
  • 自定义类型 - 联合体与枚举(百度笔试题算法优化)
  • 理解Linux文件系统:从物理存储到统一接口
  • vue3 JavaScript 数据累加 reduce
  • 七、深度学习——RNN
  • 编程语言设计目的与侧重点全解析(主流语言深度总结)
  • 游戏框架笔记