当前位置：首页 > ops >正文

大型语言模型（LLM）的技术面试题

ops 2025/7/17 8:12:45

大型语言模型（LLM）的技术面试题

目录

- 大型语言模型（LLM）的技术面试题
- - 一、提示校准：减轻提示学习中的偏见
  - 二、矢量存储的适用场景
  - 三、模型与人类价值观对齐的技术
  - 四、RLHF中的Reward Hacking
  - 五、微调效果的关键影响因素：预训练模型架构与大小
  - 六、Transformer自注意力机制：衡量单词重要性
  - 七、子词算法（如BPE、WordPiece）：限制词汇量
  - 八、Adaptive Softmax：利用Zipf定律提升效率
  - 九、推理参数“温度（Temperature）”：控制输出随机性
  - 十、跨GPU训练技术：FSDP（Fully Sharded Data Parallel）

在这里插入图片描述

一、提示校准：减轻提示学习中的偏见

原理：提示校准（Prompt calibration）通过调整提示词的表述方式，减少模型输出中的固有偏见，而非修改模型本身或训练数据。它聚焦于优化输入指令的中立性和精确性，从而引导模型生成更公平的结果。
举例：若要通过LLM筛选简历，原始提示可能包含“优先考虑年轻候选人”，这隐含年龄偏见。通过提示校准，可调整为“根据岗位要求匹配候选人技能，不考虑年龄因素”，使模型输出更符合公平原则。

二、矢量存储的适用场景

原理：矢量存储用于存储文本的语义向量（捕获语义信息），主要支持需要外部知识检索的任务（如RAG系统）。但并非所有文本任务都需要——仅依赖文本自身上下文即可完成的任务无需矢量存储。
无需矢量存储的场景举例

http://www.xdnf.cn/news/15421.html

相关文章：

【机器人】REGNav 具身导航 | 跨房间引导 | 图像目标导航 AAAI 2025

【算法-BFS 解决最短路问题】探索BFS在图论中的应用：最短路径问题的高效解法

docker停止所有容器和删除所有镜像

【Docker基础】Dockerfile指令速览：高级构建指令详解

闲庭信步使用图像验证平台加速FPGA的开发：第十六课——图像五行缓存的FPGA实现

常见的 Commit 描述分类及示例

2025-07-15通过边缘线检测图像里的主体有没有出血

2025-07-15 李沐深度学习6——Softmax回归

实测两款效率工具：驾考刷题和证件照处理的免费方案

vscode里面怎么配置ssh步骤

算法学习笔记：22.贪心算法之霍夫曼编码 ——从原理到实战，涵盖 LeetCode 与考研 408 例题

JavaScript进阶篇——第三章箭头函数核心

17. 什么是 webSocket ?

面试遇到的问题

项目总体框架(servlet+axios+Mybatis)

Qt图形视图框架5-状态机框架

【Python进阶】深度复制——deepcopy

【人工智能】通过 Dify 构建智能助手

JavaScript书写基础和基本数据类型

8：从USB摄像头把声音拿出来--ALSA大佬登场！

算法训练营day18 530.二叉搜索树的最小绝对差、501.二叉搜索树中的众数、236. 二叉树的最近公共祖先

迁移学习：知识复用的智能迁移引擎 | 从理论到实践的跨域赋能范式

【前端:Typst】--let关键字的用法

排序树与无序树：数据结构中的有序性探秘

自定义类型 - 联合体与枚举（百度笔试题算法优化）

理解Linux文件系统：从物理存储到统一接口

vue3 JavaScript 数据累加 reduce

七、深度学习——RNN

编程语言设计目的与侧重点全解析（主流语言深度总结）

游戏框架笔记