LLM面试50问:NLP/RAG/部署/对齐/安全/多模态全覆盖
太好了!下面按你点名的 6 大主题(NLP、检索/RAG、部署、对齐、 安全、多模态)给出深度版答案 + 关键公式/推导 + 最小可跑示例代码 + 常见坑。都尽量精炼到“拿来即用/面试可白板推导”的粒度。
NLP(架构、位置编码、指令跟随)
1) RoPE 长上下文与缩放
要点:RoPE 将位置 pp 以旋转矩阵注入到 q,kq,k:
NTK/动态缩放:把 pp 替换为 p/αp/\alpha 或调 θ0\theta_0,能在不改结构下外推更长序列;α>1\alpha>1 代表拉伸时间轴(常见 1.5–8)。
最小伪代码(PyTorch):
def apply_rope(x, pos, base=10000.0, scale=1.0):# x: [B, L, H, D], D 偶数;pos: [L]half = x.shape[-1] // 2freqs = base ** (-torch.arange(0, half, device=x.device) / half)# 位置缩放:pos/scaleangles = torch.einsum('l,d->ld', pos / scale, freqs