什么是零镜头泛化(Zero-Shot Generalization)
什么是零镜头泛化(Zero-Shot Generalization)?
零镜头泛化是指模型在未经过任何特定任务训练的情况下,仅通过自然语言指令或提示(Prompt)就能完成该任务的能力。
-
核心特点:
- 无需任务特定数据:模型从未见过该任务的输入-输出示例,甚至未针对该任务进行微调。
- 依赖预训练知识:模型通过预训练(如海量文本数据)学习到通用语言规律和世界知识,再通过提示激活相关能力。
- 自然语言交互:通过提示词(如“请将这句话翻译成法语”)引导模型调用内部知识完成任务。
-
示例:
- 若模型仅在英语文本上训练过,但通过提示“Translate ‘I love you’ to Spanish”,能输出“Te amo”,这就是零镜头泛化。
- 模型从未学过“判断电影评论情感”,但通过提示“以下评论是积极还是消极?[文本]”,能正确分类情感,也是