NLP学习路线图(四十三):零样本学习
当数据荒漠中突然出现新任务绿洲,传统模型只能束手无策。想象一个医疗AI系统需要识别新爆发的罕见疾病术语,但训练数据为零;或一个客服机器人面对从未见过的方言俚语——这正是零样本学习(Zero-Shot Learning, ZSL)闪耀的战场。
零样本学习:定义与核心挑战
ZSL的核心目标,是让模型在从未接触过特定任务或类别标签的训练样本的情况下,完成对该任务或类别的推理与预测。这要求模型具备从已有知识向未知领域泛化的能力,而非简单记忆模式。
-
核心区别:
-
少样本学习: 提供少量(如几个到几十个)目标类别的标注样本。
-
零样本学习: 完全不提供目标类别的标注样本。
-
-
核心挑战: 如何弥合可见类别/任务与不可见类别/任务之间的“语义鸿