当前位置: 首页 > news >正文

无源域自适应综合研究【2】

这篇论文聚焦于无监督无源域适应(SFUDA),全面梳理了该领域的研究现状与未来方向。SFUDA使预训练模型在无需访问原始训练数据的情况下,适应一个新的未标记域


迁移学习可分为三种不同的范式(i)归纳式迁移学习,其中目标任务与源任务不同,但目标域的标签是可获取的。(ii)无监督迁移学习,其中目标任务与源任务不同,且源域和目标域的标签均不可获取。(iii)直推式迁移学习,其中源任务和目标任务是相同的但源域和目标域不同,且目标域中没有标记数据。

研究背景与目标

  • 背景:传统无监督域适应(UDA)需同时输入源域和目标域数据,但在实际场景中,源数据可能涉及隐私或设备资源有限,难以获取。SFUDA应运而生,它让预训练模型在无需源数据的情况下适应新的未标记目标域,更贴合现实需求。SFUDA 通过将其工作流程分为两个不同的阶段来实现这一点:(i)预训练阶段,使用带注释的源样本对模型进行预训练;(ii)适应阶段,此时无法访问源样本,模型仅使用未标记的目标样本适应目标域。
    在这里插入图片描述

  • 目标:对SFUDA方法和应用进行全面综述,按适应目标分类方法,分析优缺点,总结应用领域,并探讨未来研究方向。

核心内容

  • SFUDA方法分类
    按照在适应阶段(即 Stage 2)的核心目标是什么分类—— 也就是模型在适应目标域时,最终想通过学习达成什么效果。
    【改参数、对齐特征、造样本三大类】
    在这里插入图片描述

    • 一、自调优方法:通过自我创建的监督信号适应模型,分为伪标签、基于正则化的学习和多任务学习三个子类别。
      • 伪标签:为目标样本分配伪标签并基于此适应模型,又分特征空间和输出空间伪标签
        1.特征空间伪标签通过构建类质心等方式生成伪标签。【Lee 等人 [43]:结合了两方面信息:一是伪标签自身的置信度(比如模型对这个伪标签的 “把握”),二是伪标签和模型输出预测之间的一致性(两者越吻合,权重越高),通过这种组合来量化权重。给 “靠谱” 的伪标签样本 “投票权” 更大,给 “不靠谱” 的样本 “投票权” 更小,既不浪费数据,又能降低干扰。】
        2.输出空间伪标签利用分类器预测结果获取伪标签,还常借助额外模型提升伪标签质量。【Zhang 等人 [53] 引入了一个公开可用的预训练 Transformer [54],使其与源预训练模型共同推断伪标签,并设计了一种基于置信度的筛选策略,用于在预训练 Transformer 和源预训练模型的输出之间选择伪标签。】
        3.减少噪声累积的问题:一般的伪标签方法是 “交替进行” 的:先生成伪标签,用它训练模型,然后用更新后的模型重新生成更准的伪标签,反复迭代。
        而这里的两阶段方法是 “分步骤” 的:
        第一阶段:专注于生成 “更干净”(噪声更少)的伪标签(可能也会迭代优化,但核心是优化标签);
        第二阶段:用第一阶段得到的干净标签,直接训练或微调模型(不再反复生成新标签)。【Yan 等人 [59]给标签增加 “多样性”—— 比如对同一个目标样本做不同的数据增强(如裁剪、旋转),然后把这些增强样本的预测结果合并,作为最终伪标签(避免单一预测的偏差)。】
        一、(a)特征空间伪标签流程
(1).目标图像经特征提取器得到无标签目标特征,构建类中心,给特征分配伪标签。
(2):对带伪标签的特征,通过 精炼、过滤、加权 优化。
(3). Model Adaptation:结合损失(Loss (es) )反向更新完成模型适配。
二、(b)输出空间伪标签流程
左半部分:目标图像输入模型,输出伪标签(柱状图示意),经 “精炼、过滤” 迭代优化伪标签,用损失更新模型。
右半部分:筛选出的伪标签目标图像,再次输入模型,通过损失持续更新模型参数
      • 基于正则化的学习:仅通过正则化项适应模型,如信息最大化、雅可比范数、早期学习等正则化方法。【我认为正则化就是增强学生个人能力的各种约束方案】
      • 多任务学习:结合多个任务适应模型,包括辅助任务(如旋转预测等自监督任务)、特征对齐和伪标签任务。
        在这里插入图片描述
    • 二、特征对齐方法:通过对齐目标样本与目标数据结构内的内在信息或目标域之外的信息来适应模型,分为域内对齐和域间对齐。
      • 域内对齐:探索目标数据结构,在目标域内寻找对齐参考,包括基于目标特征间内在结构关系和由源类似目标样本构建伪域两种类型。
        内在结构关系:步骤 1对齐参考探索找到近k个作为对齐参考,找到正负样本对。步骤 2目标特征对齐,确定正样本对和负样本对后,下一步是对目标特征进行对齐。
        源类似目标样本:步骤 1目标样本选择。此步骤旨在选取类源域的目标样本,以构建伪源域。步骤 2域对齐。一旦伪源域建立完毕,下一步就是减小伪源域与剩余目标域之间的差异。
        高置信度样本(伪源域)是 “可信标杆”,低置信度样本是需要优化的对象。两个分类器在高置信度样本上保持一致(确认标杆可靠),在低置信度样本上故意 “吵架”(一个说 A 类,一个说 B 类)。这种矛盾会迫使模型修正低置信度样本的特征,直到它们跨越原本模糊的 “决策边界”,最终与高置信度样本的特征分布对齐(被归为明确类别)。)
      • 域间对齐:在目标域之外寻找对齐参考,包括由生成新的源类似样本构建伪源域和提取源模型中的隐藏源信息两种类型。【Yeh 等人 [122] 提出了一种新颖的三级对齐流程来解决域差异问题。具体而言,他们在将目标数据映射到标签的推理过程以及将标签映射到重构目标样本的生成过程中,均进行输入级、特征级和输出级的对齐,以实现模型适配。】
    • 三、样本生成方法:通过生成样本适应模型,分为源生成、目标生成和中间域生成。源生成将目标样本翻译为源类似样本;目标生成生成带标签的目标样本直接训练目标模型;中间域生成生成中间域来桥接源域和目标域。
  • 应用领域

    • 计算机视觉:在分割、检测和分类任务中均有应用。例 如,在道路分割中,通过熵最小化和输出空间伪标签适应模型,提升在恶劣天气下的分割性能;在3D点云检测中,利用时间一致性估计缩放参数生成伪标签来适应模型。
    • 其他领域:还应用于医疗、脑电数据处理、机械故障诊断等领域。如在自闭症诊断、肺炎诊断中,利用SFUDA处理医疗数据的域偏移问题;在机械故障诊断中,结合特征空间伪标签和信息最大化正则化适应模型。

创新点

  • 分类方式创新:根据适应目标将SFUDA方法分为自调优、特征对齐和样本生成三大类,每类下又细分多个子类别,这种分类方式清晰且具有系统性。
  • 全面的应用总结:详细梳理了SFUDA在计算机视觉(分割、检测、分类)以及医疗、脑电、机械等多个领域的应用,展现了其广泛的实用性。
  • 未来方向展望:提出了灾难性遗忘、自监督学习、架构适配和基础模型适配等未来研究方向,为后续研究提供了清晰的指引。

未来方向

  • 灾难性遗忘:研究在适应新域时不遗忘先前所学知识的SFUDA方法。
  • 自监督学习:开发专门针对SFUDA的自监督学习方法,使其更好地利用源域知识并与其他SFUDA子任务协作。
  • 架构适配:研究适配Transformer等新型架构的SFUDA方法,解决现有方法在Transformer架构上应用的挑战。
  • 基础模型适配:设计针对大型基础模型的高效适配方法,在SFUDA框架下实现对基础模型的参数高效适配。

总结

这篇论文为SFUDA领域提供了全面且系统的综述,不仅有助于研究人员快速了解该领域的研究现状和应用情况,还为未来的研究指明了方向。其分类方法和对未来方向的探讨具有重要的参考价值,可推动SFUDA在更多实际场景中的应用和发展。

原文题目:Source-Free Unsupervised Domain Adaptation: Current research and future directions请大家自行搜索阅读原论文

http://www.xdnf.cn/news/1180909.html

相关文章:

  • C++ 性能优化
  • 力扣 hot100 Day54
  • pytest中使用skip跳过某个函数
  • 无人机速度模块技术要点分析
  • 第三章:掌握 Redis 存储与获取数据的核心命令
  • MNIST 手写数字识别模型分析
  • 秋叶sd-webui频繁出现生成后无反应的问题
  • 【Web APIs】JavaScript 节点操作 ⑧ ( 删除节点 - removeChild 函数 | 删除节点 - 代码示例 | 删除网页评论案例 )
  • 算法竞赛阶段二-数据结构(34)数据结构链表STL vector
  • 【PyTorch】图像二分类项目-部署
  • Spring Boot 3整合Spring AI实战:9轮面试对话解析AI应用开发
  • HttpServletRequest深度解析:Java Web开发的核心组件
  • PyTorch数据选取与索引详解:从入门到高效实践
  • Vue3 面试题及详细答案120道(91-105 )
  • 开立医疗2026年校园招聘
  • 论文复现-windows电脑在pycharm中运行.sh文件
  • 工具篇之开发IDEA插件的实战分享
  • C# 方法执行超时策略
  • 处理URL请求参数:精通`@PathVariable`、`@RequestParam`与`@MatrixVariable`
  • Lua元表(Metatable)
  • Python 使用环境下编译 FFmpeg 及 PyAV 源码(英特尔篇)
  • TDengine 转化类函数 TO_CHAR 用户手册
  • 【数字IC验证学习------- SOC 验证 和 IP验证和形式验证的区别】
  • 借助 VR 消防技术开展应急演练,检验完善应急预案​
  • 数据库底层索引讲解-排序和数据结构
  • 主流 BPM 厂商产品深度分析与选型指南:从能力解析到场景适配
  • 基于深度学习的CT图像3D重建技术研究
  • Python-初学openCV——图像预处理(二)
  • MySQL 表的操作
  • 大模型Prompt优化工程