准确率可达99%!注意力机制+UNet,A会轻松收割!
注意力机制与UNet的结合最近在医学图像分割领域取得了重大突破!在MICCAI2025上,MIT团队提出的AttnUNet模型,通过引入注意力机制,显著提升了UNet在复杂医学图像分割任务中的性能,尤其是在处理低对比度和噪声图像时表现出色。注意力机制能够动态分配权重,聚焦于图像中的关键区域,而UNet则擅长处理图像的局部特征,两者的结合让模型在处理复杂医学图像时更加高效和精准。
想发论文的小伙伴,可以关注以下几个方向:针对特定医学图像(如MRI、CT)设计定制化的注意力机制;探索多模态医学图像分割中的注意力机制应用;将注意力机制与轻量级UNet架构结合,提高模型的实时性和适应性。
为了帮助大家更好地开展研究,我整理了10篇相关的前沿论文,都是顶会顶刊成果,部分论文还附上了代码,全部论文PDF版+开源代码,工种号 沃的顶会 扫码回复 “AUnet” 领取免费获取全部论文+开源代码
AgileFormer:Spatially Agile Transformer UNet for Medical Image Segmentation
文章解析
论文针对现有ViT-UNet在医学图像分割中的局限,提出AgileFormer模型。通过引入可变形补丁嵌入等动态组件,在多个数据集实验,验证其在2D和3D医学图像分割任务中的有效性,性能优于多数先进方法。
创新点
提出可变形补丁嵌入,取代标准刚性补丁嵌入,提升像素级定位能力,适应目标物体形状和尺寸变化。
采用空间动态多头注意力机制,交替使用不同注意力模块,有效捕捉空间变化特征。
设计多尺度可变形位置编码,为不规则采样网格编码,增强模型对不同尺度特征的建模能力。
研究方法
基于三个公开医学图像数据集进行实验,包括Synapse多器官、ACDC心脏和Decathlon脑肿瘤数据集。
对比多种2D和3D医学图像分割模型,以骰子相似系数(DSC)和95% 豪斯多夫距离(HD95)为评估指标。
使用PyTorch框架,在Nvidia V100 GPU上训练模型,设置特定超参数和损失函数。
研究结论
AgileFormer在各数据集上表现卓越,2D和3D多器官分割DSC分别达85.74%和87.43%,超过多数对比模型。
模型在处理形状和尺寸各异的目标物体时优势明显,在小器官和不规则器官分割上性能突出。
为医学图像分割提供新的设计思路,证明引入空间动态组件能有效提升ViT-UNet性能。
Spatial-Frequency Dual Domain Attention Network For Medical Image Segmentation
文章解析
论文针对医学图像分割中现有模型的局限,提出SF-UNet网络。通过MPCA和FSA模块,分别实现多尺度特征融合与双域特征学习。在多个公开数据集上实验,结果表明该网络性能优于以往方法,能精准分割病变区域。
创新点
设计多尺度渐进通道注意力(MPCA)模块,融合相邻编码器层特征,增强多尺度特征学习能力。
构建轻量级频率-空间注意力(FSA)模块,仅含0.05M参数,实现双域特征协同学习。
整体架构结合双模块,有效避免特征冗余,从空间和频率域提升分割精度。
研究方法
以ISIC-2018、BUSI和NKUT数据集为基础,进行数据增强处理。
对比UNet、DeepLabV3+等先进模型,以DSC、IOU等为评估指标。
在双NVIDIA GeForce RTX 3090 GPU上,用PyTorch框架训练模型,设置特定超参数。
研究结论
SF-UNet在各数据集上表现优异,如在ISIC-2018数据集上,DSC达88.46%,IOU达81.34% ,超越多数对比模型。
能精准学习病变纹理和边界特征,在不同数据集上都能有效区分各类病变。
为医学图像分割提供新方案,MPCA和FSA模块具有互补性,提升了网络性能。