UNet改进(37):AxialDynamicConv2D原理剖析与实战应用
1. 传统UNet架构的局限性
UNet采用编码器-解码器结构,通过跳跃连接保留多尺度特征信息。但其核心组件——卷积层,使用固定的卷积核处理所有输入,这存在两个主要问题:
-
内容不适应性:固定卷积核无法根据输入图像的特征动态调整,对于变化较大的数据集表现受限
-
计算效率低下:为获得更强表示能力,往往需要增加网络深度或宽度,导致参数量和计算成本增加
动态卷积技术通过根据输入特征生成卷积权重,为解决这些问题提供了新思路。
2. 轴向动态卷积原理
轴向动态卷积(AxialDynamicConv2d)是一种条件卷积,其核心思想是为每个输入样本生成专属的卷积权重。这种机制使网络能够根据输入内容自适应调整卷积操作,增强模型表达能力。
2.1 权重生成机制
动态卷积的权重生成网络通常采用轻量级结构,通过全局平均池化获取全局上下文信息,然后通过两个1×1卷积层逐步变换到目标权重空间:
self.weight_gen = nn.Sequential(nn.AdaptiveAvgPool2d(1), # 全局平均池化,获取全局上下文nn.Conv2d(in_channels, in_channels