当前位置：首页 > web >正文

CVPR焦点 | 神经网络新范式：轻量化与精度并行，重塑视觉任务性能天花板

web 2025/8/23 7:21:15

关注gongzhonghao【CVPR顶会精选】

神经网络卷积想找新亮点？不妨考虑：动态结构设计。作为深度学习架构搜索与高效建模两大热点的结合，动态神经网络凭借自适应推理与高效特征利用的优势，在视觉识别、视频理解等任务中脱颖而出，发展前景相当可观，已成为CVPR发文热门。

这一方向尤其在轻量化推理、场景自适应等任务中容易产出创新点。近年顶会顶刊收录的趋势也显示，结构重构、条件计算、稀疏激活等方向极具潜力。今天小图给大家精选3篇CVPR有关神经网络方向的论文，请注意查收！

论文一：Training-free Neural Architecture Search through Variance of Knowledge of Deep Network Weights

方法：

作者以随机初始化的候选网络和少量数据为输入，并统计权重层面的“知识方差”，用以量化架构的可学性与泛化潜力。这些局部统计被在层与网络尺度上进行归一化与加权汇聚，形成对模型规模不敏感的单一评分，从而能公平比较不同深度与宽度的候选结构。最终将该评分作为训练免费代理嵌入NAS流程，快速筛选并重评分候选，几乎无需训练即可锁定高质量架构，显著降低搜索时间与算力消耗并在标准图像分类基准上取得SOTA表现。

创新点：

提出以Fisher信息为核心的知识方差指标，作为零训练准确率预测器，摆脱完整训练与参数更新的束缚。
通过层级与全局统计的稳健汇聚获得高排名相关性，在多搜索空间与数据集上均可稳定指引架构选择。
将极低开销代理融入NAS循环，实现数量级的计算加速，同时保持甚至提升最终性能，优于现有训练免费与轻训练基线。

论文链接：

https://arxiv.org/abs/2502.04975

图灵学术论文辅导

论文二：Brain-Inspired Spiking Neural Networks for Energy-Efficient Object Detection

方法：

作者构建MSD框架，以脉冲神经元堆叠形成多尺度特征主干，并通过跨尺度聚合与轻量级检测头，把离散时间步中的脉冲活动凝练为类别与边界框预测，兼顾细粒度与全局语义。在训练阶段，采用时间展开的端到端优化与替代梯度，对分类与回归目标联合约束，同时调控发放稀疏度以平衡信息保真与能耗。推理时模型以少量时间步传播并依赖稀疏计算完成检测，在降低运算密度与时延的同时保持甚至提升精度，体现出显著的能源效率优势。

创新点：

提出融合多尺度时空特征的脉冲检测架构，充分利用脉冲稀疏性同时兼顾小物体与大场景表征。
端到端的时序脉冲推理与训练设计，实现有限时间步内的高效检测，显著降低能耗与延迟。
在多数据集与多基线下展现优越的能效-准确率折中，整体性能稳定优于现有方法，具备良好可部署性。

论文链接：

https://ieeexplore.ieee.org/document/11092565

图灵学术论文辅导

论文三：VISTREAM: Improving Computation Efficiency of Visual Streaming Perception via Law-of-Charge-Conservation Inspired Spiking Neural Network

方法：

作者将VISTREAM以SNN作为主干并注入“电荷守恒”启发式，约束跨时间步的脉冲积累与转移，保留关键信息同时削减冗余脉冲以源头降算。面向持续视频流，系统依据帧间变化自适应调节时间步与稀疏度，复用跨帧状态并进行多尺度时空聚合，从而在低延迟路径上维持稳健的感知精度。训练与推理端到端一体优化，对能耗—准确率折中进行显式权衡，最终在多基准上实现显著节能且精度不降的平衡表现。