CVPR焦点 | 神经网络新范式:轻量化与精度并行,重塑视觉任务性能天花板
关注gongzhonghao【CVPR顶会精选】
神经网络卷积想找新亮点?不妨考虑:动态结构设计。作为深度学习架构搜索与高效建模两大热点的结合,动态神经网络凭借自适应推理与高效特征利用的优势,在视觉识别、视频理解等任务中脱颖而出,发展前景相当可观,已成为CVPR发文热门。
这一方向尤其在轻量化推理、场景自适应等任务中容易产出创新点。近年顶会顶刊收录的趋势也显示,结构重构、条件计算、稀疏激活等方向极具潜力。今天小图给大家精选3篇CVPR有关神经网络方向的论文,请注意查收!
论文一:Training-free Neural Architecture Search through Variance of Knowledge of Deep Network Weights
方法:
作者以随机初始化的候选网络和少量数据为输入,并统计权重层面的“知识方差”,用以量化架构的可学性与泛化潜力。 这些局部统计被在层与网络尺度上进行归一化与加权汇聚,形成对模型规模不敏感的单一评分,从而能公平比较不同深度与宽度的候选结构。最终将该评分作为训练免费代理嵌入NAS流程,快速筛选并重评分候选,几乎无需训练即可锁定高质量架构,显著降低搜索时间与算力消耗并在标准图像分类基准上取得SOTA表现。
创新点:
提出以Fisher信息为核心的知识方差指标,作为零训练准确率预测器,摆脱完整训练与参数更新的束缚。
通过层级与全局统计的稳健汇聚获得高排名相关性,在多搜索空间与数据集上均可稳定指引架构选择。
将极低开销代理融入NAS循环,实现数量级的计算加速,同时保持甚至提升最终性能,优于现有训练免费与轻训练基线。
论文链接:
https://arxiv.org/abs/2502.04975
图灵学术论文辅导
论文二:Brain-Inspired Spiking Neural Networks for Energy-Efficient Object Detection
方法:
作者构建MSD框架,以脉冲神经元堆叠形成多尺度特征主干,并通过跨尺度聚合与轻量级检测头,把离散时间步中的脉冲活动凝练为类别与边界框预测,兼顾细粒度与全局语义。在训练阶段,采用时间展开的端到端优化与替代梯度,对分类与回归目标联合约束,同时调控发放稀疏度以平衡信息保真与能耗。推理时模型以少量时间步传播并依赖稀疏计算完成检测,在降低运算密度与时延的同时保持甚至提升精度,体现出显著的能源效率优势。
创新点:
提出融合多尺度时空特征的脉冲检测架构,充分利用脉冲稀疏性同时兼顾小物体与大场景表征。
端到端的时序脉冲推理与训练设计,实现有限时间步内的高效检测,显著降低能耗与延迟。
在多数据集与多基线下展现优越的能效-准确率折中,整体性能稳定优于现有方法,具备良好可部署性。
论文链接:
https://ieeexplore.ieee.org/document/11092565
图灵学术论文辅导
论文三:VISTREAM: Improving Computation Efficiency of Visual Streaming Perception via Law-of-Charge-Conservation Inspired Spiking Neural Network
方法:
作者将VISTREAM以SNN作为主干并注入“电荷守恒”启发式,约束跨时间步的脉冲积累与转移,保留关键信息同时削减冗余脉冲以源头降算。 面向持续视频流,系统依据帧间变化自适应调节时间步与稀疏度,复用跨帧状态并进行多尺度时空聚合,从而在低延迟路径上维持稳健的感知精度。训练与推理端到端一体优化,对能耗—准确率折中进行显式权衡,最终在多基准上实现显著节能且精度不降的平衡表现。
创新点:
引入“电荷守恒”理念约束脉冲传播,抑制冗余放电与震荡,显著减少无效计算。
面向流式输入设计动态计算机制,按内容变化自适应分配时空算力,稳住精度同时降能耗。
统一端到端框架兼顾效率与准确性,在真实视觉流任务上稳定优于现有方法,具备部署友好性。
论文链接:
https://ieeexplore.ieee.org/document/11092726
本文选自gongzhonghao【CVPR顶会精选】