当前位置: 首页 > java >正文

(cvpr2025) LSNet: See Large, Focus Small

wechat_2025-04-21_121936_417

作者指出,人类视觉系统遵循两步机制:(1) 通过周边视觉的大视场感知(See large)捕捉全景。(2) 注意力可以被引导到场景的特定元素上,通过中央视觉的小视野聚集(Focus small)理解细节。这种特征源于视网膜中两种感光细胞的空间分布和视觉能力不同,即视杆细胞和视锥细胞。

这种“See large, focus small”的方法使人类视觉系统能够快速、熟练地处理视觉信息。

wechat_2025-04-21_142056_785

受人类视觉感知的启发,作者提出了 Large-Small (LS)卷积,使用大核静态卷积进行 large-field perception,使用小核动态卷积进行 Small-field aggregation。结构如下图(a)所示,包括两个步骤:

  • 第一步:Large-kernel perception,结合图示非常容易理解,首先使有和1x1卷积进行通道降维,然后用大核卷积获得大感受野的空间上下文信息,最后两再通道升维。
  • 第二步: Small kernel aggregation,本质是分组动态卷积。特征分为G组,每组使用的卷积核是Large-kernel perception生成的。这样可以有效地表示自适应细粒度特征,使模型对不同环境下的动态复杂变化敏感。

wechat_2025-04-21_142523_141

以 LS 卷积为基础,作者构建了轻量网络 LSNet,如上图(b)中所示,结构也比较简单。作者做了大量实验证明 LS 卷积的效果,可以参考作者论文,这里不过多介绍。

http://www.xdnf.cn/news/827.html

相关文章:

  • Java 设计模式心法之第3篇 - 总纲:三大流派与导航地图
  • 使用json_repair修复大模型的json输出错误
  • 小天互连:助力信创产业的国产化即时通讯系统
  • alibaba-JSONObject使用
  • 无人船 | 图解基于PID控制的路径跟踪算法(以全驱动无人艇WAMV为例)
  • FlaskRestfulAPI接口的初步认识
  • 文件包含漏洞,目录遍历漏洞,CSRF,SSRF
  • iFable,AI角色扮演互动平台,自动生成沉浸式故事游戏
  • Yocto项目实战教程‑第6章‑Poky‑镜像菜谱‑机器配置文件‑发行版配置文件‑QEMU
  • Pandas高级功能
  • 项目二 - 任务7:统计一组学生成绩
  • 2021-11-14 C++三七二十一数
  • 【二叉树专题】一道深入浅出的 DFS 题:求二叉树的直径(含通俗易懂讲解)
  • 996引擎-坐骑系统:官方坐骑系统+设置外观实现方案
  • OpenCSG AutoHub v0.5.0 版本发布
  • 快速从S32K358切换到328
  • 【C++】异常处理
  • 进程控制II
  • 用P0口控制LED(STC89C52单片机)
  • 对于校园网如何进行用户识别——captive portal的原理学习总结
  • 10 C 语言常量详解:#define 与 const 定义常量及其区别与应用
  • 延长(暂停)Windows更新
  • 【C++详解】C++入门(一)命名空间、缺省参数、函数重载
  • 【牛客练习赛137 C】题解
  • AI与思维模型【71】——断裂点理论
  • 3.4/Q2,GBD数据库最新文章解读
  • Redis下载
  • 端口被占用的综合解决方案
  • NHANES指标推荐:RFM
  • C++类成员函数 重写、覆盖与隐藏