当前位置：首页 > java >正文

(cvpr2025) LSNet: See Large, Focus Small

java 2025/7/14 17:34:15

wechat_2025-04-21_121936_417

作者指出，人类视觉系统遵循两步机制：(1) 通过周边视觉的大视场感知（See large）捕捉全景。(2) 注意力可以被引导到场景的特定元素上，通过中央视觉的小视野聚集（Focus small）理解细节。这种特征源于视网膜中两种感光细胞的空间分布和视觉能力不同，即视杆细胞和视锥细胞。

这种“See large, focus small”的方法使人类视觉系统能够快速、熟练地处理视觉信息。

wechat_2025-04-21_142056_785

受人类视觉感知的启发，作者提出了 Large-Small （LS）卷积，使用大核静态卷积进行 large-field perception，使用小核动态卷积进行 Small-field aggregation。结构如下图(a)所示，包括两个步骤：

第一步：Large-kernel perception，结合图示非常容易理解，首先使有和1x1卷积进行通道降维，然后用大核卷积获得大感受野的空间上下文信息，最后两再通道升维。
第二步： Small kernel aggregation，本质是分组动态卷积。特征分为G组，每组使用的卷积核是Large-kernel perception生成的。这样可以有效地表示自适应细粒度特征，使模型对不同环境下的动态复杂变化敏感。

wechat_2025-04-21_142523_141

以 LS 卷积为基础，作者构建了轻量网络 LSNet，如上图(b)中所示，结构也比较简单。作者做了大量实验证明 LS 卷积的效果，可以参考作者论文，这里不过多介绍。

http://www.xdnf.cn/news/827.html

相关文章：

Java 设计模式心法之第3篇 - 总纲：三大流派与导航地图

使用json_repair修复大模型的json输出错误

小天互连：助力信创产业的国产化即时通讯系统

alibaba-JSONObject使用

无人船 | 图解基于PID控制的路径跟踪算法(以全驱动无人艇WAMV为例)

FlaskRestfulAPI接口的初步认识

文件包含漏洞，目录遍历漏洞，CSRF，SSRF

iFable，AI角色扮演互动平台，自动生成沉浸式故事游戏

Yocto项目实战教程‑第6章‑Poky‑镜像菜谱‑机器配置文件‑发行版配置文件‑QEMU

Pandas高级功能

项目二 - 任务7：统计一组学生成绩

2021-11-14 C++三七二十一数

【二叉树专题】一道深入浅出的 DFS 题：求二叉树的直径（含通俗易懂讲解）

996引擎-坐骑系统：官方坐骑系统+设置外观实现方案

OpenCSG AutoHub v0.5.0 版本发布

快速从S32K358切换到328

【C++】异常处理

用P0口控制LED(STC89C52单片机)

对于校园网如何进行用户识别——captive portal的原理学习总结

10 C 语言常量详解：#define 与 const 定义常量及其区别与应用

延长（暂停）Windows更新

【C++详解】C++入门(一)命名空间、缺省参数、函数重载

【牛客练习赛137 C】题解

AI与思维模型【71】——断裂点理论

3.4/Q2，GBD数据库最新文章解读

端口被占用的综合解决方案

NHANES指标推荐：RFM

C++类成员函数重写、覆盖与隐藏