当前位置: 首页 > ds >正文

(aaai2024) Omni-Kernel Network for Image Restoration

代码:https://github.com/c-yn/OKNet

研究动机:作者认为Transformer模型计算复杂度太高,因此提出了 omni-kernel module (OKM),可以有效的学习局部到全局的特征表示。该模块包括:全局、大分支、局部三个部分。

整体网络架构比较简单,就是非常简单的encoder-decoder结构,OKM插入在网络瓶颈位置,特征分辨率最低,计算高效。

OKM的细节如下图所示,包括局部、大核卷积、全局,三个分支。其中,局部分支( 1x1 的卷积)和大核卷积分支( 63x63 的大核卷积)如图所示,比较简单。下面重点介绍一下全局分支,由dual-domain channel attention module (DCAM) 和 frequency-based spatial attention module (FSAM)组成。

在DCAM中,首先计算频率域的 channel attention,然后计算一个空间域的 channel attention。GAP是生成通道维向量,所以是通道注意力,因此DCAM是粗粒度的增强双域特征。

在FSAM中,在空间维度应用基于频率的注意力,在细粒度上细化频域特征。

实验部分可以参考作者论文,这里不过多介绍。

http://www.xdnf.cn/news/10806.html

相关文章:

  • Linux多路TTS混音播放:让多个语音同时清晰可听
  • 系统思考:成长与投资不足
  • ISBN书号查询接口如何用PHP实现调用?
  • NVMe协议简介之AXI总线更新
  • Flask+LayUI开发手记(七):头像的上传及突破static目录限制
  • 鸿蒙进阶——Mindspore Lite AI框架源码解读之模型加载详解(二)
  • D. Gellyfish and Camellia Japonica【Codeforces Round 1028 (Div. 2)】
  • 【存储基础】【VFS】inodedentrysuper_block以及它们之间的关系
  • 【AUTOSAR SystemServices】深入解析StbM模块:功能定义、工作原理与代码实现
  • Eigen库介绍以及模块划分和相关示例代码
  • 论文略读:LIMO: Less is More for Reasoning
  • Spring Boot中保存前端上传的图片
  • TASK OA 案例hook
  • Node.js 项目调试指南
  • 【小沐杂货铺】基于Three.JS构建IFC模型浏览器(WebGL、CAD、Revit、IFC)
  • 10种alpha想法。
  • Uiverse.io:免费UI组件库
  • 界面分析 - 上
  • RabbitMQ深度解析:从基础实践到高阶架构设计
  • leetcode93.复原IP地址:回溯算法中段控制与前导零处理的深度解析
  • Figma 中构建 Master Control Panel (MCP) 的完整设计方案
  • Docker 安装 Redis 容器
  • SQL 执行顺序详解
  • Laplace 噪声
  • 扩展数据(Concatenate)组件研究
  • 《AI Agent项目开发实战》DeepSeek R1模型蒸馏入门实战
  • Python----目标检测(《YOLO9000: Better, Faster, Stronger》和YOLO-V2的原理与网络结构)
  • SystemVerilog—三种线程之间的区别
  • 掌握HttpClient技术:从基础到实战(Apache)
  • IBM 与嘉士伯(Carlsberg)携手推进 SAP S/4HANA 数字化转型,打造啤酒行业新范式