当前位置: 首页 > java >正文

[Mamba轻量化]DefMamba: Deformable Visual State Space Model,CVPR2025

paper

文章目录

  • Abstract
  • Method
    • 整体模型架构
    • 可变形状态空间模型
  • Experiments

Abstract

然而,大多数现有的视觉Mamba方法使用预定义的扫描顺序将图像展平为1D序列,导致模型在特征提取过程中对图像空间结构信息的利用能力减弱。为解决这一问题,作者提出了一种新型视觉基础模型——DefMamba。该模型包含多尺度 Backbone 结构和可变形Mamba(DM)模块,能够动态调整扫描路径以优先处理重要信息,从而提升对相关输入特征的捕获和处理能力。通过结合可变形扫描(DS)策略,该模型显著增强了学习图像结构的能力,并能检测物体细节的变化。
在这里插入图片描述
可变形扫描和其他扫描方法的比较。 (a)栅格扫描[23,47],(b)局部扫描[19],(c)连续扫描[42],(d)可变形扫描。蓝点表示参考点,红点表示可变形点。黄色箭头代表固定的扫描顺序,红色梯度箭头表示采取的扫描顺序。我们的方法表现更能,可以准确捕获对象的结构特征,从而可以开发更精致的扫描方法。

Method

整体模型架构

在这里插入图片描述

可变形状态空间模型

在这里插入图片描述
Deformable Scanning.
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Experiments

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

http://www.xdnf.cn/news/6386.html

相关文章:

  • 如何在线免费压缩PDF文档?
  • Unix Bourne Shell
  • ET MailBoxComponent类(实体) 分析
  • 开源的跨语言GUI元素理解8B大模型:AgentCPM-GUI
  • html的鼠标点击事件有哪些写法
  • 密码学实验:凯撒密码
  • JESD204 ip核使用与例程分析(一)
  • PINN Poisson 1d
  • Vue3学习(组合式API——reactive()和ref()函数详解)
  • 基于大模型预测短暂性脑缺血发作(TIA)的技术方案大纲
  • aptitude 深度教程:从基础到生产实践
  • 紫外相机工作原理及可应用范围
  • 海外短剧系统:解锁全球内容消费新蓝海
  • mysql-Java手写分布式事物提交流程
  • RHCSA 考试操作手册(基于红帽企业 Linux 8/9 版本)​
  • AbstractErrorController简介-笔记
  • Flink 运维监控与指标采集实战(Prometheus + Grafana 全流程)
  • 人工智能、深度学习、机器学习的联系与区别
  • JMeter元件(元组)--简单介绍
  • 群晖NAS部署PlaylistDL音乐下载器结合cpolar搭建私有云音乐库
  • 基于Leaflet和天地图的免费运动场所WebGIS可视化-以长沙市为例
  • 嘉立创天猛星使用串口下载代码
  • 精益数据分析(61/126):移情阶段评分体系构建与实战案例解析
  • 解密企业级大模型智能体Agentic AI 关键技术:MCP、A2A、Reasoning LLMs-MCP大模型上下文解析
  • 鸿蒙OSUniApp 开发的一键分享功能#三方框架 #Uniapp
  • 集合进阶2
  • RTSP 播放器技术探究:架构、挑战与落地实践
  • VMware虚拟机 安装 CentOS 7
  • 全国各地区经纬度数据(包含省、市、县)
  • Java基础(多线程2)