当前位置: 首页 > news >正文

一种用于医学图像分割的使用了多尺寸注意力Transformer的混合模型: HyTransMA


核心内容: 我是菜鸡!我是菜鸡!我是菜鸡!

如果老师及学姐学长对该文有任何意见,请您随时告诉我,我随时可以删除这篇文章(非常非常真诚)!

如果我有内容解释有误或不够清晰也请随时告诉我,我随时会对文章进行调整。

HyTransMA: A Hybrid Model Using Transformer with Multi-scale Attentions for Medical Image Segmentation

一种用于医学图像分割的使用了多尺寸注意力Transformer的混合模型: HyTransMA

核心内容

将Transformer和卷积网络进行了结合,使用卷积神经网络Resnet和Swin Transformer作为不同的分支,从两种角度对图像的特征进行提取,再用MSA多头注意力来得到最终的结果。

模型结构

在这里插入图片描述

其中蓝色的部分为Swin Transformer

绿色的部分为卷积Resnet

黄色的部分则为多头MSA

在编码阶段,一共三次将Swin Transformer和Resnet的相同尺寸的特征融合在一起,所以一共产生了三种不同尺寸的特征,分别对应了三次concat。

在解码阶段,则主要使用UpBlock上采样,来统一不同尺寸的输入。

与TransUNet 作对比

本文与TransUNet一样,同样都是在医学图像分割方向,并将卷积与Transformer结合在了一起,但是结合的方式有很大区别。

结合方式

在TransUNet中,Transformer实际处理的是由卷积模型提取出的特征。

而在本文中,Transformer与卷积模型分别提取了图像的特征。

个人参考

  1. Swin Transformer 原文

  2. Swin Transformer讲述很好的博客

  3. TransUNet

碎碎念

1.目前看近一两年看到的图像相关论文,有很多的图像问题都已经在使用Transformer来替代卷积。

但是Transformer确实缺乏足够的局部特征提取能力,不知道未来是否有相关的技术可以直接的解决这些问题。

2.TransUNet使用的应该是相对传统的VIT,那么如果切换到Swin Transformer是否会有提高,可以提高到什么程度。

或者说,本文和TransUNet不同的处理及提取特征的方式,对应侧重点是什么呢,这些需要进一步分析。

3.如果需要深入研究这一领域知识的话,需要把表单中其他的算法继续研究一下。

可以看出大部分模型都有不同的侧重点,如果能够深入分析出为什么可以表现出这种侧重就好了。

在这里插入图片描述

4.未来再回过头在补充吧,还有一些包括训练策略在内容的内容我们还没有看,可以再从paperconnect再看一下。

http://www.xdnf.cn/news/1124101.html

相关文章:

  • 记录自己在将python文件变成可访问库文件是碰到的问题
  • Linux的相关学习
  • JavaScript进阶篇——第一章 作用域与垃圾回收机制
  • 2025 R3CTF
  • 日语学习-日语知识点小记-构建基础-JLPT-N3阶段(4):语法+单词+復習+发音
  • JS基础知识(上)
  • 设计模式(行为型)-迭代器模式
  • H2 与高斯数据库兼容性解决方案:虚拟表与类型处理
  • 前端开发中的常见问题及解决方案
  • 群晖Nas - Docker(ContainerManager)上安装SVN Server和库权限设置问题
  • HarmonyOS从入门到精通:动画设计与实现之九 - 实用动画案例详解(下)
  • Redis作缓存时存在的问题及其解决方案
  • mysql 与redis缓存一致性,延时双删 和先更新数据库,再删除缓存,哪个方案好
  • 《Librosa :一个专为音频信号处理和音乐分析设计的Python库》
  • Pythonic:Python 语言习惯和哲学的代码风格
  • Kubernetes 高级调度01
  • STM32F1_Hal库学习UART
  • 破局与重构:文心大模型开源的产业变革密码
  • Java-ThreadLocal
  • java基础(day07)
  • 打开xmind文件出现黑色
  • 【LeetCode 热题 100】94. 二叉树的中序遍历——DFS
  • 13.计算 Python 字符串的字节大小
  • SpringMVC2
  • 鸿蒙开发NDK之---- 如何将ArkTs的类型转化成C++对应的类型(基础类型,包含部分代码解释)
  • 修改主机名颜色脚本
  • 虚拟货币交易:游走在合法与犯罪的生死线
  • 在Adobe Substance 3D Painter中,已经有基础图层,如何新建一个图层A,clone基础图层的纹理和内容到A图层
  • Java:继承和多态(必会知识点整理)
  • 【React Natve】NetworkError 和 TouchableOpacity 组件