【论文粗读|arXiv】GaSpCT: Gaussian Splatting for Novel CT Projection View Synthesis

Abstract

本文提出了一种新颖的视图合成和3D场景表示方法,用于为计算机断层扫描(CT)生成新的投影视图。
方法采用了Gaussian Splatting 框架,基于有限的2D图像投影集,无需运动结构(SfM)方法,在CT中实现新颖视图合成。因此,我们减少了总扫描持续时间和患者在扫描期间接受的辐射剂量。
我们调整了损失函数来适应我们的任务,即通过使用两个稀疏性促进正则化项来鼓励更强的背景和前景区分(beta loss 和 TV loss)。最后,我们使用均匀的先验分布来初始化3D空间中的高斯位置,这个先验分布表示大脑的位置在视野内可能的位置。模型性能评估使用了脑部CT数据集,并证明了渲染的新视图和模拟扫描的原始投影视图密切匹配,并且比其他隐式3D场景表示方法表现更好。此外,和基于神经网络的稀疏视图CT图像重建相比,实验观察到训练时间减少了。最后,和等效的体素网格图像表示相比,高斯splatting的表示所需的内存减少了17%。

Contributions

  1. 引入了GaSpCT,一种隐式(译者注:是不是说错了,3DGS是显式表达)3D场景表示和新颖的视图合成模型,允许从有限的投影数据集渲染新颖的CT大脑投影,该模型占用的内存较小,而且渲染新视图的计算成本较低。
  2. 在CT成像中,预计未被患者占据的像素将具有空或背景强度值。为了提高合成视图的平滑性和稀疏性,我们增强了3DGS中使用的基线损失函数,添加了总变分损失(TV loss)和Beta分布负对数似然损失。
  3. 引入了一个脚本将CT相机参数近似为针孔相机的参数,从重建图像 医学数字成像和通信元数据中提取CT相机参数。因此消除了运动结构(SfM)的必要性,由于缺乏明显的边缘,SfM在CT照片上表现不佳。此外,我们的方法还初始化了代表预期患者脑容量的椭球3D点云。
  4. 我们对脑部CT投影图像上的隐式3D场景表示进行了首次验证,冰箱医学生成社区提供所有使用的数据集。

方法

GaSpCT

模型基于Gaussian Splatting,针对CT脑扫描调整了该模型,在损失函数中添加了两个促进稀疏性的正则化器,并将点云初始化为椭球体(类似于大脑结构)。

在这里插入图片描述

Gaussian Splatting

原始的Gaussian Splatting模型中三维场景被编码为3D高斯。每个Guassian由38个参数组成,包括位置、协方差、颜色和不透明度。在优化期间,从训练集分布中采样2D图像和相机姿态。通过使用可微高斯光栅化器,可以从给定姿势的点云渲染等效图像。计算渲染图像和真实图像之间的损失,并使用Adam优化器对损失函数的梯度执行反向传播。原始的损失函数是:
L o r i g i n a l = ( 1 − λ ) L 1 + λ L D _ S S I M L_{original}=(1-\lambda)L_1+\lambda L_{D\_SSIM} Loriginal=(1λ)L1+λLD_SSIM

Total Variation Regularization: 我们加入了总变分损失。 TV惩罚了相邻像素之间的较大变化,增强图像的平滑度同时减少噪声伪影的影响。
L T V = λ T V ∑ i , j N , M ∣ p i + 1 , j − p i , j ∣ + ∣ p i , j + 1 − p i , j ∣ L_{TV}=\lambda_{TV}\sum_{i,j}^{N,M}|p_{i+1,j}-p_{i,j}|+|p_{i,j+1}-p_{i,j}| LTV=λTVi,jN,Mpi+1,jpi,j+pi,j+1pi,j
其中p表示坐标i,j处的像素值。N、M分别是图像的高度和宽度。

Beta 分布正则化器 :我们采用Beta分布的负对数似然。这种损失通过将背景值推至0并增强前景的像素强度来促进稀疏性。
L b e t a = 1 / P ∑ p [ l o g ( I α ( p ) ) + l o g ( 1 − I α ( p ) ) ] L_{beta}=1/P\sum_p[log(I_{\alpha}(p))+log(1-I_{\alpha}(p))] Lbeta=1/Pp[log(Iα(p))+log(1Iα(p))]
P是总像素数量, I α I_{\alpha} Iα是图像不透明度。

总损失函数:
L f i n a l = λ 1 L 1 + λ D _ S S I M L D _ S S I M + λ T V L T V + λ b e t a L b e t a L_{final}=\lambda_1L_1+\lambda_{D\_SSIM}L_{D\_SSIM}+\lambda_{TV}L_{TV}+\lambda_{beta}L_{beta} Lfinal=λ1L1+λD_SSIMLD_SSIM+λTVLTV+λbetaLbeta

实验

数字重建放射图像: 通过输入从DICOM元数据检索的视野、患者和扫描仪参数,使用3D DICOM图像作为输入体模来模拟CT扫描。DRR的输出是一组新的投影图像。我们生成角度分辨率为1度的360°投影视图。图像大小128*128。该程序用于为不同患者的20次CT脑部扫描生成DRR,以捕获不同人之间的解剖变异性。

Structure from Motion 在 CT图像上的挑战: Gaussian Splatting需要SfM软件的输出作为训练脚本的输入。包括相机内外参和表示3D场景中已识别特征的点云。然而将SfM应用与CT图像尤其具有挑战性。这是放射密度在重建的投影图像上逐渐变化的结果。因此,明显缺乏精致的边缘和良好的细节,这将影响准确和鲁邦的特征提取。

CT图像的相机外参和内参:
我们使用DICOM元数据提供的有关CT扫描参数的先验知识,以数学方式生成相机内参和外参。我们检索的变量是成像空间的视场FOV,探测器阵列的尺寸以及源到探测器和患者的距离。这些变量用于计算每个相机位姿的笛卡尔坐标(x,y,z)。姿态之间的polar angle增量与CT数据集的角分辨率相同,而方位角(azimuth angle)保持固定为0(假设我们将世界坐标的原点设置在CT FOV的中心)。

设置

在单个 NVIDIA RTX A4000上运行。

结果

评价指标:

  1. PSNR
  2. SSIM
  3. LPIPS(Learned Perceptual Image Patch Similarity)

每次扫描的优化过程需要5-10分钟。

在这里插入图片描述

在这里插入图片描述

Future work

  1. 下一步的重要工作是编写一种新型相机,和基于弯曲正交平面的CT成像中的探测器阵列紧密匹配。这种近似比我们当前的针孔相机近似要准确地多;
  2. 此外,值得研究和调整SfM方法中的边缘检测和特征提取,以准确定义初始点云;
  3. 研究使用高斯泼溅表示来表示多种医学扫描的潜力。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1425369.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

【Kubenetes】边缘计算KubeEdge架构设计详解

文章目录 前言KubeEdge云边通信方式云端架构设计EdgeController:云到边:边到云 DeviceController:云到边边到云 边缘端架构设计EdgedPod的管理部分Pod的监控部分Pod的卷管理Pod的垃圾回收Pod同步管理 MetaMangger从云到边缘的更新 (Update From Cloud To Edge)从边缘…

Es6-对象新增了哪些扩展?

​🌈个人主页:前端青山 🔥系列专栏:Javascript篇 🔖人终将被年少不可得之物困其一生 依旧青山,本期给大家带来Javascript篇专栏内容:Es6-对象新增了哪些扩展? 目录 一、参数 二、属性 函数的length属性 …

Pencils Protocol Season 2 收官在即,Season 3 携系列重磅权益来袭

此前Scroll生态LaunchPad &聚合收益平台Pencils Protocol(原Penpad),推出了首个资产即其生态代币PDD的Launch,Season 2活动主要是用户通过质押ETH代币、组件战队等方式,来获得Point奖励,并以该Point为依…

开发一个Rshiny应用(基础)

Introduction Shiny 是一个 R 包,可轻松地直接从 R 构建交互式 Web 应用程序。还可以在网页上托管独立应用程序或将它们嵌入 R Markdown 文档或构建仪表板,还可以使用 CSS 主题、html 小部件和 JavaScript 操作扩展您的 Shiny 应用程序。 #first app l…

使用主机NS记录在cPanel如何添加解析

近期我之前购买了Hostease的域名,并且本身也使用了Hostease的Linux虚拟主机产品,当时时联系咨询了Hostease技术支持帮助操作了域名解析指向了主机,他们当时是将域名默认的4组DNS修改为所属Linux虚拟主机提供的NS记录,但是我现在想要添加我购买…

OpenHarmony上移植memtester

1. 下载源码: wget https://pyropus.ca./software/memtester/old-versions/memtester-4.6.0.tar.gz 2. 解压并指定交叉编译方式 解压 tar -xvf memtester-4.6.0.tar.gz 修改conf-cc和conf-ld,指定交叉编译方式 conf-cc conf-ld 3. 编译 直接运行m…

PWM 什么是PWM?

1. 什么是PWM? PWM是Pulse Width Modulation的缩写,中文是脉冲宽度调制。 是利用微处理器的数字输出来对模拟电路进行控制的一种技术。 2. 面积等效原理 2.1. 什么是面积等效原理? 冲量相等而形状不同的窄脉冲施加在惯性环节上时&#xf…

刷屏一天GPT-4o,发现GPT4用的都还不熟练?戳这儿

以ChatGPT、LLaMA、Gemini、DALLE、Midjourney、Stable Diffusion、星火大模型、文心一言、千问为代表AI大语言模型带来了新一波人工智能浪潮,可以面向科研选题、思维导图、数据清洗、统计分析、高级编程、代码调试、算法学习、论文检索、写作、翻译、润色、文献辅助…

js积累一(ipv4正则校验+弹窗方式)

1. ipv4地址,点分十进制的校验 var regexIP /^((25[0-5]|2[0-4]\d|((1\d{2})|([1-9]?\d)))\.){3}(25[0-5]|2[0-4]\d|((1\d{2})|([1-9]?\d)))$/; if(strRegex.test(ip)) //true: 通过 2. 三种弹窗方式: alert();confirm(); prompt() 1&a…

SUBMIT调用COOIS工序报表获取运行结果后发送ZIP压缩文件

1、SUBMIT调用COOIS报表获取报表结果 2、根据布局格式整理Excel的栏位数据 3、把Excel压缩ZIP 4、发送邮件 运行效果: ************************************************************************ * 程 序 名: * 程序描述:调用COOIS工序…

【SVG 生成系列论文(五)】Diffvg 矢量图生成的开山之作 —— MIT 与 Adobe 合作论文

SVG 生成系列论文(一) 和 SVG 生成系列论文(二) 分别介绍了 StarVector 的大致背景和详细的模型细节。SVG 生成系列论文(三)和 SVG 生成系列论文(四)则分别介绍实验、数据集和数据增…

软考--试题六--命令模式(Command)

命令模式(Command) 意图 将一个请求封装为一个对象,从而使得可以用不同的请求对客户进行参数化;对请求排队或记录请求日志,以及支持可撤销的操作。 结构 适用性 1、抽象出待执行的动作以参数化某对象 2、在不同的时刻指定、排列和执行请求…

[牛客网]——C语言刷题day3

答案&#xff1a;A 解析&#xff1a; A.表示将数组a的首地址赋值给指针变量p B.将一个int型变量直接赋值给一个int型的指针是不行的 C.道理同B D.j2是一个右值&#xff0c;右值是不能进行取地址操作的 #include <iostream> using namespace std;#define N 7 int fun…

基于DEXPI标准的xml转成svg图片的测试

通过对java代码的一顿反编译&#xff0c;这个功能逐渐实现了。也打了日志&#xff0c;通过编码实现了svg的视图的裁剪大小。选择xml文件然后选择文件夹&#xff0c;程序自动进行转换&#xff0c;最后生成svg文件。 最后的xml转换后的成品如下图&#xff1a; 通过与达美盛的工具…

Linux(七) 动静态库

目录 一、动静态库的概念 二、静态库的打包与使用 2.1 静态库的打包 2.2 静态库的使用 三、动态库的打包与使用 3.1 动态库的打包 3.2 动态库的使用 3.3 运行动态库的四种方法 四、总makefile 一、动静态库的概念 静态库&#xff1a; Linux下&#xff0c;以.a为后缀的…

Sam Blackshear谈Move如何赋能开发者

Move编程语言提供了直观的编码体验&#xff0c;让开发者能够快速上手。Mysten Labs的联合创始人兼CTO Sam Blackshear创建了Move&#xff0c;这是一种用于编写智能合约的语言&#xff0c;更像传统编程语言&#xff0c;如JavaScript或Rust。 https://youtu.be/iYe_hG8Mzx8 视频…

Spring MVC(响应 + 状态码)

文章目录 一、RestController VS Controller VS ResponseBody1.1 关于元注解1.2 Controller1.3 ResponseBody1.4 RestController 二、响应2.1 Spring 对于响应的设置2.2 返回静态页面2.3 返回HTML代码片段2.4 返回JSON2.5 设置HTTP状态码2.6 设置响应部分的Header 二、状态码2.…

小红书孕妇宝妈暴力拉新玩法,每日两小时,单日收益500+

哎呀&#xff0c;你好呀&#xff0c;亲爱的小伙伴们&#xff01;我今天心血来潮&#xff0c;想和你们分享一个超级棒的方法&#xff0c;这个方法我亲自试过&#xff0c;超级有效&#xff01;就是在小红书上针对孕妇和宝妈们进行引流的方法。听起来是不是很有趣呀&#xff1f;&a…

Excel表格内容误删未保存怎么找回?5种XLS文件恢复有效方法

在繁忙的工作中Excel表格作为数据处理的重要工具&#xff0c;承载了众多关键信息。然而误删未保存的Excel内容往往让人措手不及。今天我将为大家分析Excel表格内容误删未保存的可能原因&#xff0c;并提供五个免费实用的解决方案&#xff0c;助你轻松找回误删的XLS文件数据。 一…