【读论文】自监督消除高光谱成像中的非独立噪声
丁广瑞 ¹⁴、刘畅 ²⁴、尹家泽 ¹⁴、滕新艳 ³⁴、谭玉英 ²⁴、何宏建 ¹⁴、林浩楠 ¹⁴*、田雷 ¹²⁴*、程继新 ¹²³⁴*
(¹ 美国马萨诸塞州波士顿市波士顿大学电气与计算机工程系,邮编 02215;² 美国马萨诸塞州波士顿市波士顿大学生物医学工程系,邮编 02215;³ 美国马萨诸塞州波士顿市波士顿大学化学系,邮编 02215;⁴美国马萨诸塞州波士顿市波士顿大学光子学中心,邮编 02215)
摘要
Hyperspectral imaging(高光谱成像) has been widely used for spectral and spatial identification of target molecules, yet often contaminated by sophisticated noise(常受复杂噪声干扰). Current denoising methods generally rely on independent and identically distributed(独立同分布) noise statistics, showing corrupted performance for non-independent noise removal(在去除非独立噪声时性能会下降). Here, we demonstrate Self-supervised PErmutation Noise2noise Denoising (SPEND)(自监督置换噪声到噪声去噪), a deep learning denoising architecture tailor made for removing non-independent noise from a single hyperspectral image stack(专为从单幅高光谱图像堆栈中去除非独立噪声设计的深度学习去噪架构). We utilize hyperspectral stimulated Raman scattering and mid-infrared photothermal (中红外光热)microscopy as the testbeds, where the noise is spatially correlated and spectrally varied(空间相关性和光谱变化性). Based on single hyperspectral images, SPEND permutates odd and even spectral frames(通过对奇数和偶数光谱帧进行置换) to generate two stacks with identical noise properties, and uses the pairs for efficient self-supervised noise-to noise training. SPEND achieved an 8-fold(信噪比) signal-to-noise improvement without having access to the ground truth data. SPEND enabled accurate mapping of low concentration biomolecules(低浓度生物分子) in both fingerprint and silent regions(指纹区和静默区), demonstrating its robustness in sophisticated cellular environments.
引言
高光谱成像能在复杂环境中提供丰富的光谱与空间信息 ¹⁻⁴。受激拉曼散射(SRS)⁵和中红外光热(MIP)⁶显微镜等先进振动光谱成像技术,具备高空间分辨率,能够分辨生物系统中重叠的振动波段。然而,对于低浓度分子,原始的高光谱 SRS 或 MIP 图像往往受到严重噪声污染,影响后续光谱分割或定量分析的效果。基于计算的图像去噪技术为克服这些硬件限制提供了可行方案,且考虑到获取高信噪比图像存在诸多挑战,不依赖真实标签的去噪算法具有尤为重要的价值。
基于模型的高光谱去噪算法依赖目标在空间和光谱域的先验知识。主成分分析(PCA)结合二维空间和一维光谱小波收缩方法,利用信号与噪声之间的光谱特征方差差异,可有效降低低能量主成分中的噪声,同时保留重要光谱信息⁷。此外,光谱总变分(STV)方法通过引入空间和光谱平滑约束来抑制噪声⁸。三维非局部均值⁹和块匹配四维滤波(BM4D)¹⁰方法会将相似像素块分组,以增强去噪过程中的特征识别能力。尽管这些方法具有创新性,但由于物理系统的复杂性以及推导闭合形式表达式存在困难,基于模型的去噪器在低信噪比环境下的性能往往不尽如人意。
为克服这些挑战,研究人员开发了自监督深度学习去噪算法。基于相邻像素遵循相同感受野的前提,研究人员提出了 Noise2Void(N2V)和 Noise2Self 算法 ¹¹⁻¹²。另一方面,Noise2Noise(N2N)算法利用成对的独立低信噪比测量数据,将其同时作为输入和输出,直接学习噪声统计特性与目标先验知识 ¹³。N2V 和 N2N 已衍生出多种适用于三维图像堆栈去噪的变体,例如 DeepInterpolation¹⁴会完全屏蔽中心帧,依靠相邻帧的连续性进行信号插值;DeepVID¹⁵进一步引入 N2V 策略以增强空间信号相关性;Noise2Stack¹⁶和 DeepCAD¹⁷等技术通过奇偶帧分割构建信号和噪声分布相同的堆栈对,从而实现基于 N2N 的去噪。这些先进的自监督去噪方法成功突破了噪声统计独立且均值相同的三维成像系统的性能局限,但 N2N 和 N2V 均无法处理相关噪声。
与此同时,由于信号生成、采集和放大过程复杂,先进高光谱成像系统常面临非独立噪声问题。包括上述 SRS 和 MIP 在内的多种泵浦 - 探测高光谱成像系统,均依赖对微弱强度变化的解调。由锁相放大器(LIA)¹⁸实现的外差检测,是提取微弱调制信号的关键手段,但 LIA 低通滤波器中电子电路的延迟响应,以及信号生成频率与提取频率的不匹配,会导致相邻像素间的信息泄露。此外,样品局部环境的扰动会使相邻测量产生相关性,而样品的光谱吸收差异以及不同波数下输入能量的不均匀性,还会导致光谱变化性噪声。
针对这些问题,我们提出自监督置换噪声到噪声去噪(SPEND)方法,这是一种无需显式噪声建模的自监督学习去噪器。SPEND 采用堆栈置换策略,通过确定置换方向来打破噪声的相关性:选择合适的轴后,将原始堆栈分割为两个子堆栈,再以交替序列(奇数 + 偶数、偶数 + 奇数)重新组合,使相邻帧成为同一样品的两个独立测量结果。该方法不仅能将信噪比显著提升约 8 倍,还能广泛适用于多种光谱解混工具,包括最小绝对收缩与选择算子(LASSO)¹⁹、多元曲线分辨率(MCR)²⁰和相量分析(Phasor Analysis)²¹,可在指纹区和静默区实现高保真度的化学分析。
结果
高光谱 SRS 系统中的噪声空间相关性与光谱变化性

本研究首先阐明了 SRS 图像的获取过程:在 SRS 系统中,泵浦光和斯托克斯光两束脉冲序列共线聚焦于样品,其中斯托克斯光被调制为 2.4 MHz;与样品相互作用后,泵浦光功率会在调制频率下产生损耗;获取单色 SRS 图像后,通过光谱聚焦生成三维高光谱 SRS 图像(图 1a、图 S1)。调制强度通过锁相放大器(LIA)提取,该设备兼具混频器和低通滤波器的功能(图 1b),而受 LIA 信号处理复杂性的影响,其输出噪声具有非独立性。
我们观察到噪声统计特性在两个空间轴上存在异质性:如图 1c 所示,噪声功率谱密度(PSD,即噪声自相关函数的傅里叶变换)在激光扫描的快轴和慢轴上差异显著,快轴上的噪声 PSD 从低频到高频呈明显下降趋势,表现出图案化噪声特征,这与独立同分布噪声的特性相悖 —— 在双光子荧光成像中,独立同分布噪声在两个轴上的 PSD 均呈均匀分布(图 S2)。为深入探究空间特性,我们对相邻像素间的噪声进行皮尔逊互相关(PCC)分析(图 1d):在像素停留时间 70% 的固定时间常数下,提高扫描速度(即缩短像素停留时间)会不可避免地增强噪声相关性;如图 1e 所示,缩短时间常数无法消除噪声相关性,且 PCC 还与样品上的激光功率呈正相关。这些发现表明,背后的物理过程具有复杂性,也使得通过实验消除空间噪声相关性的尝试面临困难。
除空间相关性外,SRS 中的噪声还具有光谱异质性,并与信号强度相关。在 SRS 光谱成像中,光谱域的恒定噪声假设不再成立 —— 尽管激光 1/f 噪声、探测器热噪声和泊松散粒噪声 ²² 在空间和光谱域呈独立同分布,且已在 SRS 系统中得到广泛研究,但我们的研究发现了一种在光谱域呈非均匀分布的新型噪声。图 1f 基于二甲基亚砜(DMSO)溶液的高光谱 SRS 数据,展示了噪声的光谱变化性,这种光谱变化性噪声与呈均匀分布的高斯噪声或泊松噪声 ²³ 不同,调整光电二极管的探测器功率可拟合泊松噪声分布,而图 1g 显示拉曼共振 / 非共振噪声与泊松噪声的统计行为存在显著差异,这表明在高光谱 SRS 系统中,传统的泊松噪声到高斯噪声的转换方法并不适用。
我们认为这种光谱变化性噪声源于受激拉曼过程中的热效应 ²⁴(图 1h-i):当泵浦光与探测光的频率差匹配化学键的振动频率时,会产生光子发射,导致拉曼增益和损耗;同时,化学键发生振动激发并随后进行非辐射弛豫,这一过程会加热局部环境,引发更强的热波动。光热诱导噪声与白噪声不同,在拉曼共振处会出现峰值。综上,我们的研究结果凸显了这些系统中噪声特性的复杂性,也表明有必要开发一种针对这些复杂动态过程的新型去噪框架(噪声特性分析方法详见图 S3 及实验方法部分)。
自监督置换噪声到噪声去噪器(SPEND)

为去除高光谱 SRS 图像中具有空间相关性和光谱变化性的噪声,我们提出自监督置换噪声到噪声去噪(SPEND)框架,其示意图如图 2 所示。该方法首先选择置换轴:根据不同轴上的噪声相关水平(以相邻像素的波动程度衡量)确定置换轴,在图 2a 中,由于 ω 轴的噪声相关性最低,因此被选为置换方向,这一步骤对高光谱 SRS 数据的噪声估计至关重要。通常,相邻像素波动较小意味着相关性较高,这类轴不适合作为独立测量的代表,因此在置换时需避免选择;相反,沿波动较大的轴进行分割,可打破噪声相关性,使目标与输入图像对之间具有更高的独立性,从而最大化 N2N 算法的优势。

为强调置换轴选择的重要性,我们对比了多种高光谱 SRS 数据采集策略的结果 ²⁵:噪声相关特性由扫描模式决定,例如在 ω-y-x 扫描模式下(图 S4a),光谱域存在显著的噪声相关性,因此沿空间轴置换可获得最佳效果(图 S4b、c);而在传统 x-y-ω 扫描模式下(图 S4d),空间噪声更为显著,沿 ω 轴置换可保留关键的高频噪声特征,从而实现有效去噪(图 S4e、f)。

置换过程如图 2b 所示:沿选定轴将原始数据堆栈分割为奇数帧和偶数帧,再将这些帧交替拼接,形成训练阶段的输入和目标数据集(图 2c)。这种拼接序列为 N2N 算法提供了基础支持,即实现同一样品视场的独立测量;通过重新组合,可利用输入数据中的全部信号和噪声信息,实现对噪声的无偏估计。网络架构采用 U-Net 结构 ²⁶(详见图 S5):训练阶段,将置换生成的两个拼接堆栈分别作为神经网络的输入和目标;预测阶段(图 2d),输入数据按原始序列输入模型,以保持光谱和空间信息的连续性与完整性。
为验证 SPEND 的通用性和有效性,我们将其与多种已发表的化学解混方法(相量分析、LASSO、MCR)相结合。图 S6 展示了有无参考光谱情况下的典型化学解混过程,表明 SPEND 能显著提升信噪比,进而实现更可靠的化学解混,为理解生物系统提供更深入的信息。随后,我们通过化学解混从高光谱 SRS 堆栈中获取全面的成分信息,并对比不同置换策略的结果以开展综合研究(图 S7):图 S7a 显示,空间置换能显著降低噪声,但可能导致部分特征模糊,这一问题可通过扩大训练数据集或成像时在空间域过采样来改善;图 S7b 表明,置换轴的选择会影响化学解混结果,凸显合适轴选择的重要性 —— 通过优化选择,即使空间信息存在模糊,仍能保持光谱分辨率,从而获得良好的解混效果;图 S7c 计算了不同置换策略的光谱误差;图 S7d 显示各轴的相关水平,其中空间轴的相关性低于光谱轴,因此优先选择沿空间轴置换;不当的置换策略会损害去噪器性能;图 S7e、f 对比了光谱域和空间域置换的效果提升。
SPEND 在光谱域和空间域的性能验证
验证 SPEND 提升高光谱 SRS 图像质量的效果具有重要意义,尤其是该自监督去噪器旨在提高无标记化学成像模式的灵敏度,而这类成像模式通常缺乏真实标签(GT)数据。SRS 成像中的信噪比(SNR)与斯托克斯光强度和泵浦光强度的平方根的乘积成正比(SNR ∝ Iₛₜₒₖₑₛ√Iₚᵤₘₚ),是衡量图像质量的基本指标 ²⁷。为定量评估 SPEND 的性能,我们通过调整斯托克斯光强度和像素停留时间构建测试集:提高两束光的平均功率可生成高信噪比参考图像,降低功率则获得待去噪的低信噪比图像;去噪后,噪声可降低 8.5 倍,而信号强度保持不变,因此信噪比可提升约 8.5 倍。我们采用结构相似性指数(SSIM)、傅里叶环相关(FRC)²⁸和弗雷歇距离(Fréchet distance)²⁹作为衡量空间和光谱性能的指标。
图 3a 展示了低激光功率组和经去噪处理的单色 SRS 图像,并将 SPEND 的性能与黄金标准去噪算法 BM4D 进行基准对比;图 3b 采用 LASSO 方法对脂质、胆固醇和蛋白质通道进行化学解混(参考光谱见图 S8),同时拍摄同一样品在高激光功率下的图像作为参考,以验证解混准确性(高信噪比组及其解混结果见图 S9,用于计算光谱误差和 SSIM)。光谱误差通过基于单像素光谱计算弗雷歇距离来评估(图 3c、图 S10 及实验方法),结果显示 SPEND 的光谱失真小于 BM4D 处理结果和低功率原始数据。图 3d-e 通过 SSIM 和峰值信噪比(PSNR)对各化学通道的光谱和空间性能进行评估,表明 SPEND 的性能优于 BM4D。图 3f-g 突出显示了感兴趣区域(ROI)中的一条线,低功率组和 BM4D 处理组中无明显可分辨特征,而经 SPEND 处理后,可识别出 2 μm 位置处直径为 1 μm 的斑点。我们通过傅里叶环相关(FRC)定量分析分辨率 ——FRC 可衡量空间频率信息的一致性,如图 3h 所示,SPEND 实现的分辨率接近 400 nm,与高激光功率组的分辨率(约 414 nm)高度接近,显著优于低激光功率组(约 612 nm)和 BM4D 处理组(约 575 nm)。综上,SPEND 在信噪比提升和空间分辨率改善方面均优于 BM4D。
SPEND 实现指纹区高保真 SRS 成像
碳 - 氢(C-H)伸缩振动区(2800-3100 cm⁻¹)存在强拉曼峰,该区域的 SRS 信号光谱拥挤,在复杂生物环境中化学特异性有限;相比之下,指纹区 SRS 通过为每种生物成分提供独特的拉曼峰,在提升特异性方面具有显著优势,蛋白质、脂肪酸和胆固醇等主要化学物质可在该区域被区分(图 4a)。然而,指纹区的拉曼截面固有较弱,导致信噪比降低,为化学分析带来挑战。
如图 4b 所示,将 SPEND 应用于高光谱 SRS 图像堆栈,可显著提升指纹区的信噪比,我们通过与 C-H 区的结果交叉验证来进一步确认效果 —— 图中展示了单帧图像以体现提升效果,图 S11 提供了详细对比,突出显示脂肪酸、胆固醇和蛋白质富集区域的光谱,表明 SPEND 能大幅降低光谱噪声,且这些选定区域的共绘光谱(图 S11b-d)进一步印证了 SPEND 的改善效果。图 4c 展示了基于原始指纹区数据、SPEND 处理后数据和 C-H 区数据,通过 MCR 生成的化学图谱 ——MCR 可提取细胞环境中的化学光谱,并通过比较输入光谱与提取光谱的差异进行稳健性分析。我们首先使用 SSIM 比较指纹区与 C-H 区解混结果的相似性(图 4d):在原始数据组中,难以区分脂肪酸、胆固醇和蛋白质成分,背景噪声在脂肪酸和蛋白质通道中产生了干扰信号;在箱线图的 SSIM 结果中,原始数据的 SSIM 值接近 0,这表明低信噪比的原始指纹区数据与高信噪比的 C-H 区数据几乎无相似性。经过 SPEND 去噪后,化学成分可在各通道中清晰分离,高 SSIM 值表明各化学图谱与 C-H 区结果具有显著相似性。不过,我们仍观察到指纹区与 C-H 区的解混结果存在部分差异(如图 4c 中箭头所示):例如,在 C-H 区解混结果中,弥散分布的胆固醇被显示为集中的斑点;在蛋白质通道中,强聚集区域是由 DNA 信号泄露导致的 —— 我们认为指纹区能实现更精准的成分分离,而 C-H 区则受不同化学成分交叉干扰的影响较大。
通过比较提取光谱与纯化学物质光谱的差异,可评估解混结果的准确性。图 4e 对比了指纹区和 C-H 区经 MCR 提取的光谱失真情况:两者的平均失真水平相当,表明两种区域的解混化学图谱均具有可信度;但由于 C-H 区化学峰拥挤,其光谱失真的方差显著高于指纹区,导致化学解混结果的不确定性增加(部分直接对比见图 S12)。在指纹区,MCR 能保持各成分在相同波数下的特征峰,尽管在 1600 cm⁻¹ 附近因交叉相位背景信息泄露出现了一个肩峰,但由于其强度相对较低,对解混结果的影响有限;而在 C-H 区,脂肪酸和胆固醇的整体光谱形态发生改变,脂肪酸在 2850 cm⁻¹ 附近的特征峰以及胆固醇在 2860 cm⁻¹ 附近的特征峰均被背景噪声掩盖。综上,将 SPEND 应用于指纹区可解决拉曼信号微弱的问题,提升化学解混的准确性。
SPEND 实现静默区低浓度分子的高保真 SRS 成像
受激拉曼散射(SRS)已被广泛用于静默区中炔烃标记小分子的生物正交成像 ³⁰。例如,高丙炔基甘氨酸(HPG)作为一种生物正交前体,被用于点击化学中蛋白质合成的研究 ³¹⁻³²。HPG 在 2125 cm⁻¹ 附近存在拉曼峰,通过静默区的 SRS 成像,可在无需点击反应的情况下探测蛋白质的动态变化与分布 ³³。尽管该应用具有重要意义,但由于 HPG 的拉曼截面有限且浓度仅为微摩尔级,其 SRS 信号的信噪比较低,定量分析面临困难;此外,交叉相位调制(XPM)会显著增加背景噪声,进一步阻碍纯 HPG 信号的分离。
通过应用 SPEND,我们显著提升了静默区 SRS 图像的保真度。为实现定量化学解混,获取各成分(包括 HPG 和 XPM)的准确参考光谱至关重要:我们从纯 HPG 溶液的高光谱 SRS 数据中提取出 HPG 光谱,随后通过光谱相量分析获得其他解混参考光谱(图 5a-f)。相量分析识别出三个不同的聚类,分别对应 HPG、细胞体中的 XPM 以及脂质中的 XPM—— 在 HPG 处理组和对照组中,这种聚类的清晰度均显著提升,证实了 SPEND 的稳健性。图 S13 通过绘制感兴趣区域(ROI)的光谱,展示了噪声降低效果,证实 SPEND 可抑制所有像素的帧间噪声。我们采用非对称加权 penalized 最小二乘法(arPLS)³⁴为每个 ROI 提取 HPG 峰(详见实验方法):若不使用 SPEND,由于不同样品的 XPM 光谱存在差异,在这些区域中无法提取此类特征峰;令人意外的是,细胞内各成分的 XPM 光谱互不相同,这导致传统化学解混方法的结果存在不确定性,而原始数据无法提供解混所需的清晰度,这也凸显了 SPEND 在区分这些成分方面的有效性(相量分析提取的光谱作为 LASSO 解混的参考,详见图 S14)。
通过 SPEND 去噪与解混处理,我们从高光谱 SRS 堆栈中区分出主要成分,包括 HPG、脂质的 XPM 以及细胞体的 XPM(图 5g-h)。帧间变化分析显示,HPG 处理组和对照组的噪声均大幅降低(图 5i)。在图 5j 中,我们对 12 个细胞的 HPG 强度进行定量分析,以验证该方法的稳定性:HPG 处理组在 HPG 通道中的强度显著高于对照组,p 值为 1.58×10⁻⁷,这一结果证实了 SPEND 的有效性。
SPEND 实现指纹区高保真高光谱 MIP 成像
除 SRS 模式外,中红外光热(MIP)成像 ³⁵⁻³⁸也是一种无需标记即可揭示化学分布的有力工具。图 6 展示了 MIP 系统中复杂的噪声分布 ³⁹,以及 SPEND 对高光谱 MIP 数据的改善效果:图 6a 阐明了 MIP 的物理原理 —— 中红外光束激发化学键,使样品局部温度升高;温度变化会改变样品的折射率,进而影响可见探测光束强度的重新分布,利用这一效应可生成化学图谱(MIP 显微镜的装置图见图 S15)。我们在图 6b 中分析了聚甲基丙烯酸甲酯(PMMA)微球 MIP 图像的噪声相关性,证实了 MIP 显微镜中噪声分布的非独立特性;图 6c 展示了噪声的光谱变化性,这表明在所有泵浦 - 探测成像模式中,光谱变化性噪声均具有普遍性,也凸显了我们提出的去噪方法的必要性。
接下来,我们验证了 SPEND 在指纹区 MIP 成像中的有效性。图 6d 展示了白色念珠菌(C. albicans)真菌细胞在指纹区的高光谱 MIP 图像,以及 SPEND 处理后的结果 —— 去噪后信噪比提升了 13 倍。图中呈现了高光谱 MIP 数据堆栈中三个波数的图像,分别为 952 cm⁻¹、1070 cm⁻¹ 和 1162 cm⁻¹:前两个波数对应碳水化合物中的 O-H 键和 C-O 键(真菌细胞壁的关键成分),且两者浓度存在差异 ——O-H 键来源于通常存在于植物细胞壁中的多聚半乳糖醛酸(PGA)⁴⁰,在真菌细胞壁中较为少见;在原始数据中,由于信噪比低,难以区分单个真菌细胞,而经 SPEND 处理后,O-H 键和 C-O 键的差异分布变得清晰可见;1162 cm⁻¹ 对应脂质中的 C-O 键,SPEND 处理后可分辨出多个脂滴。我们随后采用时间彩色编码方法,展示了真菌细胞壁的三层结构(图 6e-f):原始数据中,低信噪比掩盖了连续的层状结构,而去噪后结构轮廓更平滑、更清晰;图 6g 展示了各层的 MIP 光谱,进一步验证了光谱维度的准确性。综上,SPEND 显著提升了指纹区 MIP 成像的信噪比,使复杂生化结构的区分和可视化效果更佳。
讨论
去噪对于提升各类显微镜的灵敏度至关重要。本研究以高光谱 SRS 显微镜和 MIP 显微镜为基础,深入分析了复杂的噪声分布特征:在空间上,噪声相关性源于锁相放大器中的信号泄露和样品中的扰动扩散,且主要沿快扫描轴分布;增加像素停留时间是降低这种相关性的有效方法,但会同时降低扫描速度,此外热量积累也可能导致相关性增加,从而抵消延长像素停留时间的效果;在光谱上,拉曼共振 / 非共振状态会导致噪声变化,且这种变化与 SRS 信号强度近似成正比。
为解决这些复杂的噪声问题,我们开发了自监督框架 SPEND,并证实了置换策略对提高去噪准确性和效率的必要性。SPEND 将灵敏度提升了高达 8 倍,且被证实可与多种化学解混工具兼容,从而实现了指纹区和静默区的高保真 SRS 与 MIP 成像:在指纹区,SPEND 能够对脂质、蛋白质和胆固醇进行定量分析 —— 这些成分在 C-H 区难以区分;通过抑制光谱噪声并提高化学通道分离的精度,即使在没有高信噪比参考的情况下,SPEND 也能优化指纹区的化学解混效果;在静默区,SPEND 实现了 HPG 的定量分布分析,而这是单色 SRS 无法完成的;此外,将 SPEND 应用于 MIP 显微镜的实验,也证实了其在其他成像模式中的通用性 —— 与 SRS 成像相比,MIP 得益于较大的红外吸收截面,在指纹区具有更高的灵敏度,而 SPEND 进一步提升了 MIP 图像的性能,实现了更高的信噪比。
除 SRS 和 MIP 成像外,SPEND 还有潜力应用于其他基于锁相放大的三维成像模式 —— 这些模式同样面临复杂的噪声问题。例如,受激拉曼光热显微镜 ²⁴、布里渊散射显微镜⁴¹ 和瞬态吸收显微镜⁴² 等技术,均存在类似的复杂噪声问题,应用 SPEND 可在无需额外硬件成本的情况下提升其信噪比。此外,SPEND 的应用范围不仅限于高光谱成像,还可用于提升视频的信噪比,为动态成像场景中的噪声抑制提供便捷解决方案。
尽管 SPEND 展现出强大的去噪能力,但仍可能面临拟合成像问题。这些问题可通过扩大训练数据集的规模和复杂性来解决,从而提高模型的准确性和泛化能力。然而,要获得 N2N 框架所需的独立测量数据,对空间和光谱域的数据采集策略提出了特定要求。为优化 SPEND 的效果,我们建议在数据采集过程中遵循奈奎斯特采样率,并根据去噪后分析所需的特定特征调整采样率。因此,采用合理的数据采集策略对于充分发挥 SPEND 的去噪能力、确保高质量成像结果至关重要。
实验方法
受激拉曼散射显微镜
本研究使用实验室搭建的高光谱受激拉曼散射显微镜(图 S1)进行高光谱 SRS 成像,该装置的细节已在之前的研究中发表⁴³。实验采用飞秒脉冲激光器(Insight, DeepSee+, spectra-Physics),工作频率为 80 MHz,输出两束同步光束:可调谐泵浦光(波长范围 680 nm-1300 nm)和固定波长斯托克斯光(1040 nm)。其中,泵浦光在 C-H 区调谐至 800 nm,在静默区炔烃三键成像时调谐至 852 nm,在指纹区调谐至 890 nm;斯托克斯光通过声光调制器(1205-C, Isomet)调制为 2.5 MHz,并在与泵浦光合并前,通过 15 cm 长的玻璃棒(SF57, Schott)进行啁啾处理;两束合并后的光束经五根玻璃棒啁啾后,形成皮秒脉冲。实验通过电动线性平台调节泵浦光与斯托克斯光之间的时间延迟,该延迟与化学键的拉曼位移相对应;采用二维振镜扫描仪(GVS102, Thorlabs)进行激光扫描;合并后的光束通过 60 倍水浸物镜(数值孔径 NA=1.2, UPlanApo/R, Olympus)聚焦于样品;与样品相互作用后的光束通过油浸聚光镜(NA=1.4, U-AAC, Olympus)收集;经斯托克斯光滤除后,信号由光电二极管(S3994-01, Hamamatsu)采集;高频信号通过锁相放大器(UHFLI, Zurich Instrument)提取。
噪声光谱与空间分析
噪声特性的评估过程如图 S3 所示。为简化分析,所有实验均在纯化学样品上进行:在光谱变化性分析中,通过测量小区域内的标准差量化噪声水平,同时计算该区域的平均强度以代表信号水平,随后通过绘制噪声与信号的关系图,阐明两者的相关性;在空间相关性分析中,利用纯化学样品的视频数据 —— 由于存在物镜漂移问题,实验以平均强度代表信号,通过将单帧图像减去平均强度来分离噪声分布,随后对相邻行或列进行皮尔逊互相关分析,以评估噪声的空间相关性。
模型训练与推理
为提高模型的稳健性,实验采用了翻转和 180 度旋转等数据增强手段 —— 这种谨慎的选择是为了避免扭曲非均匀分布的固有噪声模式,因为传统数据增强方法若与噪声结构不匹配,可能会加剧噪声问题。此类增强操作确保了增强后数据集的完整性,准确反映了原始数据的特征。
数据增强后,训练集规模扩大了 4 倍,共包含 24 个堆栈(90% 用于训练,10% 用于验证),每个堆栈包含 400×400 像素和 100 帧。实验基于 CSBDeep 框架⁴⁴,采用 4 层 U-Net 架构;训练在商用图形处理器(GPU, RTX 4090, Nvidia)上进行,耗时 2 小时;对单个完整图像堆栈进行去噪推理的时间为 14 秒。
化学解混
本研究采用三种成熟的化学解混方法:多元曲线分辨率(MCR)、最小绝对收缩与选择算子(LASSO)和相量分析。高光谱数据的维度(x, y, λ)分别表示为 Nₓ、Nᵧ、Nλ。
在光谱相量分析中,通过一阶谐波的离散傅里叶变换解析每个像素的光谱;将整个图像的像素分布在复平面上,可识别出代表目标化学通道的特定聚类;相量分析通过 ImageJ 插件(Spechron Phasor)实现。
对于 MCR 和 LASSO,首先将三维高光谱堆栈按光栅顺序排列像素,重塑为二维矩阵(D ∈ R^(NₓNᵧ×Nλ))。假设感兴趣的化学通道数量为 K,采用模型将数据矩阵分解为浓度图(C ∈ R^(NₓNᵧ×K))与纯化学物质光谱轮廓(S ∈ R^(K×Nλ))的乘积,公式如下: \(D = CS^T + E \quad (1)\) 其中 E 为误差项。MCR-ALS(交替最小二乘)算法通过带约束的交替最小二乘法求解双线性模型,提高了浓度图 C 和光谱轮廓 S^T 的可解释性。在 LASSO 中,通过对浓度矩阵的每一行添加 L1 范数正则化,采用逐行 LASSO 回归求解原始逆问题,公式如下: \(\hat{C_{l,:}} = \arg\min_{C_{i,:} \geq 0} \left\{ \frac{1}{2}\left\| D_{i,:} - C_{i,:}S^T \right\|_2^2 + \lambda \left\| C_{i,:} \right\|_1 \right\}\) 其中,Cᵢ,: 为 K 维非负向量,代表浓度矩阵的第 i 行;Ĉₗ,: 为 LASSO 回归的输出;Dᵢ,: 为数据矩阵的第 i 行;λ 为调节稀疏程度的超参数。MCR 通过 Python 库 pyMCR 实现,LASSO 通过 GitHub 项目(github.com/buchenglab/LASSOspectral-unmixing)实现。
光谱失真定量分析
实验采用输入光谱与参考光谱的弗雷歇距离(Fréchet distance)量化单个像素的光谱失真(图 S10a)。在数学上,弗雷歇距离通过计算两条曲线各点的最小距离,衡量曲线间的相似性:设 A 和 B 为两条连续曲线,分别由函数 a:[0,1]→Rⁿ和 b:[0,1]→Rⁿ表示(其中 Rⁿ为 n 维欧几里得空间),则 A 与 B 之间的弗雷歇距离定义为: \(d_F(A,B) = \inf_{\alpha,\beta} \max_{t \in [0,1]} \| a(\alpha(t)) - b(\beta(t)) \|\) 其中,α 和 β 遍历所有从 [0,1] 到 [0,1] 的连续、非递减满射函数(确保两条曲线均从起点遍历至终点);||・|| 通常表示两条曲线上点之间的欧几里得距离。
在光谱失真分析中,实验计算每个像素的弗雷歇距离(图 S10b-c 为光谱失真计算示例),并采用并行计算提高效率。
空间分辨率校准
实验采用傅里叶环相关(FRC)²⁸对分辨率进行基准测试,该方法同时考虑了图像的点扩散函数(PSF)和信噪比。通过计算输入图像与参考图像在不同空间频率下的归一化互相关,当互相关值降至 1/7 时,对应的空间频率即为截止空间频率,以此确定分辨率。
用于峰提取的非对称加权 penalized 最小二乘(arPLS)平滑
arPLS 是一种用于基线校正的数值方法,对输入光谱中的噪声具有高耐受性,能有效去除高光谱 SRS 数据中的交叉相位背景。设 x 为输入信号向量,Z 为潜在背景 —— 背景 z 需保持 x 的变化趋势且具有平滑性,通过正则化最小二乘函数表示为: \(R(z) = (x - z)^T(x - z) + \lambda z^T D^T D z \quad (3)\) 其中 D 为差分矩阵。在公式(3)中引入权重项,可将其修改为 penalized 最小二乘函数: \(P(z) = (x - z)^T W(x - z) + \lambda z^T D^T D z \quad (4)\)
T 的偏导数并令其等于 0,可得到背景 z 的表达式: \(z = \left(W + \lambda D^T D\right)^{-1} W x \quad (5)\)
偏最小二乘(PLS)算法通过迭代调整权重,将每次估计的基线\(z_i\)与信号\(x_i\)进行比较。为消除噪声干扰,arPLS 算法通过逻辑函数引入非对称加权机制,权重计算公式如下: \(w_{i}=\left\{\begin{array}{c} \text{logistic}\left(d_{i}, m, \sigma\right)=\frac{1}{1+e^{\frac{2\left(d_{i}-(-m+2 \sigma)\right)}{\sigma}}}, x_{i}>z_{i} \\ 1, x_{i}<z_{i} \end{array}\right.\) 其中,\(d_i = x_i - z_i\),m 和 σ 分别为负 d 区域的均值和标准差。算法迭代直至收敛,收敛条件为达到最大迭代次数,或权重变化满足\(\frac{|w_t - w_{t+1}|}{|w_t|} < r\)(r 为比率参数,\(w_t\)和\(w_{t+1}\)分别为第 t 次和第 t+1 次迭代的权重)。
样品制备
OVCAR5 细胞
OVCAR5 细胞在添加了 2 mM L - 谷氨酰胺、10% 胎牛血清(FBS,体积分数)和 1% 青霉素 / 链霉素(P/S,体积分数)的 RPMI 1640 培养基中培养,培养环境为 37°C、含 5% CO₂的 humidified 培养箱。
U87 癌细胞
将 U87 细胞在 35 mm 玻璃底培养皿中接种过夜后,更换为含有 PhDY - 胆固醇(PhDY-Chol)的培养基;细胞在含 20 μM 该类似物的培养基中孵育 48 小时,随后用 10% 中性缓冲福尔马林固定 30 分钟,再用磷酸盐缓冲盐水(PBS)清洗三次。
高丙炔基甘氨酸(HPG)处理的 SJSA-1 癌细胞
SJSA-1 细胞在添加了 10%(体积分数)FBS 和 1%(体积分数)P/S 的 RPMI-1640 培养基中培养。
HPG 处理组细胞在含 2 mM HPG 的甲硫氨酸缺陷型培养基中孵育 24 小时,而 HPG 对照组细胞仅在甲硫氨酸缺陷型培养基中孵育。
所有细胞均在 37°C、含 5% CO₂的 humidified 培养箱中培养,最终用 10% 中性缓冲福尔马林固定 30 分钟,经 PBS 清洗后用于显微镜成像。
白色念珠菌(C. albicans)真菌细胞
白色念珠菌菌株在酵母提取物蛋白胨葡萄糖培养基中培养,于 37°C、250 转 / 分钟的条件下振荡培养过夜。培养完成后,取 500 μL 念珠菌悬浮液离心,收集沉淀并用 PBS 清洗三次以去除残留培养基,随后将清洗后的细胞重悬于 PBS 中。取约 15 μL 念珠菌悬浮液滴加在 0.2 mm 厚的氟化钙(CaF₂)基底表面,覆盖 0.15 mm 厚的盖玻片形成夹层结构 —— 该设置可优化光路,同时减少成像过程中细胞的移动;光热成像通过探测前向散射信号实现。
致谢
感谢郭中岳(Zhongyue Guo)在论文撰写过程中提供的讨论支持。本研究得到美国国立卫生研究院(NIH)资助项目 R35GM136223、R01 EB032391 和 R01 EB035429 的支持(资助对象为程继新(JXC))。
作者贡献
丁广瑞(G.D.)构建了 SPEND 网络,开展高光谱 SRS 实验并分析数据;林浩楠(H.L.)提供 OVCAR-5 细胞数据集;谭玉英(Y.T.)提供 U87 细胞高光谱 SRS 数据集;滕新艳(X.T.)和何宏建(H.H.)制备 HPG 处理的 SJSA-1 细胞;尹家泽(J.Y.)开展 MIP 实验;刘畅(C.L.)协助数据讨论;林浩楠(H.L.)、田雷(L.T.)和程继新(J.C.)负责项目指导;丁广瑞(G.D.)、林浩楠(H.L.)和程继新(J.C.)共同撰写论文;所有作者均审阅了论文。
数据可用性
本研究的数据集和代码已在buchenglab · GitHub公开获取。