基于轻量级深度神经网络的核磁共振波谱降噪
2025-02-20詹昊霖房启元刘佳伟史晓琦陈心语黄玉清陈忠
关键词:核磁共振波谱;人工智能;深度学习;谱图去噪;轻量级网络
1 引言
核磁共振(NMR)波谱被认为是探测分子结构和提供定量信息的强有力的非侵入性检测技术之一,因此在生命科学、化学、生物学等领域的应用日益广泛1–7。然而,由于固有的布居数分布,与其他表征方法8,9 (如:质谱、红外光谱和拉曼光谱)相比,NMR波谱天然表现出较低的灵敏度。特别是,与质子(1H) NMR相比,这一困境对于异核NMR实验中那些具有低旋磁比和天然丰度的检测核更为严重,因此限制了其更广泛的应用。
为解决这个问题,几十年来已经做出了多种努力以抑制噪声和提高信号强度。一种直接和常见的方法是增加实验扫描次数和累加采样信号,但这导致较长的采集时间,尤其是对于二维(2D)或多维(mD)实验。另一种常规方法是使用配备超高场磁体10,11和低温检测系统12的更先进仪器,但这需要昂贵的成本和较高的研究门槛。此外,多种先进的脉冲序列技术,例如,极化转移增强不灵敏核(INEPT) 13、核Overhauser增强(NOE) 14等,也已经被提出来实现NMR灵敏度增强,特别是在探测不灵敏分子或原子核时。另外,旨在增强NMR信噪比(SNR)的超极化技术15,16,如动态核极化(DNP) 17–20、自旋交换光泵浦(SEOP) 21,22、仲氢诱导超极化(PHIP) 23,24和自发极化转移(SEBRE) 25等,已经引起了NMR研究人员的广泛关注。然而,无论是脉冲序列设计还是超极化技术都需要复杂的实验设置和熟练的实验操作人员。
数据后处理是减少噪声和提高信噪比的一种简单且经济有效的替代方案。近来,包括压缩感知26、低秩Hankel 27以及统计学习28等经典算法在液体NMR波谱去噪方面表现出良好的性能。此外,主成分分析(PCA)方法也通过提取主成分和谱图分离信号与噪声,应用于固态NMR实验的噪声降低29,30。然而,这些传统算法的性能通常依赖于所使用的处理参数,这些参数通常需要针对不同的谱图重新优化,限制了进一步的应用。相比之下,基于深度神经网络的深度学习(DL) 31在NMR领域引起了越来越多的关注,如RF脉冲设计32、代谢分析33、NMR采样加速34–36、虚拟同核去耦37、Laplace变换38。最近,两种DL算法39,40已被应用于脑代谢物的磁共振谱图去噪。需要注意的是,这两种方法的训练过程都需要足够的实际实验数据,然而,由于NMR样品和仪器时间的限制,很难获取大量的真实实验NMR数据,导致两者仅关注脑代谢物分析,而无法用于不同化学样品的各种NMR波谱去噪。此外,DN-Unet 41 (一种改进于原始用于图像分割的U-Net 42的网络)使用模拟数据而非真实数据作为训练数据集来实现液体NMR波谱的信噪比增强。
在此,本研究使用一种轻量级深度神经网络(称为LD-Net,轻量级去噪网络)实现高质量、可靠且非常快速的NMR波谱去噪。这种DL方案基于物理驱动的合成NMR数据学习和端到端特征学习,直接在频域实现噪声和期望信号的分离。因此,它能够准确识别和快速恢复几乎淹没在严重噪声中的实际微弱信号,并能有效抑制噪声和虚假峰,以及提供显著的信噪比改善。此外,训练好的网络模型适用于1D和高维NMR光谱,可用于各种样品的波谱去噪。其性能已在仿真和实验NMR谱图上得到充分评估。
2 方法和实验
轻量级深度神经网络LD-Net的主要架构如图1所示。LD-Net经过训练,学习从含噪NMR谱图到目标无噪声对应谱图的特征映射,并直接在频域分离噪声和期望的干净信号。受之前关于音频源分离43和语音增强44文献的启发,该深度神经网络基于U-Net架构的1D卷积改编而开发,由下采样和上采样模块组成,构成编码-解码结构,以利用不同层次的特征。更有意义的是,这里用线性抽取和插值替代了之前基于U-Net工作中用于特征下采样和上采样的跨步转置卷积,以提供更好的伪影抑制性能。此外,大卷积核尺寸被选择来处理这项任务,因为对于稀疏的NMR谱图,小的卷积核尺寸可能导致大多数输入到卷积层的信息几乎不包含有用信息。在下采样和上采样模块中使用非对称而不是对称的卷积核,且下采样模块使用比上采样模块更大的卷积核尺寸,以抑制输出窗口边界处可能出现的伪影。此外,在下采样和上下采样模块中逐层通道数增加24。LD-Net的详细信息在补充信息中给出,训练和验证损失曲线如图S1所示。
本研究展示了仅使用由指数函数叠加生成的合成仿真数据成功训练深度神经网络(数据合成的详细参数总结在补充材料的表S1中),从而绕过了对大量实际实验数据的需求,领先于大多数传统DL方法。大量的包含含噪波谱X和相应的目标无噪声标签L的合成数据对,例如第k个数据对(Xk,Lk) (其中k是从1到训练数据集数量K的整数变量),被输入神经网络以学习最优网络参数组θ,通过最小化模型输出Yk (即Yk = F(Xk, θ))与相应无噪声标签Lk之间的归一化均方误差(NMSE)。由无噪声指数函数叠加生成的无噪声标签L通过监督学习作为理想参考。标签质量对网络性能有重要影响,在实际应用中,通常需要根据神经网络的目的设计标签L。此外,引入了M-to-S策略,采用具有不同噪声水平的多个含噪NMR谱图对应同一个无噪声标签,即(Xk1, Xk2, ..., X km, Yk),其中上标m是对应相同标签的含噪输入数量,以增强网络性能。当神经网络模型训练良好后,对于给定的含噪谱图X,可以通过Y = F(X, θ)实现目标去噪模型输出Y,然后用于随机化学样品的NMR波谱去噪。它也适用于通过逐行重建的高维NMR,表明了良好的泛化性。此外,由于在频域直接进行谱图去噪,训练好的1D模型几乎不需要训练和测试数据集之间的采样点数和谱宽匹配。
3 结果与讨论
为了说明轻量级神经网络在NMR波谱去噪方面的潜力,我们在模拟和实验NMR谱图上验证了其性能。如图S2所示,在具有不同信噪比水平的模拟测试集上的去噪结果表明了LD-Net的良好性能。在一个具有挑战性的案例中,即使微弱峰(在图S2c中用黑色箭头标记)完全淹没在严重噪声中,LD-Net仍能准确识别并快速恢复它(见图S2c中的第3行),并实现有效的噪声减少和信噪比增强。图2展示了实验获得的胆固醇1D异核NMR上的噪声降低结果,其谱图参数如表S2所示。由于13C的低天然丰度(约1.1%)和低旋磁比(与1H相比为1/4),通过少量扫描采集和累加的1D 13C谱图(图2a)表现出低信噪比性能,其中期望的峰和令人困扰的噪声相互干扰,且出现假阳性峰(用黑色箭头标记)。在这种情况下,与参考谱图(图2b)相比,LDNet方法(图2c,d)能够提取所有有用信号,并识别和消除所有假阳性峰,从而促进波谱分析和信息提取。伴随着有效的噪声抑制,超过两个数量级的信噪比增强被实现,尽管单纯的信噪比增强数值的意义并不大。相比之下,在DN-Unet去噪谱图中仍然存在虚假峰(在图2e中用蓝色箭头标记)。
此外,与DN-Unet相比,LD-Net所需的计算时间加快了5–7倍。对于另一个临床药物阿奇霉素的样品(图S3),这种加速达到了10倍以上。这种优势在2D甚至mD NMR波谱去噪的情况下将进一步扩大和凸显。更有意义的是,如表1所总结的,LDNet具有更短的模型训练时间、更小的模型大小、更少的参数,优于DN-Unet。特别是,具有较少下采样和上采样层(即L = 3)的LD-Net的模型大小约比DN-Unet小700倍,突出了其轻量级优势并促进了在便携设备上的潜在应用。类似地,LD-Net在不含和含有额外噪声的阿奇霉素1D 13C NMR上表现出令人满意的去噪效果(图S3和S4)。此外,通过计算相对于参考光谱的均方根偏差(RMSDs)来评估定量能力,RMSDs的范围约为0.01–0.02,表明了良好的定量性能,详细数值总结在表S3中。因此,轻量级神经网络LD-Net是NMR波谱去噪的一种有用工具。
另一个展示其适用性和强大性的例子是在一个具有挑战性的含有奎宁和薄荷醇两种成分的混合物上进行的,这两种成分的浓度存在很大差异。尽管在原始谱图中低浓度组分的强度接近噪声水平(图3a),LD-Net (图3c,d)提供了一个优秀的去噪谱图,几乎恢复了所有有用的NMR信号,且没有引入虚假峰。相比之下,DN-Unet (图3e)中几个用红色箭头标记的信号几乎被忽略,并且在得到的谱图中遗憾地出现了用蓝色箭头标记的伪影。需要注意的是,用黑色箭头标记的峰既没有被LDNet也没有被DN-Unet恢复,因为这个峰的强度可能低于仪器的检测限并且完全淹没在严重的噪声中。此外,应该注意到在这种情况下,包括LD-Net和DN-Unet在内的深度学习方法对恢复不同强度的信号表现出不同的效果,因此导致弱峰强度的重建不够理想。这种现象可能源于在网络训练过程中,较弱强度的谱峰对最小化网络输出Y和相应标签L之间的差异的贡献较小,后续研究通过调整不同强度谱峰对网络损失的贡献可能解决这个问题。如图4和图5所示,LD-Net在2D乃至mD NMR波谱去噪方面展示了高潜力。如图4c和图S5所示,通过使用与1D NMR去噪相同的提出的1D模型进行逐行去噪,LD-Net仍能保留所有峰值并在2DNMR上实现令人满意的谱图去噪。此外,在图4b,e中,随着噪声的抑制,用黑色箭头标记的负峰也被消除。与DN-Unet (图4d)相比,3层(图S5)和12层(图4c) LD-Net在2D NMR去噪方面分别实现了21倍和9倍的时间节省。图5进一步讨论了在具有更复杂谱图和不同噪声水平的样品上进行2D NMR去噪的性能,以之前文献45中报道的0.25 mmol∙L–1蛋白质样品为例。在存在不同水平噪声的情况下,LDNet(图5)在区分噪声和期望信号、消除假阳性和假阴性峰以及提供干净谱图方面保持鲁棒。更有意义的是,可以看到即使在存在大量噪声的情况下,LD-Net (图5i)成功恢复了在2D谱图和1D轨迹中几乎淹没在严重噪声中的微弱峰。
传统数据后处理和深度学习方案构成了波谱去噪的两个主流方式。表1总结了几种典型DL方法和一种常规算法之间的性能定量比较。与最近提出用于NMR和MRI去噪的非DL去噪算法CoSeM 26(具有无需网络预训练和良好泛化性的优势)相比,DL方案几乎不需要耗时且主观的参数优化,并且受益于非迭代低复杂度神经网络映射而能实现快速去噪重建。虽然DN-Unet 41通常提供更大的信噪比增强,但受限于更长的模型训练时间、更大的模型大小和更多的模型参数。此外,经典U-Net 42在模型所需训练时间方面具有一定优势,但遗憾的是有较高的引入伪影的可能性。此外,与最近两种专注于脑代谢物MRS去噪的DL方法39,40相比,LDNet摆脱了对大量实际实验数据的需求,并在各种化学样品上保持稳健,从而促进了DL在NMR领域的应用,例如在1D和mD纯化学位移NMR 47–49上的潜在去噪。此外,所提出的LD-Net模型在不同采样点数和被测谱图的谱宽上提供了良好的兼容性,无需网络重新训练,表明了良好的泛化性。总之,LD-Net在NMR波谱去噪方面表现出一定的优势。
如前述示例所示,LD-Net方案使用端到端映射,在谱图去噪和信噪比改善方面表现出良好性能,同时能够有效恢复淹没在噪声中的期望弱峰并很好地抑制虚假峰。当前LD-Net的局限性仍需要强调:首先,与所有基于DL的方案一样,模型训练是不可避免的,且训练数据集在一定程度上影响着最终模型的性能(图S6)。然而,由于具有良好的泛化性,LD-Net模型可以预先使用充分考虑多种可能性的训练数据集进行训练,然后适用于一般化学样品和NMR实验。其次,极低的信噪比仍然限制其性能。当原始NMR信号低于仪器检测限时,DL方案可能无法处理。第三,大多数DL算法普遍缺乏足够的可解释性,不可避免地降低了其鲁棒性。因此,我们也在积极探索可解释的DL算法。
4 结论
总之,我们展示了使用轻量级深度神经网络进行NMR波谱降噪的概念验证示范。LD-Net基于物理驱动的合成NMR波谱学习,实现了直接且良好的去噪,且适用于各种化学样品和NMR实验。实验结果表明,LD-Net能够有效抑制噪声和虚假信号,恢复期望的弱峰,并提供显著的信噪比改善。此外,由于具有更短的模型训练时间、更小的模型大小、更少的网络参数以及更快的计算效率等优势,LD-Net优于现有的基于DNN的去噪方法。因此,本研究为NMR去噪提供了一种有效的DL方法,并作为人工智能赋能化学研究的一个有前景的范例,从而促进了深度学习方案在化学领域的广泛应用。