英文原题:Deep Learning Methodology for Obtaining Ultraclean Pure Shift Proton Nuclear Magnetic Resonance Spectra
通讯作者:林雁勤,厦门大学
作者:杨铮显,郑霄栩,郜鑫晶,曾庆,杨创,罗杰,詹超群,林雁勤
高质量核磁共振纯化学位移波谱可以简化核磁共振波谱信息,降低谱图解析的难度。本文提出了名为AC-ResNet的神经网络和名为SM-CDMANE的损失函数,并将其用于训练网络模型来后处理实时ZS纯化学位移谱,以获取无噪声、无伪影、高分辨率的纯化学位移谱,推动核磁共振的多样化应用。
核磁共振波谱技术是一项强大的分析技术。其中,核磁共振氢谱是最常见的核磁共振波谱。谱图分辨率和谱图灵敏度是核磁共振氢谱的重要指标。由于J偶合效应,常规单脉冲氢谱的谱峰存在裂分现象,导致其谱图分辨率较低。纯化学位移技术能够去除J偶合信息、保留化学位移信息,使裂分的谱峰变为单线态,从而大幅度提高谱图分辨率。实时ZS (Zangger-Sterk)方法能够快速获取纯化学位移谱,但其谱图质量较低,存在灵敏度损失和伪影干扰,阻碍谱峰信号的检测。因此,快速获取高质量纯化学位移谱具有重要意义。
团队以可通过实验快速获取的实时ZS纯化学位移谱为处理对象:
(1)提出了适用于处理实时ZS谱的神经网络AC-ResNet和损失函数SM-CDMANE,并模拟了实时ZS谱图以训练网络模型;
(2)使用网络模型处理实验采集的实时ZS谱,得到高质量纯化学位移谱,并测试了网络模型在减小谱峰线宽、抑制谱图噪声、识别谱峰信号、去除伪影等方面的能力。
在本项工作中,使用核磁共振信号表达式模拟了实时ZS谱作为输入数据集、理想纯化学位移谱作为输出数据集,以训练网络模型。为了缓解深层网络过拟合问题,本文提出了神经网络AC-ResNet (图1)。该网络通过组合利用特征图相加和通道连接操作,将浅层特征传递到更深层,避免了深层网络错误识别谱峰信号的问题。
图1. AC-ResNet的网络结构。红色箭头表示特征图相加(Addition),将网络的输入层(Input)和之前所有多残块(Multi-residual block)的输出层相加。BN表示批量归一化层(Batch normalization)。蓝色箭头表示通道连接(Concatenation),将网络的输入层和之前所有特征图相加后的BN层通道连接在一起。通道连接的结果是下一个多残差块的输入。
为了提高网络对实时ZS谱中弱信号的学习能力,本文改进了不连续可导的损失函数MANE,提出了损失函数CDMANE (公式1)。为了进一步地提高网络对峰信号的学习能力,本文在CDMANE的基础上增加了单独计算峰区域损失值的损失项,得到损失函数SM-CDMANE (公式2)。该损失函数通过增加弱信号和峰信号的损失,有效改善了网络模型难以识别弱峰信号、错误识别伪影和噪声的情况。
实验实时ZS数据测试表明(图2),网络模型具有很强的识别谱峰的能力,且其处理谱非常干净,没有噪声和伪影的干扰。即使有噪声信号高于谱峰信号(图2b放大区域),网络模型仍可通过谱峰的线宽和峰型等特征将谱峰识别出来,而不会将噪声信号错误识别为峰信号。
图2. 浓度为 0.015 M、溶剂为二甲基亚砜-d6的奎宁样品的NMR谱。(a) 扫描16次的常规单脉冲1H NMR谱。(b) 扫描4次的实时ZS谱。(c) 扫描1024次的实时ZS谱。(d) 网络模型对扫描4次的实时ZS谱的处理结果。蓝色和橙色箭头分别指示有代表性的峰和伪影。
综上所述,本文针对可实验快速获取的实时ZS纯化学位移谱,设计AC-ResNet网络结构和SM-CDMANE损失函数,并以模拟数据训练网络模型,将其用以处理实时ZS谱,得到高质量核磁共振纯化学位移谱。该研究可以推动纯化学位移谱的应用,所提出的AC-ResNet网络结构和SM-CDMANE损失函数可以为网络模型设计提供参考。
J. Phys. Chem. Lett. 2023, 14, 14, 3397–3402
Publication Date: March 31, 2023
https://doi.org/10.1021/acs.jpclett.3c00455
Copyright © 2023 American Chemical Society