社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

程俊&汤富杰团队建立基于深度学习的核磁化学位移预测的统一基准和框架学院:建立基于深度学习的核磁化学位移预测的统一基准和框架

科研任我行 • 3 周前 • 31 次点击  
近日,化学化工学院、萨本栋微米纳米科学技术研究院、人工智能研究院、嘉庚创新实验室AI4EC Lab、北京科学智能研究院与深势科技联合研发的NMRNet深度学习框架在核磁共振(NMR)光谱解析领域取得重要进展,相关成果以“Toward a unified benchmark and framework for deep learning-based prediction of nuclear magnetic resonance chemical shifts”为题发表于Nature Computational Science。该框架通过新颖的SE(3) Transformer架构,成功实现了对液态和固态NMR化学位移的高精度预测,为分子结构解析和材料设计提供了强有力的工具。

随着深度学习技术的不断发展,研究人员开始尝试将其应用于NMR化学位移的预测,以提升模型的准确性和效率。深度学习方法,尤其是图卷积网络(GCN)和等变消息传递神经网络(MPNN),在液态NMR预测中已显示出比传统方法更高的精度,并能够较好地处理分子结构的复杂性。然而,这些液态NMR模型通常忽略了分子间的相互作用,尤其是溶剂-溶质相互作用,尽管已经有些研究尝试将分子动力学模拟和计算结合进来以弥补这一不足。在固态NMR中,模型通常需要考虑晶体的周期性边界条件(PBC)。一些基于密度泛函理论(DFT)计算的机器学习模型已在固态NMR预测中取得了一定的进展,显示出较高的效率和精度。然而,目前现有的模型多针对液态或固态NMR进行单一状态的预测,往往未对其通用性进行充分验证,仍存在局限性。

NMRNet框架示意图
左侧:数据准备模块,提供结构和NMR数据;右侧上方:预训练模块,利用结构信息进行自监督学习;右侧中部:微调模块,进行有监督的NMR化学位移预测;右侧下方:推理模块,将模型应用于多种实际任务。
化学化工学院、嘉庚创新实验室AI4EC Lab、北京科学智能研究院与深势科技联合研发了NMRNet框架,如图所示。通过预训练和微调范式,结合对分子表示学习框架Uni-Mol中SE(3) Transformer架构的适应性调整,成功实现了对液态、固态和气态系统的统一建模。该研究在数据准备阶段收集了结构数据和核磁数据,提取3D结构信息并将其转化为模型输入。研究团队进一步通过对实验数据的广泛清理和验证,构建了一个标准化的基准数据集nmrshiftdb2-2024,为推动NMR化学位移预测的研究提供了宝贵的资源。在预训练阶段,对于液体核磁部分,研究团队沿用了Uni-Mol之前的预训练权重。而对于固体核磁部分,研究团队又利用超过480万个晶体结构数据进行自监督学习,从而获得高效的原子环境表示,有效缓解了标注数据稀缺的问题。在微调阶段,NMRNet通过利用不同状态的数据进行核磁预测任务的训练,并且能够支持单元素预测和多元素同时预测。在多个基准数据集中,NMRNet的预测结果在多个评价指标上均取得优异表现,充分验证了模型的高精度和可靠性。此外,NMRNet不仅提供数值预测,还可应用于NMR谱峰归属和构象确定等关键任务,为结构-光谱关系的深入解析提供了新途径。
该项研究成果的第一作者为我院硕士生徐凡杰,通讯作者为程俊教授和汤富杰副教授、深势科技算法研究员高志锋。合作者包括嘉庚创新实验室副研究员王锋,以及深势科技算法研究员么琳和汪鸿帅。该研究受到田中群院士和鄂维南院士的指导,并得到北京科学智能研究院院长张林峰的支持。此外,任英赫和张佳慧完成了论文封面设计,唐煜航和邱江鹏对示意图提出改进意见,刘云霈、邹竞祥、庄永斌、金昱丞、付飞、罗伟梁、周耕墨和王俊杰对相关工作进行深入讨论,徐伟鸿等提供应用开发支持。研究工作得到国家重点研发计划(2024YFA1210804)、国家自然科学基金(22225302、92470201、22021001、92461312、21991151、21991150、92161113、22411560277)、中央高校基本业务费(20720220009)、人工智能应用电化学实验室(AI4EC)、IKKEM(RD2023100101、RD2022070501)的支持。

论文链接:

https://doi.org/10.1038/s43588-025-00783-z

代码链接:

https://github.com/Colin-Jay/NMRNet

数据集链接:

https://zenodo.org/records/13317524

APP链接:

https://ai4ec.ac.cn/apps/nmrnet

https://bohrium.dp.tech/apps/nmrnet001

Notebook链接:

https://bohrium.dp.tech/notebooks/38356712597


【注】:小编水平有限,若有误,请联系修改;若侵权,请联系删除!

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/180559
 
31 次点击