社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

准确预测药物-靶点相互作用,江南大学提出深度学习融合GNN新方法MINDG

数据派THU • 7 月前 • 182 次点击  
来源:专知

本文约1700字,建议阅读5分钟

江南大学研究团队提出了一种集成深度学习和图学习的多视图集成学习网络(MINDG)。



药物-靶点相互作用(DTI)预测在药物发现中发挥着重要作用。尽管药物靶点预测的智能计算方法受到了广泛关注,并取得了许多进展,但仍然是一项具有挑战性的任务,需要进一步的研究。
为了解决上述挑战,江南大学研究团队提出了一种集成深度学习和图学习的多视图集成学习网络(MINDG)。
MINDG 结合图学习和深度学习来提取药物和蛋白质的内在结构信息,以及它们之间的外在关系信息。因此,与之前的方法相比,MINDG 提高了模型预测的性能。
相关研究以《MINDG: a drug–target interaction prediction method based on an integrated learning algorithm》为题,于 2024 年 3 月 14 日发布在《Bioinformatics》上。
GitHub 地址:https://github.com/jnuaipr/MINDG
论文链接:https://doi.org/10.1093/bioinformatics/btae147

四种 DTI 预测方法


DTI 预测指预测给定的药物分子是否会与特定靶点结合,从而发挥靶向治疗作用。
目前 DTI 预测方法主要有四类:基于相似性的方法、机器学习方法、深度学习方法和图学习方法。
基于相似性的方法,例如,阿卜杜拉国王科技大学 (KAUST) Thafar 团队提出的 DTi2Vec 方法可以预测药物和蛋白质之间的联系,而无需挖掘药物和蛋白质的额外内部信息。
机器学习方法利用蛋白质结构和序列信息来预测目标。例如,使用化学结构、药物质谱和氨基酸序列来表示蛋白质以预测药物-靶标相互作用。
深度学习方法将特征、模型和生物信息学网络与其他方法相结合,以获得更好的预测结果。
目前,在 DTI 预测的可用方法中,基于图卷积网络(GCN)的方法最有前景。
药物靶标预测的智能计算方法受到了广泛关注并取得了重大进展。然而,这仍然是一项具有挑战性的任务。
主要挑战表现为:(i)大多数基于图神经网络(GNN)的方法只考虑图中一阶相邻节点(药物和靶标)的信息,而没有从高阶相邻节点中学习更深入、更丰富的结构特征。(ii)现有方法没有同时考虑药物和靶标的序列和结构特征,各方法相互独立,无法结合序列和结构特征的优点来提高交互式学习效果。

MINDG 提高了 DIT 预测性能


为了应对这一挑战,该研究提出了一种集成深度学习和图学习的多视图集成学习网络(MINDG)。
图示:MINDG 模型的总体架构。(来源:论文)
该网络由以下部分组成:(i)采用混合深度网络(HDN)提取药物和靶点的序列特征,(ii)提出了高阶图注意卷积网络以更好地提取和捕获结构特征,(iii)使用多视图自适应集成决策模块对上述两种网络的初始预测结果进行改进和补充,提高预测性能。
图示:混合深度网络(HDN)的结构图。(来源:论文)
该研究的贡献主要体现在三个方面:
  • 设计药物和蛋白质靶标图学习的注意力机制,并提出高阶图注意力卷积网络(HOAGCN)。
  • 融合消息传递神经网络 (MPNN) 和卷积神经网络(CNN)方法来增强药物和蛋白质目标序列的结构特征学习;。
  • 提出集成深度学习和图学习的多视图集成学习网络(MINDG)。
图示:高阶图注意力卷积网络(HOAGCN)的结构。(来源:论文)

实验研究


为了验证 MINDG 的有效性,在以下方面进行了实验分析:(i)与当前性能较好的药物-靶点相互作用预测方法的性能比较;(ii) 进行了消融实验;(iii) 进行了预测结果的应用研究。
在两个数据集上(BindingDB 和 DAVIS)评估 MINDG,表明与最先进的基线相比,它提高了 DTI 预测性能。MINDG 结合了图神经网络和深度学习方法的优点,比单独使用任何一种方法都有更好的性能。
接下来,进行了消融分析,研究了多视图学习对预测性能的影响。
从实验结果中可以看出,与 View1、View2 和 MAIDM 相比,MINDG 改进了所有数据集的指标。无论使用哪种单独视图,相应模型的预测能力都弱于基于两种视图协同的预测性能。这也表明多个视图具有互补作用,通过它们的协同作用,可以更充分地利用高阶图注意力网络和混合深度网络学习到的不同视图的深层特征,从而提高整体模型的性能。
最后,利用 MINDG 进行抗病毒药物再利用的探索。使用由清华大学 Gao Yan 等人解析的 SARS-CoV-2 3CL 蛋白酶序列输入模型,预测结合亲和力值排名前 10 的药物。
在 MINDG 生成的候选药列表中药物疗效的实际应用,有助于证明 MINDG 预测结果的信息价值。

不足和改进方向


MINDG 与一些最先进的方法进行了各种比较,结果表明所提出的方法性能更佳。
然而,MINDG 只是以顺序的方式学习药物和蛋白质的内在结构信息,并没有充分利用所有可用的内在结构信息。
未来,图学习方法可能会被用来学习药物和蛋白质的内在结构。此外,由于研究有限,研究人员还没有进行湿实验阶段。计划将来进行进一步的湿实验,包括药物 panel 测试。

编辑:文婧

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/170682
 
182 次点击