Py学习  »  机器学习算法

Nature子刊|将药化知识结合机器学习用于自动化分子构建、评分与自由能计算的开源流程

智药邦 • 1 年前 • 471 次点击  

近日,Nature计算化学子刊发表了题为"An open-source molecular builder and free energy preparation workflow"的文章,作者开发了一个高效的开源分子构建器和自由能计算的自动化工作流程。

可以将药物化学专业知识整合到FEgrow设计工作流程中,以及用于pose预测、评分和自由能计算的最先进方法。通过从已知hit的受限母核构建配体,最大限度地利用结构生物学的输入,并减少对对接算法的依赖。

FEgrow代码: https://github.com/cole-group/FEgrow

用于预测同系列配体与蛋白质靶标的结合自由能的自动自由能计算越来越欢迎,但为配体构建可靠的初始结合pose具有挑战性。

作者介绍了开源FEgrow工作流程,用于在蛋白质结合口袋中构建用户定义的同属系列配体,以输入自由能计算。

对于给定的配体母核和受体结构,FEgrow枚举并优化生长的官能团的生物活性构象,尽可能利用混合机器学习/分子力学势能函数。

低能结构可选地使用gnina卷积网络评分函数进行评分,并输出用于更严格的蛋白质-配体结合自由能预测。

作者通过为来自标准的高质量蛋白质-配体复合物数据集与靶标结合的10个同系配体构建和评分结合pose来说明工作流程的使用。

高通量虚拟筛选广泛用于hit化合物发现,但依赖于预定义的化合物库。从头设计软件包括旨在使用生长算法在靶点结合口袋中构建配体模型。

从已知先导化合物的scaffold开始或完全从头开始。这种方法可能是有益的,因为他们不依赖于(物理或虚拟)库,并且可以针对手头的问题专门定制分子。

从头设计软件的进展已被广泛使用。包括基于规则的生成方法,例如OpenGrowth、AutoGrow和LigBuider,以及最近使用的深度生成方法。

药物发现工作可能已经确定了具有明确结合模式的热门化合物,并希望探索一个小型合成可访问类似物库之间的结构-活性关系。

在这种情况下,在生成设计化合物的pose时利用有关结合模式的先验只是将是有益的。

例如,E-novo流程,添加的化学官能团(R-group)的可用构象用刚性母核枚举,并使用CHARMM的对接方法进行评分,然后使用基于物理的分子力学广义波恩表面积(MM-GBSA)来提供更准确的分数。

最近的例子包括FragExplorer9,它旨在生长活替换片段以优化GRID软件生成的分子相互作用场。

DeepFrag,它使用在数千种已知蛋白-配体复合物上训练的深度卷积神经网络预测适当的片段添加,以及DEVELOP,它使用深度生成模型输出3D分子,条件是提供的结合位点的phamacophor特征。

然而,为设计评分所使用的近似物理或基于知识的方法将在一定程度上限制它们预测和优化结合亲和力的能力。

值得注意的成功计算机辅助设计工作已将自由能计算与从头设计工具结合使用来构建(并可能评分)新分子。Jorgensen多年来一直率先采用这种方法,将通过生化和有机模型构建器(BOMB)软件的从头设计与通过MCPRO软件的自由能扰动(FEP)联系起来。

BOMB通过将用户定义的R基团连接到现有母核,将配体构建到结合口袋中。功能可用于构想搜索、结构优化和评分,使用通过超过300个实验活动数据点的线性回归训练的自定义评分函数。一旦建立了hit并进行了评分,就可以通过自由能计算进一步完善hit到lead的优化。

在其他药物发现计划中,作为最近COVID Moonshot开放科学努力的一部分,旨在众包设计的SARS-CoV-2主要蛋白酶抑制剂,OpenEye的Omega工具包用于受限构象生成,然后是最佳结合姿势使用perses软件进行自由能计算。输入结构对自由能计算的可靠性的显著重要性意味着自动化这一步骤的开源工具至关重要。

受到BOMB/MCPRO分子设计方法的启发,作者介绍了FEgrow开源工作流,用于增长功能组,由用户从核心化合物的定义位置选择。考虑到分子设计的多目标性质,作者输出了简单的5项原则指标,即口服利用度,以及不良子结构和合成可及性估计的标志。

工作流程设计

(左)用户指定受体、配体母核核官能团列表,以及它们的结合位点。(中)Rdkit用于连接选定的R group并枚举具有刚性母核的可用构象异构体。(右)可能的生物活性构象异构体使用ML/MM势能函数进行结构优化。使用卷积网络评分函数预测结合亲和力并评估分子特性。输出最终结构用于进一步基于自由能的结合亲和力评估。

对于设计的配体,作者列举了添加的R group的3D构象异构体,如果需要,可以在蛋白质的上下文中选择额外的灵活性(丢弃具有空间冲突的构象异构体)。

生成对接姿势的一个常见问题是用于改进它们分子力场的不确定性,特别是对于不常见的化学物质。为了克服这个问题,作者采用混合机器学习/分子力学(ML/MM)方法进行优化,其中配体(可选地)由ANI神经网络电势描述,静态蛋白质的非键合相互作用由传统力场描述。使用基于深度学习的评分函数预测低能量姿势的结合亲和力。FEgrow以适合输入自由能计算的形式输出结合pose。

通过这种方式,希望将药物化学专业知识整合到FEgrow设计工作流程中,以及用于pose预测、评分和自由能计算的最先进方法。通过从已知hit的受限母核构建配体,最大限度地利用结构生物学的输入,并减少对对接算法的依赖。

参考文献

[1] An open-source molecular builder and free energy preparation workflow

--------- End ---------



感兴趣的读者,可以添加小邦微信(zhiyaobang2020)加入读者实名讨论微信群。添加时请主动注明-企业-职位/岗位 

姓名-学校-职务/研究方向




- 历史文章推荐 -


AI药物设计

●Drug Discov Today | 机器学习预测小分子pKa的进展和挑战

●BMC Bioinform | 拓扑增强的分子图表示用于抗乳腺癌药物的筛选

●Drug Discov Today | 分子表示与性质预测中的深度学习方法

●Front Pharmacol|DDIT:药物-疾病之间多种临床表型关联预测工具

●Bioinformatics | 通过修正异质信息中不完整信息的影响来预测药物-蛋白相互作用

●国内首个可交互式计算的VR药物设计软件发布

●Front Pharmacol|基于图片段分子表示和深度进化学习的多目标药物设计

●Drug Discov Today | 利用系统的蛋白质-配体相互作用指纹图谱进行药物发现

●Int J Mol Sci|CSatDTA:带自注意力机制的卷积模型预测药物-靶标亲和力

J Med Chem|静电互补在基于结构的药物设计中的应用

●Nat Mach Intel|一种用于分子相互作用和分子性质预测的自动图学习方法

●JCIM|基于图注意机制的有机化合物合成可及性预测

●Wires Comput Mol Sci|分子发现的生成模型:最新进展和挑战

JCIM|利用深度学习进行基于结构的从头药物设计

Drug Discov Today|辉瑞:如何成功的设计小分子药物

诺华:技术时代的药物设计艺术

CAS博客|首批进入临床试验的AI设计的候选药物:结构新颖性评估

JMC|用于从头药物设计的生成模型

●用机器学习预测药物在靶点上的停留时间

●Drug Discov Today|人工智能增强的药物设计和开发:迈向计算型精准医学

●Drug Discov Today|用于从头药物设计的图神经网络GNN

●Nat Commun|AI结合基因表达特征,从头生成类苗头化合物

●BioRxiv|基于表型和化学结构预测化合物活性

●Drug Discov Today综述|分子从头设计和生成模型

●Nat Comput Sci综述|生物分子建模在技术时代蓬勃发展


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/149125
 
471 次点击