复旦大学药学院王任小教授团队JCIM | 预测蛋白-配体亲合性的深度学习模型PLANET

英文原题：

PLANET: A Multi-objective Graph Neural Network Model for Protein−Ligand Binding Affinity Prediction

通讯作者: 王任小，戚逸飞，复旦大学药学院

作者：Xiangying Zhang, Haotian Gao, Haojie Wang, Zhihang Chen, Zhe Zhang, Xinchong Chen, Yan Li, Yifei Qi*, and Renxiao Wang*

背景介绍

蛋白-配体亲合性是药物设计过程中评估分子优劣的重要性质之一。兼具准确性和计算效率的蛋白-配体亲合性预测模型可以提高药物发现的成功率和效率，一直是计算化学研究领域内的热门研究方向。随着人工智能算法的不断成熟，近年来以深度学习为代表的亲合性预测模型相比于经典的打分函数具有较好的预测准确性，逐渐成为该领域内的热门研究方向。

文章亮点

2023年6月16日，复旦大学药学院王任小教授团队在化学信息学和人工智能研究领域的国际权威学术期刊 Journal of Chemical Information and Modeling（JCIM）上发表了题为“PLANET: A Multi-objective Graph Neural Network Model for Protein−Ligand Binding Affinity Prediction”的研究论文，报道了一种基于图神经网络的深度学习模型 PLANET，以蛋白结合口袋三维结构以及分子二维结构为输入预测蛋白-配体亲合性。得益于其多目标学习的训练方式，PLANET 可以在理解蛋白-配体相互作用的基础上进行预测。此外，PLANET 还具有很好的计算效率，可应用于大规模虚拟筛选。

PLANET 具有多个训练目标，包括预测配体构象、蛋白-配体相互作用和亲合性。其中，PLANET 首先根据输入的结合口袋三维结构和配体二维结构预测蛋白与配体之间的非共价相互作用，并在此基础上预测亲合性。配体构象预测任务是一个辅助任务，帮助 PLANET 从二维配体结构中提取三维相关特征（图1）。作者以 PDBbind 数据库 v.2020为基础构建训练集。由于后续需要利用同样来源于 PDBbind 数据库的 CASF-2016 测试集，作者在构建训练集时移除了与测试集中过于相近的样本，以获得更客观的测试指标。除此之外，作者从通过引入非活性分子扩增训练数据集，以提高模型的泛化能力。

图1 PLANET模型架构。

以 CASF-2016 作为测试集，作者测试了 PLANET 的打分能力、排序能力和对接能力（图2）。结果显示，PLANET 的打分能力和排序能力和其他亲合性预测模型相比处于较为领先的水平。值得注意的是，PLANET 无需蛋白-配体复合物作为输入，而在打分/排序能力测试中，其它模型直接以晶体复合物结构作为输入。因此PLANET的任务难度更大，但是这更符合实际应用中的需求。蛋白-配体复合物结构通常采用分子对接获得，其它模型的实际应用中的表现可能受到分子对接结果的影响较大，而 PLANET 则不受此影响。尽管区分正确/错误的分子结合构象并不是 PLANET 的训练目标之一，但是在对接能力测试中，PLANET 仍能取得不错的成功率，这说明 PLANET 在“理解蛋”白-配体相互作用的基础上预测亲合性。

图2 PLANET在CASF-2016数据集上的打分能力（A）、排序能力（B）和对接能力（C）测试结果。

蛋白-配体亲和性预测模型最广泛的应用场景是虚拟筛选。作者利用 DUD-E 和 LIT-PCBA 数据集对 PLANET 的筛选能力进行测试。尽管 PLANET 的任务形式从训练过程中的回归任务转变为虚拟筛选中的分类任务，但 PLANET 仍在虚拟筛选测试中取得不错的结果，其筛选能力优于其它以 PDBbind 为训练集的机器/深度学习模型，与常用的经典打分函数 Glide SP 预测精度相当（图3）。不过 PLANET 具有很高的计算效率，仅需不到 Glide SP 耗时的1%即可完成相同的筛选任务。这得益于 PLANET 的蛋白-配体相互作用预测模块，无需经过分子对接过程中耗时的构象采样过程。PLANET 的计算效率使其有潜力在大规模虚拟筛选中进行应用。

图3 PLANET和Glide SP在LIT-PCBA数据集上虚拟筛选测试结果。

扫描二维码阅读英文原文

J. Chem. Inf. Model. 2023

Publication Date: June 15, 2023

https://doi.org/10.1021/acs.jcim.3c00253

IF 2022: 5.6

Citaions 2022: 31,925

The Journal of Chemical Information and Modeling publishes papers reporting new methodology and/or important applications in the fields of chemical informatics and molecular modeling.Astute chemists, computer scientists, and information specialists look to this monthly’s insightful research studies, programming innovations, and software reviews to keep current with advances in this integral, multidisciplinary field.

主编：Kenneth M. Merz Jr.（Michigan State University）
副主编

点击“阅读原文”

你“在看”我吗？