社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

Nature | 深度学习驱动的蛋白-配体表面靶向策略

DrugAI • 2 月前 • 106 次点击  

DRUGAI

蛋白质之间的分子识别事件驱动着生物系统中的生命过程。然而,近年来研究发现,蛋白-蛋白相互作用受小分子调控的机制也在不断被揭示。尽管该领域取得了一定进展,但用于设计新型化学诱导的蛋白相互作用的计算工具仍然面临挑战。本研究中,研究人员提出了一种计算策略,旨在设计可靶向新表面(即由蛋白-配体复合物形成的表面)的蛋白质。该策略采用基于分子表面表示学习的几何深度学习方法,并在实验中验证了三种药物结合的蛋白复合物的结合蛋白。实验结果表明,所有结合蛋白均表现出高亲和力和精准特异性,并通过突变分析和结构表征进行了验证。值得注意的是,最初仅在蛋白质上训练的表面指纹可推广应用于由小分子诱导的新表面,这一发现展示了深度学习方法中罕见的高泛化能力。预计,这类设计的化学诱导蛋白相互作用将有助于拓展分子传感功能,并在合成生物学中推动新型药物可控细胞治疗策略的开发。

蛋白-蛋白相互作用(PPIs)在维持细胞稳态中发挥关键作用,同时也涉及多种疾病。因此,近年来开发了多种靶向PPIs的疗法,并提出了计算工具用于设计新型蛋白相互作用。然而,由于几何和化学互补性、动态特性及溶剂效应等因素的复杂交互,使得预测和设计新的PPIs仍具挑战性,尤其是在缺乏进化约束的情况下。此外,天然PPIs受别构调控、翻译后修饰或直接配体结合等因素影响。其中,化合物结合形成的"新表面"(neosurfaces)是一类特殊的分子识别实例,即使蛋白结合位点的微小变化也可能显著影响亲和力。随着分子胶等新型药物模式的发展,这类相互作用在靶向蛋白降解等领域展现出广阔的应用前景。


合成生物学中,基于小分子诱导的新表面已被用于构建精确时空可控的化学响应系统。小分子触发因子不仅可用于诱导或破坏PPIs,还可作为“开关”调控细胞功能,因其易于给药、细胞渗透性强、亲和力高等优势,在转录调控、蛋白降解、蛋白定位等多个领域得到应用。尽管已有多种可化学破坏的异源二聚体(OFF-switch)系统,但由于新表面建模的复杂性,计算设计的化学诱导二聚化(CID, ON-switch)系统仍面临挑战。现有方法主要依赖实验手段,或基于已知异源二聚体界面移植药物结合位点,或通过蛋白对接和界面优化实现,但这些方法可能存在自发二聚化风险、缺乏适合的支架蛋白,或需大量体外优化。


本研究基于几何深度学习框架MaSIF(分子表面相互作用指纹)提出了一种新策略,探索其在无额外训练数据的情况下,能否泛化到小分子配体。通过识别蛋白-小分子复合物形成的新表面,研究人员设计了特定位点结合蛋白,成功构建了全新的配体依赖性蛋白相互作用。尽管现有工具在预测和设计配体-蛋白相互作用方面表现良好,但在全新三元复合物的设计上仍存在局限。研究人员成功设计并表征了三种药物诱导的蛋白结合物,包括靶向Bcl2-venetoclax、DB3-progesterone和PDF1-actinonin复合物,并验证了其在体外及细胞环境中的适用性。该方法的提出不仅拓展了合成生物学中的工具箱,也为新型可调控治疗策略的开发提供了新的思路。


MaSIF 识别的新表面特征

几何深度学习框架 MaSIF 中,研究人员此前开发了两个应用:(1) MaSIF-site,用于精准预测蛋白表面具有高界面形成潜力的区域;(2) MaSIF-search,用于基于互补表面片段快速搜索并对接蛋白互作伙伴。在 MaSIF-search 中,我们提取表面片段的指纹特征,使得几何和化学特性互补的片段具有相似的指纹,而非互作片段则具有较低的指纹相似度。通过计算欧几里得距离进行超快速初步搜索,随后对低距离片段进行三维对齐,并利用**界面后对齐评分(IPA score)**进一步筛选优化。


最初,MaSIF 仅考虑蛋白表面的标准氨基酸,不支持小分子、糖类或其他配体。因此,研究人员提出MaSIF-neosurf,将小分子纳入目标蛋白的分子表面表示,以预测基于新表面指纹(neosurface fingerprints)的界面和互作伙伴。MaSIF 最初是基于生物分子表面的一般化学和几何特性进行训练,并不依赖底层结构,因此不仅适用于蛋白表面,也应当能够识别由非蛋白表面形成的特征。在生成蛋白-配体复合物的分子表面后,MaSIF-neosurf 计算两种几何特征:形状指数和距离依赖曲率,以及三种化学特征:泊松-玻尔兹曼静电势、氢键供受体倾向性和疏水性,其中后两者经过优化以更精准地刻画小分子的化学特性。


为了评估 MaSIF-neosurf 的能力,研究人员在多个由蛋白和配体界面组成的三元复合物上进行了基准测试。研究人员筛选了 14 种小分子诱导的蛋白复合物,并将每个复合物拆分为两个子单元,共得到 28 组测试案例,分别处理包含和不包含小分子的情况。无配体的蛋白表面与 8,879 种 PPI 相关蛋白组成了数据库,并通过所有 28 组蛋白-配体复合物的表面片段进行查询。由于每个蛋白候选分解为平均近 4,000 个表面片段,该数据库包含超过 3,500 万个潜在结合位点。研究人员评估了 MaSIF-neosurf 是否能检索到正确的结合伙伴,并在正确的刚体取向下完成对接。


当蛋白-配体复合物作为对接伙伴时,MaSIF-neosurf 成功识别并复现了超过 70%(20 组)正确的结合伙伴及其结合构象,而最新的 RoseTTAFold All-Atom 仅恢复了14%(4 组)。此外,仅在少数测试案例中,去除配体仍能成功识别结合伙伴,通常在这些情况下,蛋白表面本身对相互作用的贡献较大。通过计算指纹特征的距离评分(即互补性增强)和 IPA 评分,研究人员发现小分子配体的加入显著提升了界面匹配度,进一步验证了 MaSIF-neosurf 对新表面特征的识别能力。此外,尽管几何和化学特征均对 MaSIF 的性能至关重要,但在去除单个特征输入时,整体效果影响较小,可能由于特征间存在一定程度的冗余。总体而言,MaSIF-neosurf 成功捕捉了小分子介导的蛋白相互作用中的关键因素。


为了进一步验证其能力,研究人员尝试全新设计此类相互作用,并探索其在蛋白工程和药物研发中的潜在应用。


设计新型配体诱导的蛋白-蛋白相互作用

近期,研究人员提出了 MaSIF-seed 流程,用于 全新位点特异性蛋白结合物的设计。在该方法在多种治疗靶点上展现出优异性能的基础上,研究人员进一步探索其是否能泛化应用于由配体和蛋白原子组成的新表面(neosurfaces)。这一研究不仅解决了化学可控蛋白相互作用的设计挑战,也加深了对新表面介导的分子识别机制的理解。为此,研究人员对 MaSIF-seed 进行了改进,使其适配MaSIF-neosurf 框架(图 2a)。


计算蛋白-配体复合物的新表面后,研究人员首先使用 MaSIF-site 识别界面中最可能埋藏的区域。接着,利用大规模指纹搜索,在包含约 64 万个结构片段(4.02 亿个表面片段/指纹特征)的数据库中,筛选具有高互补性的结构基序(binding seeds)。这种方法可快速缩小搜索空间,仅保留最具潜力的候选结合基序。随后,研究人员使用 Rosetta 对顶级候选种子进行序列优化,并将其移植至适合的受体蛋白(scaffold)以稳定结合基序。最后,研究人员进一步优化序列,以增强界面原子接触,提高结合稳定性。


基于此流程,研究人员成功设计了靶向不同家族的配体结合蛋白的配体依赖性蛋白结合物,包括:

  • Bcl2–venetoclax(靶向 Bcl2 的临床获批药物)

  • DB3–progesterone(抗孕激素抗体 DB3 及其配体)

  • PDF1–actinonin(绿脓杆菌 PDF1 蛋白及抗生素 actinonin)

研究人员首先利用 MaSIF-neosurf 评估这些新表面在界面形成中的作用,并依据配体暴露的溶剂可及表面积选择 1-3 个关键界面片段(图 2b)。随后,研究人员在种子数据库中搜索互补指纹,筛选出排名前列的种子(每个目标约 100-120 个),并将其移植至多个受体蛋白上。最终,研究人员结合计算筛选生成约 2,000 种设计方案(图 2c),涵盖多种α螺旋、β折叠结合基序,并探索了广泛的序列与拓扑结构空间。所有入选设计均在配体存在情况下,表现出增强的界面结构指标(如预测结合能、埋藏表面积及原子接触数量),验证了其对新表面的有效结合能力(图 2c)。

讨论

大多数基于深度学习的蛋白设计流程主要依赖天然氨基酸序列,因此在涉及小分子的相互作用设计上缺乏泛化能力。这一局限主要源于蛋白-配体结构数据的稀缺,特别是三元复合物在现有蛋白数据库(PDB)中的数量极少。基于分子表面物理和化学特征的几何深度学习方法能够突破这些限制,为蛋白-小分子复合物提供联合表示。由此形成的新表面(neosurfaces)能够捕捉通用的分子特征,从而实现针对这些杂合界面的蛋白结合物设计。


本研究中,研究人员利用 MaSIF-neosurf 框架成功设计了靶向 Bcl2–venetoclax、DB3–progesterone 和 PDF1–actinonin 复合物的特异性结合蛋白。这些结合物在纯计算生成的情况下,即展现出高稳定性、高特异性及接近天然亲和力的结合能力。实验优化后,其亲和力达到了纳摩尔级,并通过突变分析和结构表征确认了其结合模式,验证了设计流程的准确性。此外,研究人员的管线能够精准识别小分子在蛋白相互作用中的关键作用,即便其贡献仅占埋藏溶剂可及表面积的 10–12%,这一敏感性为高灵敏度的化学诱导二聚体(CID) 设计提供了新的可能性。


为评估所设计 CID 系统 的功能性,研究人员在复杂细胞环境中测试了其效率和特异性。结果显示,这些系统在细胞质和膜结合回路中均展现出稳定的 ON-switch 行为,表明其在哺乳动物系统中的广泛适用性,包括逻辑门、合成生物回路或代谢物检测生物传感器。此外,研究人员选择的配体,包括FDA 批准的抗白血病药物 venetoclax、具有潜在抗癌作用的天然产物 actinonin 和内源性激素 progesterone,可用于结合 CAR-T 细胞治疗以降低脱靶毒性。未来,通过合成小分子激活剂,可进一步精确调控其活性,提高安全性。


尽管蛋白-配体特异性相互作用的设计仍具挑战性,本研究奠定了进一步创新的基础。相比于抗体筛选等实验方法,深度学习工具可精确控制结合位点、蛋白形状、折叠方式、大小及热稳定性,提供更丰富的设计模式。然而,仍然存在若干挑战。例如,现有深度学习结构预测方法(如 RoseTTAFold)未能准确预测研究人员的复合物,而 AlphaFold3 虽然在蛋白-配体复合物预测中表现良好,但其适用范围有限,制约了药物与蛋白设计领域的进一步突破。基于表面指纹的策略可能成为靶向新表面的有效替代方案。


尽管本研究取得了一系列进展,研究人员仍在 BRD4–JQ1 复合物 上遭遇失败,可能由于配体柔性较高,导致设计的结合物在计算评估指标上表现不佳。此外,大多数深度学习方法(包括本研究)在 疏水界面 上表现优异,但在极性界面的建模仍面临显著挑战。


总体而言,研究人员预计 基于表面的分子表示 方法将在低数据环境下为分子设计问题提供解决方案,如非天然氨基酸蛋白设计。此外,从蛋白-配体复合物中提取高表达力的指纹特征,为 创新药物模式 的合理设计提供了可能性,包括按需细胞治疗、可控生物制剂 及分子胶 等,推动药物开发的前沿突破。

整理 | WJM 

参考资料

Marchand, A., Buckley, S., Schneuing, A. et al. Targeting protein–ligand neosurfaces with a generalizable deep learning tool. Nature (2025). 

https://doi.org/10.1038/s41586-024-08435-4

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/178731
 
106 次点击