社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

Science | 使用合成共进化和机器学习改造蛋白质互作界面

王初课题组 • 1 年前 • 198 次点击  
大家好,今天分享一篇发表在Science上的文章,文章标题“Deploying synthetic coevolution and machine learning to engineer protein-protein interactions”,文章的通讯作者是来自斯坦福医学院的K. Christopher Garcia教授,其课题组主要从事蛋白质受体-配体的识别以及蛋白质工程等领域的研究。

在进化生物学中,共进化意指多个物种之间相互影响的进化关系。类推到分子生物学,蛋白质内部或者互作界面中也常发生类似的协同突变,以维持蛋白质的功能。然而,在实验室中通过重组表达开发合成蛋白质共进化系统并非易事。一方面,使用“文库对文库”的混合筛选策略,可能面临难以分离离散共进化对的困难;另一方面,组合文库数量有限,在实验室难以采样整个序列空间。为克服这些困难,本文作者开发了一套高通量筛选平台,用以研究蛋白质互作界面中的共进化;并利用机器学习方法,预测更大序列空间内的复合物结合稳定性。

为模拟蛋白质互作、同时便于实验中文库筛选,作者首先将待研究的两种蛋白连接为一条单链,并将其展示于酵母表面。如此,则能将两个文库之间的组合筛选转化为一个文库内部的组合筛选。随后,在连接处插入3C蛋白酶识别位点,在经历水解切割后,其中一种蛋白通过c-Myc标签仍共价附着在酵母表面;另一种蛋白质则通过蛋白间相互作用,与其连接的HA标签一同停留在酵母表面。最后,根据HA标签结合抗体分离相互作用的蛋白质对,并通过酵母克隆、DNA测序确定蛋白质序列。

作者使用Z结构域及其亲和体ZpA963用于模型验证。结果表明,在经历酶切、抗体分离后,存在互作的蛋白质系统得以保留(HA-tag在一段时间后仍维持在较高比例),而不存在互作的蛋白质系统(界面中六个残基均突变为Ala)则被除去;并且,HA-tag的比例与蛋白质系统的结合常数存在很好的线性关系,进一步证明该方法的有效性。

随后,作者选择Z结构域以及ZSPA-1结构域这一互作系统(结合常数在μM级别),测试能否通过人工的共进化改善蛋白质复合物的结合能力。结果表明,经过几轮的共进化筛选,蛋白质复合物的结合常数可以改善至nM水平。作者也分析了在人工模拟的共进化过程中,蛋白质复合物结构发生了怎样的适应性改变。

最后,为了探索更大序列空间内的蛋白质互作关系,作者结合已有的蛋白质语言模型(PLM)和实验数据,利用迁移学习方法,训练了能够预测蛋白质间结合能力的模型。在11个预测结果中,有6条序列能够被实验证明存在互作。
本文作者:ZF
责任编辑:ZJ
原文链接: 
https://www.science.org/doi/full/10.1126/science.adh1720
文章引用:10.1126/science.adh1720

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/160167
 
198 次点击