社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

Nat. Mach. Intell. | 深度学习预测糖肽串联质谱谱图

王初课题组 • 8 月前 • 102 次点击  
大家好,今天给大家分享一篇Nature Machine Intelligence上的文章Deep learning prediction of glycopeptide tandem mass spectra powers glycoproteomics,本文通讯作者是来自复旦大学的乔亮教授。其研究方向包括蛋白质组学、生物信息学、微生物质谱分析、微流控质谱联用技术等。
翻译后修饰能极大增加蛋白质组的复杂度,其中糖基化是影响50%哺乳类动物蛋白的重要翻译后修饰,在多种生理及病理过程中起到了重要的作用。蛋白质糖基化中糖分子通常连接到天冬酰胺(N-糖基化)或丝氨酸/苏氨酸(O-糖基化)的侧链。糖链的合成没有模板,因此其非常多样,对其组成及连接方式进行表征具有极大的挑战。作者在本文中发展了DeepGP的方法,使用深度学习的方法预测N-糖肽的二级谱图与保留时间,帮助更好地在质谱上识别糖肽。
DeepGP接受糖肽为输入,并编码其多个特征,例如糖结构,氨基酸序列,PTM类型,PTM位置及母离子电荷等。糖结构由GNN进行编码,在其中糖链会转化为单糖为节点、单糖间的键为边的图,这可以很好捕捉到糖的组成及拓扑结构。糖肽的表征经过transformer以预测出二级谱图及保留时间,另外会有额外的GNN模块预测糖碎片离子的强度。DeepGP也考虑了多种中性丢失的碎片离子,其强度也会被预测。
作者将HCD碎裂的糖肽数据用pGlyco3进行分析,得到的结果用于训练模型。经过优化后,预测出的二级谱图与实验值有非常高的相似度,特别是糖碎裂产生的B/Y离子的强度也与实验值有很高的相似度,对保留时间的预测也有很好的准确性,对于很相似的糖链也有好的区分效果。作者将DeepGP预测的结果能进一步地优化糖肽搜库的结果。
本文作者:JGG
责任编辑:ZF
文章链接:
https://www.nature.com/articles/s42256-024-00875-x.pdf
文章引用:10.1038/s42256-024-00875-x

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/173591
 
102 次点击