Py学习  »  机器学习算法

Genome Biology | 中国科学院郝沛研究组合作利用深度学习建立RNA编辑神经网络识别模型

iNature • 1 年前 • 190 次点击  

iNature


2023年4月17日,中国科学院上海巴斯德研究所郝沛研究组和中国科学院分子植物科学卓越创新中心李轩研究组合作在国际学术期刊Genome Biology 发表了题为“DeepEdit: single-molecule detection and phasing of A-to-I RNA editing events using nanopore direct RNA sequencing”的研究论文,该研究利用深度学习神经网络方法,训练构建了转录组RNA的A>I 编辑识别的深度学习算法:DeepEdit。这项成果是国际上第一次对转录组RNA直接测序数据,实现了RNA单分子水平的A>I编辑检测及对编辑事件的相位分析,为转录组直接测序鉴定RNA编辑和研究RNA编辑功能提供了全新的技术方法。

DeepEdit是一种基于神经网络的算法模型,可以在单分子水平上检测和分析RNA编辑事件,并解决转录本上RNA编辑事件的相位问题。它可以识别A>I编辑事件,并且具有高度的准确性和鲁棒性。DeepEdit模型可以应用于酵母和人类等多物种的纳米孔RNA测序数据,有望在RNA研究领域中得到广泛应用,促进我们对影响人类健康的疾病相关发生机制的研究。
A>I 的RNA编辑是动物中最常见的RNA修饰方式,在转录后层面调控RNA的结构和功能。在编辑过程中,腺嘌呤被脱氨酶作用转化为次黄嘌呤。由于次黄嘌呤在翻译过程中被识别为鸟嘌呤,因此A>I的RNA编辑可以导致蛋白质序列的变化。当前,通过二代测序的短读测序分析cDNA(由RNA逆转录获得)的单核苷酸变异是检测RNA的 A>I修饰的主要方法。然而,这种方法存在诸多不足,包括无法确定编辑碱基的相位信息、短读长度导致的假阳性编辑位点以及计算复杂度高、难以解释RNA编辑与其他转录后调控事件(如可变剪接)之间的关系。
图1 A>I 编辑对纳米孔测序读段特征的影响 a 构建具有RNA编辑系统的酵母菌株 b 酵母菌株中编辑位点鉴定 c 编辑事件对Nanopore测序电信号的影响 d 编辑事件导致碱基识别错误 e 碱基识别错误在编辑位点周围位置的分布 f 不同编辑状态的Nanopore测序读段电信号
纳米孔直接RNA测序是一种新型的RNA测序技术,利用纳米孔电导系统记录RNA分子通过纳米孔时的电信号变化,实现RNA的原位测序,无需进行RNA逆转录或PCR扩增。所以该技术被广泛用于RNA修饰的检测,包括m6A等修饰。然而,纳米孔直接RNA测序仍面临一些挑战和缺点,如低信噪比、序列错误率较高、电信号在不同修饰位点上的变化幅度可能不同等。继发表利用Nanopore测序检测RNA m6A修饰的研究论文(doi: 10.1186/s13059-021-02598-3),研究合作团队利用纳米孔直接RNA测序技术,对A>I的RNA编辑,建立深度学习的神经网络RNA编辑识别模型的一项最新成果。
图2 DeepEdit在单个Nanopore测序读段中识别A>I RNA编辑事件 a 数据集的处理、特征提取及模型训练 b 不同特征的模型表现评估 c 模型在人源数据的表现 d DeepEdit对编辑位点的预测 e-f 模型对编辑事件的相位分析
本研究针对RNA最常见A>I的RNA编辑,利用深度学习神经网络方法,建立转录组 A>I编辑的识别定量模型。研究组利用裂殖酵母材料,包括野生型和转化人源ADAR2酶的实验型,通过二代测序筛选高置信度的A>I编辑位点,比较位点上的高丰度A>I事件(实验型)和无修饰(野生型)的信号特征。基于特异性碱基错配模型对样本进行标注,分离提取编辑碱基与之对应的信号特征。使用深度学习神经网络方法进行训练,建立了识别RNA A>I编辑修饰结构的信号识别模型和分析工具(DeepEdit)。研究的主要成果如下:
1. 提出了一种全新的方法,运用长读取和无需PCR的纳米孔直接RNA测序技术,在单个Oxford Nanopore直接RNA测序读取中识别A>I编辑事件,并解决转录本上RNA编辑事件的相位问题。这种技术可以直接检测RNA编辑事件,相较传统方法更为准确且可靠。这一个技术创新,解决了RNA编辑研究分析的关键问题。
2. DeepEdit模型是一种基于神经网络的方法,能够在单分子水平上检测和分析RNA编辑事件,相较其他方法更准确且可靠。DeepEdit模型采用了长读取和无PCR的纳米孔直接RNA测序技术,这种技术可以直接检测RNA编辑事件。DeepEdit模型不仅能识别A>I编辑事件,还能解决转录本上RNA编辑事件的相位问题。
3. 通过将DeepEdit应用于酵母和人类转录组数据来证明其鲁棒性,证明DeepEdit是研究RNA编辑的可靠工具。证明了DeepEdit模型可以在不同物种(包括S. pombe和H. sapiens)的纳米孔RNA测序读取中稳健地检测A>I编辑事件,使研究者能够解决RNA后转录调控方面的新问题。
4. 提供了DeepEdit工具软件包,使其他研究人员可以方便的使用它来研究RNA编辑。DeepEdit具有高通量、高灵敏度和高精度等优点。使它成为非常重要的RNA编辑检测工具,为基因编辑和基因治疗研究提供重要支撑。DeepEdit在Github上开放使用(https://github.com/weir12/DeepEdit )。
中国科学院分子植物科学卓越创新中心陈龙现、荆新云, 中国科学院巴斯德研究所欧亮,西奈山伊坎医学院孔艺萌为本文的共同第一作者。中国科学院巴斯德研究所郝沛研究员和中国科学院分子植物科学卓越创新中心李轩研究员为共同通讯作者。该研究工作获得了国家重点研发计划、国家自然科学基金和中科院先导项目的支持。

论文链接:
https://genomebiology.biomedcentral.com/articles/10.1186/s13059-023-02921-0

END

内容为【iNature】公众号原创,

转载请写明来源于【iNature】

微信加群

iNature汇集了4万名生命科学的研究人员及医生。我们组建了80个综合群(16个PI群及64个博士群),同时更具专业专门组建了相关专业群(植物,免疫,细胞,微生物,基因编辑,神经,化学,物理,心血管,肿瘤等群)。温馨提示:进群请备注一下(格式如学校+专业+姓名,如果是PI/教授,请注明是PI/教授,否则就直接默认为在读博士,谢谢)。可以先加小编微信号(iNature5),或者是长按二维码,添加小编,之后再进相关的群,非诚勿扰。


投稿、合作、转载授权事宜
请联系微信ID:13701829856 或邮箱:iNature2020@163.com

觉得本文好看,请点这里!

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/153853
 
190 次点击