
一夜之间,人工智能(AI)在生信领域的应用就像雨后春笋一般!
是短时间内的蹭热度,还是货真价实的新方向?生信塔今天带给大家这篇亮点满满的AI相关研究,由“生信国家队”杰出成员,在生信友好的顶刊中,发表的这篇深度学习研究!先介绍今天的主角--中国科学院北京基因组研究所(国家生物信息中心)高远教授!高远,中国科学院北京基因组研究所(国家生物信息中心)研究员,北京市“杰出青年”科学基金获得者。课题组聚焦生物信息学算法开发及数据资源整合,并通过挖掘组学数据探究生命与健康前沿问题。以通讯或第一作者在Nature Methods、Science Advances、Trends in Genetics、Nature Communications、Advanced Science等国际著名期刊上发表多篇论文(这可是生信人的神仙导师,搞生信的同学,赶紧努力努力靠过来)。 同时,这个期刊也值得一讲,Advanced Science是中科院1区TOP的综合性期刊!尽管发文量几乎翻了5倍,已突破 2000 篇/年!但是影响因子一直稳定在14分上下,这波操作确实强!!难能可贵的是,这个期刊仍然能找到不少生信文章,所以生信小伙伴要有高质量的研究,可以投稿试试。那么,生信塔今天给大家介绍的这篇文章,作者团队构建了深度学习模型CIRI-deep,能够准确的从单细胞/空间组学数据中,预测出差异剪接环形RNA。
本文中用到了数量巨大的高通量测序数据,无一例外,全来自公共数据库(包括来自NCBI数据库的571个全转录组测序数据、TCGA中9种肿瘤的数据、NCBI中的单细胞/空间组学数据等。TOP文章并不都需要自己高成本收样测序,利用公开数据,四两拨千斤,以小博大,这也是生信的核心魅力!!!机器学习、深度学习是当前的风口,与生信数据挖掘也是天然契合的!无论你是做哪个课题方向,AI+生信分析都能显著提高创新性,实现以小博大,0实验发文。小伙伴们如果不会落地,那就不要迟疑,滴滴生信塔,立即获得性价比极高的个性化思路评估和数据分析服务!题目:CIRI-Deep通过深度学习实现环状 RNA 的单细胞和空间转录组分析公众号后台回复“666”,即可获得原文,文献编号:241103
环状RNA(circRNA)是一种特殊转录物,以其独特的表达模式备受关注。尽管单细胞和空间转录组技术发展,但分析其中的circRNA仍受限。作者团队开发了一种深度学习模型CIRI-deep,旨在全面预测circRNA调控,突破现有技术瓶颈。为训练深度学习模型,作者从RNA Atlas和circAtlas数据库中筛选了571个样本的Total RNA-seq数据,排除低质量数据后,选取了覆盖25个器官系统的397个样本。通过CIRIquant分析,鉴定了75281个外显子circRNA,并量化了它们在397个样本中的连接比率。利用DARTS BHT算法,作者对样本间的circRNA连接比率差异进行了显著性分析,识别出约2500万个差异剪接circRNA(DSCs)或未改变的circRNA事件,确保了数据的高置信度。作者综合样本特异的1499个RBP表达,包括与circRNA生成相关的基因和酶。CIRI-deepA模型利用这些特征,针对poly(A)和Total RNA-seq数据训练,预测连接比率变化。该模型适用于多种数据类型,包括单细胞和空间转录组学数据,且预测效率高。 2,CIRI-Deep模型准确预测样品之间的DSC事件在CIRI-deep训练中,抽取样本中99%的数据作为训练集,剩余1%作测试。独立测试集包含100对未见样本。经8轮训练,模型在测试集上AUROC达0.925,优于其他方法。在遗漏数据上AUROC为0.908,86%样本对超0.85。CIRI-deep在高方差样本对中表现优异,适用于不同组织和细胞系。模型还成功泛化至未经训练的病理数据集,AUROC分别为0.81和0.83。
AI在医学研究中应用场景众多!利用机器学习/深度学习已是当前生信领域的重要工具,无论是临床研究还是基础分析,通过AI来创新是性价比最高的思路。AI+生信分析都能显著提高创新性,实现以小博大,0实验发文。小伙伴们如果不会落地,那就不要迟疑,滴滴生信塔,立即获得性价比极高的个性化思路评估和数据分析服务!生信塔公众号持续为大家带来最新生信思路,更多创新性分析思路请点击往期推荐,快来查看吧!想复现这种思路或者定制更多创新性思路欢迎直接call生信塔,我们团队竭诚为您的科研助力!