单细胞测序和空间转录组学是前沿的生命科学技术,有助于推动基因组学科技创新,提高我国在生命科学领域的科研水平和竞争力。基于人工智能的空间转录组学数据分析有利于探究组织的生理状态和疾病机制、识别细胞转录因子和基因调控网络、揭示细胞亚型的异质性和多样性、发现潜在的治疗靶点,为研究疾病诊断、预防和治疗提供重要的基础数据和科学依据。
2023年4月20日,重庆大学附属三峡医院印明柱团队在Briefings in Bioinformatics(IF=14)在线发表题为“Graph deep learning enabled spatial domains identification for spatial transcriptomics”的空间转录组学方法学文章,提出了一种基于图神经网络和贝叶斯高斯混合模型的自适应空间域识别策略,该策略涵盖双层架构,上层充分利用细胞基因表达谱和空间位置信息生成特征矩阵低维表征,下层进行细胞亚群个数的自适应识别。实验表明,该方法在多个基准空间转录组数据集上相较于主流的聚类方法取得了显著提升。本研究以描绘组织功能异质性和细胞相互作用为动机,构建了一种基于图深度学习(GDL)的SCGDL空间聚类方法。采用深度图信息最大化(Deep graph infomax)模块嵌入残差门控图卷积神经网络(Residual gated graph convolutional neural network)来处理空间转录组学数据中的基因表达谱和空间位置。应用贝叶斯高斯混合模型(BGMM)识别低维表征,生成空间坐标位置下的细胞亚群。该研究利用先进的图深度学习方法来应对空间转录组数据中的基因表达谱和空间位置信息,能够充分发挥数据的优势,同时通过设定贝叶斯高斯混合模型参数,能够实现自动识别细胞亚群的数量,完成自适应空间聚类任务。上述双层结构有别于现有的基于图深度学习的空间聚类技术,设计多种比较实验来评估SCGDL与五种基准方法在三个空间转录数据集上的效果。首先,使用人类DLPFC数据评估上层结构的优势。在相同的下层设定后,SCGDL在大多数样本中获得了最佳表现。随后,在人类乳腺癌数据上用Leiden和Louvain替换BGMM来评估下层的效果。提出的SCGDL具有最佳的聚类性能,比DeepST、STAGATE和其他基于GDL的空间聚类方法表现更好。最后,使用Slide-seqV2测序的小鼠嗅球数据证明了SCGDL自适应识别细胞亚群簇数的能力。由于Slide-seqV2具有接近单细胞的分辨率,因此SCGDL被证明能够处理多种分辨率的空间转录组数据集。在本研究中,图神经网络利用Pytorch_pyG工具箱实现,贝叶斯高斯混合模型利用scikit-learn工具包实现。本文中使用的代码和数据集概述可在https://github.com/narutoten520/SCGDL上找到。作者介绍
通信作者
印明柱,重庆大学附属三峡医院特聘教授、博士生导师,医学病理中心、临床研究中心及肿瘤早期诊治中心主任,临床转化研究中心主任;2020年兼职受聘美国耶鲁大学医学院病理系助理教授(2020年-至今);2021年湖南省杰出青年基金获得者;2022年入选工信部“领军人才”。曾先后在美国国立卫生研究院抗衰老研究所(NIH/NIA)遗传系和美国耶鲁大学医学院病理科做博士后及副研究员;回国后曾就职中南大学湘雅医院特聘教授、博士生导师、皮肤科副主任。现在研1.1类原创新药5项,其中2项获批临床试验(临床试验2期阶段),1项正在IND申报中。现负责研究的项目获国家1.1类新药临床批件2项;参与获省部科技进步二等奖1项,主持科技部重点研发子课题及国自然面上基金项;申请国家发明专利及软著20余项,已授权5项;发表SCI论文80余篇,其中以第一及通讯作者发表SCI论文40余篇;研究成果发表在Nature, Science Translational Medicine, JCI, J Hepatol, Circulation Research, Nature Communication 等杂志;获国家重点研发计划子课题1项及主持国家自然科学基金面上项目2项。主要学术兼职:中国食品药品企业质量安全促进会-细胞医药分会副会长、旅美科技协会总会副会长及重庆市联络人;Tumor Discovery杂志创刊主编。该团队全年招收临床及科研PI、全职博士后,有感兴趣的同学欢迎咨询:yinmingzhu2008@126.com第一作者
刘腾,博士,重庆大学附属三峡医院副研究员、硕士生导师专注人工智能算法的基础理论与应用基础研究。研究方向包括基于人工智能的单细胞测序和空间转录组学数据研究,复杂疾病数据库与计算分析平台构建,无人驾驶/智能网联汽车决策与规划,新能源汽车动力学建模及能量管理策略。基于相关研究成果,发表学术论文70余篇,其中以第一/通讯作者身份在Briefings Bioinf., Nucleic Acids Res., IEEE/ASME T Mech., IEEE Trans. Ind. Electron., IEEE Trans Industr Inform,Appl. Energy, Energy, Renew. Sust. Energ. Rev. 等一区TOP期刊上发表SCI论文50余篇,会议论文17篇。目前Google Scholar总引用次数4700余次, H-index 34, 他引超过4000次,ESI高被引论文6篇。参与编写和翻译专著5部,授权专利2项,获软件著作权5项。近5 年作为技术负责人、科研骨干,主持和参与了重点实验室开放基金、国家自然科学基金、国防基础科研重点项目、美国能源基金会项目、国家863计划、中国-瑞士国际合作项目等十余项课题的研究。微信加群
iNature汇集了4万名生命科学的研究人员及医生。我们组建了80个综合群(16个PI群及64个博士群),同时更具专业专门组建了相关专业群(植物,免疫,细胞,微生物,基因编辑,神经,化学,物理,心血管,肿瘤等群)。温馨提示:进群请备注一下(格式如学校+专业+姓名,如果是PI/教授,请注明是PI/教授,否则就直接默认为在读博士,谢谢)。可以先加小编微信号(iNature5),或者是长按二维码,添加小编,之后再进相关的群,非诚勿扰。
投稿、合作、转载授权事宜
请联系微信ID:13701829856 或邮箱:iNature2020@163.com
觉得本文好看,请点这里!