文章:Zhang, H., Wang, Y., Lian, B., Wang, Y., Li, X., Wang, T., ... & Hu, J. (2024). Scbean: a python library for single-cell multi-omics data analysis. Bioinformatics, btae053. https://academic.oup.com/bioinformatics/advance-article/doi/10.1093/bioinformatics/btae053/7593744
地址:https://github.com/jhu99/scbean 以及 https://pypi.org/project/scbean/
首先需要明确的是,单细胞数据中存在配对和非配对数据。
- 所谓配对指的是直接相关的数据集,进行比较的细胞来自相同的实验条件、时间点或个体,并且不同数据集中的细胞之间存在直接的关系,比如分析干扰前后细胞的变化。
- 非配对的意思就是比较来自不同条件或组的细胞特征,以识别差异或相似性。
目前针对两种类型,开发了很多方法:
- For unpaired data:Seurat v3 (Stuart et al., 2019), LIGER (Welch et al., 2019), along with its enhanced versions like iNMF (Gao et al., 2021), VIPCCA (Hu et al., 2022a), DAVAE (Hu et al., 2021), scGLUE (Cao and Gao, 2022), uniPort (Cao et al., 2022) and other deep learning-based methods (Zhang et al., 2022).
- Paired: Seurat v4 (Hao et al., 2021), totalVI (Gayoso et al., 2021), and VIMCCA (Wang et al., 2023) ...
本文开发的这个,兼顾了两种类型,并且基于TensorFlow平台进行深度学习模型训练,采用了GPU加速来挑神经网络模型的训练过程,这对于处理数百万细胞的数据集尤为重要。
这个软件为用户提供了4个不同的API接口:VIPCCA, DAVAE, VIMCCA,VISGP。
DAVAE 支持 scRNA-seq、scATAC-seq、空间转录组的分析,VIPCCA支持整合未配对的单细胞多组学数据,VIMCCA支持整合配对的单细胞多组学数据,VISGP支持探索空间转录组数据中不同表达模式的基因。
文末友情宣传
强烈建议你推荐给身边的博士后以及年轻生物学PI,多一点数据认知,让他们的科研上一个台阶: