社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Git

Github代码文献复现之卵巢和子宫内膜癌(六)|| 单细胞第一次注释

生信技能树 • 1 月前 • 61 次点击  

我们的新专辑《Github带有全套代码分享的文献复现2025》开启后受到大家的热烈喜爱,里面学习的文章为:《A multi-omic single-cell landscape of human gynecologic malignancies》,前面的学习笔记如下:

前面运行完后得到一个所有样本合并在一起的并去了批次的seurat对象:sce.all_int.qs,后面我又做了一个没有进行harmony的分析。

如果需要这个sce.all_int.qs,可以加我的微信发给你:Biotree123

继续来学习wiki上的代码:https://github.com/RegnerM2015/scENDO_scOVAR_2020/wiki,今天进行细胞类型注释。

文献的注释结果

作者文献中的单细胞部分的细胞注释结果如下:总共有75523个细胞。

malignant clusters 鉴定策略:

  • 使用的 the U.S. Food and Drug Administration (FDA)-approved biomarkers MUC16/CA125 and WFDC2/HE4 to identify EC and OC cancer clusters
  • Expression of KIT/CD117 was used to identify GIST cancer clusters
  • 结合inferCNV:nferred copy number variation (CNV) was used to help identify OC and GIST but not EC, as the disease rarely exhibits CNV

文章的附图:

第一次尝试注释

作者的注释策略也比较复杂,我们先来看看使用常规的细胞已知marker尝试进行第一次注释。图中的细胞类型名称有:

  • Ovarian cancer:WFDC2/HE4
  • GIST:KIT/CD117
  • Endometrial cancer:MUC16/CA125
  • NK/T cell:CD3D,CD3E,CD3G,CD2,KLRD1,KLRF1,NKG7
  • Mast cell: TPSAB1,TPSB2
  • Macrophage: CD163,CD68
  • B cell: CD19,MS4A1,CD79A,IGHG1
  • Smooth muscle: ACTA2,MYH11
  • Endothelial: RAMP2, PECAM1
  • Fibroblast: DCN, LUM,COL1A2
  • Cell Cycle: TOP2A, MKI67
  • Immu: PTPRC

先来看看没有进行harmony的注释结果。本次尝试使用res0.5的结果进行绘图,画一张markers气泡图:

rm(list=ls())
library(Seurat)
library(ggplot2)
library(SCP) # https://zhanghao-njmu.github.io/SCP/index.html
# https://scillus.netlify.app/vignettes/plotting
library(Scillus) # https://mp.weixin.qq.com/s/Z69GmXORqKczTsMQ68D4Vw
# https://samuel-marsh.github.io/scCustomize/
library(scCustomize)
library(qs)

###### step4:  看标记基因库 ######
# 原则上分辨率是需要自己肉眼判断,取决于个人经验
sce.all.int "2-harmony/sce.all_int-no.qs")
sce.all.int
table(Idents(sce.all.int))
table(sce.all.int$seurat_clusters)
table(sce.all.int$RNA_snn_res.0.1) 
table(sce.all.int$RNA_snn_res.0.3) 
table(sce.all.int$RNA_snn_res.0.5) 
table(sce.all.int$RNA_snn_res.0.8) 


getwd()
dir.create('3-check-by-0.5')
select_idet "RNA_snn_res.0.5"
sce.all.int$RNA_snn_res.0.5
#sce.all.int$RNA_snn_res.0.3
sce.all.int
table(sce.all.int@active.ident) 
head(sce.all.int@meta.data)

# markers 
cell_types
"Ovarian cancer" = c("WFDC2""HE4"),
"GIST" = c("KIT""CD117"),
"Endometrial cancer" = c("MUC16""CA125"),
"NK/T cell" = c("CD3D""CD3E""CD3G""CD2""KLRD1""KLRF1""NKG7"),
"Mast cell" = c("TPSAB1""TPSB2"),
"Macrophage" = c("CD163""CD68"),
"B cell" = c("CD19""MS4A1""CD79A""IGHG1"),
"Smooth muscle" = c("ACTA2""MYH11"),
"Endothelial" = c("RAMP2""PECAM1"),
"Fibroblast" = c("DCN""LUM""COL1A2"),
"Cell Cycle" = c("TOP2A""MKI67"),
"Immu" = c("PTPRC")
)
p 'RNA',group.by = select_idet,cols = c("grey""red") ) + 
  ggtitle(select_idet) + 
  xlab("") + 
  theme(axis.text.x = element_text(angle = 45, hjust = 1))  # 更改x轴标签角度
p[["theme"]][["strip.text"]]$angle 
p
ggsave(filename = "3-check-by-0.5/Markers_dotplot-use.pdf", plot=p, width=13, height = 8,bg="white")

结合没有进行harmony的uamp图:

p "umap", group.by = select_idet, label = T) + 
  ggtitle(select_idet)
p
ggsave(plot=p, filename="3-check-by-0.5/Dimplot_resolution_0.5.pdf",width = 6, height = 6)


# 美化版
p "UMAP", label = T,label.size = 4, label_insitu = T,
                 label_point_size = 1, label_point_color =NA ,label_segment_color = NA)
p
ggsave(plot=p, filename="3-check-by-0.5/Dimplot_resolution_0.5-1.pdf",width = 7, height = 7)

不同样本上色的umap:

p "umap",label=T,group.by = "orig.ident"
p
ggsave(filename='2-harmony/umap-by-orig.ident-before-harmony.png',plot = p, width = 6,height = 5.5)

尝试第一次注释:

cluster2:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSM5276942,为单独一个样本,GIST类型,表达 KIT,注释为 GIST

cluster7:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSM5276939,为单独一个样本,Endometrioid类型,表达上皮marker,以及WFDC2,注释为 Ovarian cancer

其余问号这里现在还没有确定,我需要再找一些信息辅助进来,cluster25感觉更像是双细胞,还有mast那一群很奇怪,它跟NK/T挤在了一起没有分开,而Fibroblast 则是分散成了很多群。

0NK/T cell10Ovarian cancer20Fibroblast
1
Macrophage
11
21
Smooth muscle
2
GIST
12
22
mast?
3
13
Fibroblast
23
B cell
4
Endothelial
14
Fibroblast
24
Cycling cell
5
15
25
Macrophage?双细胞?
6
Fibroblast
16


7
Ovarian cancer
17
Fibroblast


8
Fibroblast
18


9
Ovarian cancer
19
Endothelial


(未完待续~)

文末友情宣传

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/180074
 
61 次点击