
啊啊啊啊啊啊好开心啊!机器学习纯生信又发7分+了!要说谁是生信领域的顶流,还得是机器学习啊baby们~强大的数据处理和分析能力、高效的数据挖掘能力是机器学习立于高地的一大优势,尤其是与单细胞或是其他多组学的联合分析,更是频频出现在各大期刊和国自然基金中。那么,这篇7分+的纯生信文章到底有什么亮点值得我们学习参考,生信塔这就来带baby们一起看看:
1. 在研究思路方面,该研究对糖尿病足溃疡(DFU)的普通转录组和单细胞公共数据集进行生信挖掘,利用机器学习算法获取了DFU相关的关键基因,鉴定了关键细胞,并基于关键细胞构建了关键基因高精度和稳定性的预测模型,探究了DFU发生发展的深入分子机制,是比较完整且具有一定创新性的纯生信研究思路,具有一定的复现意义。
2. 在临床价值方面,该研究分析了DFU患者的单细胞数据,揭示了疾病发展过程中的关键细胞类型、关键基因、免疫浸润模式以及信号通路内的重要调节机制,有助于更好地了解疾病进展,为DFU新型靶向性预后手段的建立提供了一定的参考。
PS:常规生信思路往往需要收样测序,费时费力,公共数据库则能解决这一困境。但0实验是否会难发高分,这也是很多人的困惑。当然不会啦,生信塔相信好的研究思路一定会脱颖而出的,这篇文章就很好地结合了机器学习和单细胞。有研究思路存在困惑想要复现的小伙伴们,欢迎大家后台戳生信塔哦~
题目:基于生物信息学分析和机器学习的 SDC4 蛋白作用和相关关键基因在糖尿病足溃疡不愈合中的作用
杂志:Int J Biol Macromol.
影响因子:7.7
发表时间:2024年11月
研究思路
首先,基于GEO数据库中DFU的相关数据集进行单细胞数据分析,并进行细胞注释,获取关键细胞。其次,基于DFU公共数据集,通过机器学习筛选DFU的关键基因,并进行通路富集分析、免疫浸润分析和转录因子调控网络构建。随后,对关键基因在关键细胞中的表达水平进行分析,并探究关键基因表达水平与细胞因子和耗竭因子的相关性。最后,分别进行单细胞中关键基因与HIF1A、PDGFBd 和VEGFA共表达分析。
主要结果
1. DFU单细胞公共数据集数据分析
作者对DFU的单细胞公共数据集GSE165816进行数据质控,通过UMAP进行聚类,并进行细胞注释,最终注释为10个细胞类别:平滑肌细胞、成纤维细胞、内皮细胞、基底细胞、M1巨噬细胞、自然杀伤T (NKT) 细胞、浆细胞、循环细胞、淋巴管内皮细胞和肥大细胞(图1-2)。



图1 DFU单细胞数据质控

图2 细胞注释
2. DFU关键基因的鉴定
作者以DFU的公共数据集GSE134431作为训练集进行差异表达分析,以 GSE143735作为验证集进行表达水平验证,并结合机器学习算法LASSO的筛选,获取了DFU的关键基因(图3)。


图3 OPSIV相关基因和GABA相关基因的关联分析
3. 关键细胞中关键基因的表达水平分析
作者分析了关键细胞和不同细胞亚群中关键基因的表达水平,结果表明,五个关键基因之间存在很强的相关性(图4)。



图4 关键细胞和不同细胞亚群中关键基因的表达水平分析
4. 关键基因表达与细胞因子和耗竭因子的相关性分析
作者对关键基因的表达水平与细胞因子、耗竭因子展开相关性分析,结果具有一定的统计学意义(
图5)。


图5 关键基因表达与细胞因子、耗竭因子的相关性分析
6. 关键基因与HIF1A、PDGFB和VEGFA的共表达分析
作者分析了关键基因与HIF1A、PDGFB和VEGFA的共表达情况(图6)。



图6 关键基因与HIF1A、PDGFB和VEGFA的共表达分析
文章小结
该研究通过转录组学公共数据库挖掘、机器学习和单细胞测序数据集分析鉴定了DFU的关键基因和关键细胞,为DFU发生发展的分子机制研究提供了新的理解。结合机器学习和单细胞共同探究疾病发生发展的分子机制,为精准医疗提供了一定的理论基础!有小伙伴想要以其他疾病复现的,用同样的思路就可以展开。当然!生信塔这里还有大量高分生信文章思路解读哦,有兴趣的小伙伴们欢迎来找生信塔~
生信塔公众号持续为大家带来最新生信思路,更多创新性分析思路请点击往期推荐,快来查看吧!想复现这种思路或者定制更多创新性思路欢迎直接call生信塔,我们团队竭诚为您的科研助力!