社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

绝佳搭档!孟德尔随机化+机器学习,再加点简单实验,中科院二区SCI轻松到手!创新思路值得借鉴!

生信图书馆 • 3 月前 • 106 次点击  

7月30日奥运会乒乓球混双大家都看了吗?中国队组合王楚钦/孙颖莎以4∶2战胜朝鲜队组合李正植/金琴英,夺得巴黎奥运会乒乓球混双项目金牌,简直太令人激动了!金牌组合在奥运会中打得如此出彩,就连翻阅文献的小编都抑制不住兴奋的情绪,这不就想给大家分享篇如王楚钦和孙颖莎这般绝佳搭档组合的生信文献!要论当下热门的生信方法是啥,那孟德尔随机化(MR)和机器学习应该位列前茅,如果这俩组合在一起也不可不称之为绝佳搭档!接下来,大帆分享一篇相关文献,该研究利用MR、3种机器学习算法及经典生信方法来确定共病的潜在生物标志物,最后对关键基因进行了简单qPCR实验验证,凭借创新方法即刻拿下中科院二区SCI!思路简单易复现,也太让人心动了!

PS:如果你也想利用“孟德尔随机化”和“机器学习”两大创新方法,0实验或简单实验拿下高分SCI ,那就来找大帆设计思路、定制分析吧~


题目:使用孟德尔随机化和转录组学分析研究 BMI>30急性胰腺炎患者的潜在生物标志物

杂志:Lipids in Health and Disease

发表时间:2024年4月
研究背景

急性胰腺炎(AP)是由多种因素引起的显著的炎症反应。有研究显示,与BMI正常的人相比,BMI为23或更高的人患严重AP的风险显著增加。目前,关于BMI和AP之间因果关系的研究有限,并且很少有研究确定高 BMI状态和AP的共同诊断生物标志物。

数据来源

数据集/队列

数据库

数据类型

详细信息

GSE151839

GEO

RNA-seq数据

包含10 名肥胖(BMI 35-50)和10 名非肥胖(BMI 18.5-26.9)个体的皮肤和脂肪组织样本

GSE44000

GEO

RNA-seq数据

包含7名肥胖(BMI>30)和7名非肥胖(BMI<25)个体皮下脂肪组织        

GSE194331

GEO

RNA-seq数据

包含32 名健康个体和 87 名诊断为 AP 的个体的全血样本

GSE109227

GEO

微阵列

包括6例实验性急性胰腺炎小鼠和4例对照小鼠

GSE166047

GEO

RNA-seq数据

包含5名健康正常体重女性、5名肥胖女性、5例肥胖男性的皮下脂肪组织样本

另外,脂质代谢相关基因(LMRGs)来自NCBI数据库,BMI数据来自IEU数据库,AP 数据是从 IEU 数据库。

研究思路

首先,通过MR分析确定BMI与AP风险的因果关系。其次,通过差异表达基因(DEG)分析、加权基因共表达网络分析(WGCNA)识别与AP和BMI升高相关的关键模块化基因,并进行功能富集分析揭示疾病的发病机制。接着,通过机器学习算法识别关键基因,并进行共定位分析。最后,使用外部数据集对基因表达趋势进行了初步验证,并通过小鼠模型证实这些基因的诊断潜力。    

研究结果
1. MR分析
通过MR分析显示,遗传变异的ukb-a-248、ukb-b-2303、ukb-b-19953与ukb-b-19388呈显著因果关系,表明BMI与AP风险呈正相关(图1);通过敏感性分析证实了结果的可靠性。    

图1 BMI对AP的因果效应

2. 关键基因的确定及验证
通过DEG分析WGCNA等确定了698个肥胖相关 DEG(ORDEGs)、4828 个AP相关DEG(APRDEGs),通过Venn分析筛选出21个常见DEGs(CDEGs),这些CDEGs是基于脂质代谢的BMI>30患者AP的潜在标记基因;通过基因本体论(GO)分析表明,交叉基因可能与神经炎症反应的调节、T-helper 2细胞分化的调节和炎症反应的调节有关;通过京都基因和基因组百科全书(KEGG)分析表明,这些基因可能主要与胞质DNA感应通路和细胞因子-细胞因子受体相互作用有关(图2)。    

图2 交叉基因的富集分析

通过LASSO回归、RF算法、SVM-RFE算法从21 个CDEGs中鉴定出 5 个基因(ACSS2、MBOAT2、LRIG1、IL18、HADH)作为 AP 的潜在生物标志物,4个基因(MMP9、ABCA3、HADH、ESR1)被鉴定为BMI>30的潜在生物标志物;初步确定 HADH 是BMI>30 AP患者中最关键的生物标志物(图3)。    

图3 使用机器学习方法选择潜在的诊断生物标志物

通过外部数据集验证HADH的表达水平,结果显示,HADH在AP组与正常组、BMI >30与BMI<30组中的表达差异显著;通过qPCR实验显示,与对照组相比,高BMI的AP队列HADH表达显著下降。以上结果表明,HADH 是诊断BMI>30 AP患者的前瞻性生物标志物。

文章小结

该研究利用 MR、生物信息学方法和3种机器学习算法来确定 HADH 作为 BMI >30 AP患者的潜在生物标志物,这些发现可以使临床医生根据AP患者BMI的不同遗传特征定制治疗策略,为开发专门针对 HADH 的药物铺平了道路。这篇文章创新性比较高,主要是方法新颖,将孟德尔随机化机器学习算法都应用了进来,而且最后还加了数据集验证和qPCR实验验证,总体的分析是简单的,最后发文中科院二区SCI,结果可喜可贺!你是否也对这个发文思路感兴趣,想复现的朋友,快来找大帆定制分析吧~

往期推荐






1.两大水刊,双双升一区!发文量上万!且CAR指数低!敢投不敢?


2.机器学习+单细胞,思路简单易复现!湖南省人民医院二区SCI:干湿思路好上分!


3.双样本孟德尔随机化!四川省医学科学院:双向MR+中介MR,简单分析巧夺二区SCI!


声明:「原创」仅代表原创编译,仅供学术交流,如侵则删。   

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/172881
 
106 次点击