类型:超精简版
选文: 大壮
编辑: 小黄
最近听到一首歌,很应景啊,每到年关感慨良多。
歌词:
一句先苦后甜,我熬了一年又一年
曾经一腔热血的少年,如今变得沉默寡言........
人过30后,感觉时间就很快,青春真的短暂,只有加倍努力。其实以前也超努力,上学时玩一天都有负罪感,要么去图书馆,要么去打工,要么去实验室,也常睡实验室,不敢浪费一点时间。第一份工作有很多不会,就规定学到12点回去。总是觉得自己笨,就要多学一会,多做一点。绝对是合格小牛马。但总为什么感觉混的不好呢!
可能是方向不对。
也可能是命不好。
最近一直思考这个问题,命运是玄学很难左右,能做的是保持乐观,当原地踏步时候调整一下方向。
不扯淡了,言归正传。
临床数据是一个大问题,
如何构建高效临床数据库?
如何构建高效的AI研究平台?
不少医院成立大数据中心、AI中心,研究如何高效通过大数据助理临床科研,赋能诊断。
大壮搞AI8个年头了,世界五百强都干了三家了。有一些心得和体会。后面讲讲点这一块的东西,毕竟论文太枯燥,大家不感兴趣。
不感兴趣也要讲的,毕竟这个号的使命就是宣传和介绍AI与医学科研,不能忘记初心。
Nguyen, Phong B H et al. “Interpretable multimodal machine learning (IMML) framework reveals pathological signatures of distal sensorimotor polyneuropathy.” Communications medicine vol. 4,1 265. 16 Dec. 2024, doi:10.1038/s43856-024-00637-1
概念介绍
弹性网络模型(Elastic Net)是一种结合了L1和L2正则化的线性回归模型,旨在解决高维数据中的特征选择和多重共线性问题。它通过引入两个正则化参数λ(控制惩罚项的总体强度)和ρ(控制L1和L2惩罚项的相对比例),在Lasso回归(侧重于特征选择,产生稀疏模型)和岭回归(侧重于所有特征的平衡压缩)之间进行调节。
0.前言
远端感觉运动多发性神经病变(DSPN)是老年人、肥胖者以及糖尿病前期和糖尿病患者中常见的一种神经疾病,与高发病率和早逝有关。DSPN是一种多因素疾病,目前尚未完全理解。
1.研究简介
1.1研究目的:
1.2研究方法:
2 研究结果
研究基于人群的 KORA 研究数据,包括年龄在 62-81 岁之间的参与者,并对参与者进行了 DSPN 的临床检查。
2.1两步特征选择和集成机器学习框架
i.使用 849 个至少缺少一种数据模态的样本来丰富生物学信号和减少特征空间,而完全表征的 242 个样本则专门用于最终模型训练.
ii.优先选择预测性和生物学相关的生物分子,不考虑其效应大小。
i.比较了三种特征整合方法,发现 GSEA-FFS 表现最佳,其次是 GSEA-集成堆叠。
ii.比较了弹性网、随机森林和支持向量机的预测性能,通过 100 次匹配重采样和前向特征选择,发现弹性网优于其他三种算法.
iii.在每次重采样的迭代中,基于交叉验证选择最具预测性的模态组合,最终模型分析返回的预测模态组合将用于后续部分的 DSPN 分类和发病率预测的功能分析.
2.2临床数据足以区分有无 DSPN 的个体
使用临床数据构建的模型能够有效区分 DSPN 病例和对照组,模型的 AUROC 值为 0.752,表明临床数据具有较好的预测性能。
通过弹性网模型和稳健排名聚合方法,提取出 13 个预测性临床特征。在这些特征中,年龄、腰围、身高和是否患有神经系统疾病对 DSPN 预测的影响最大。
利用主成分分析(PCA)对这四个关键临床变量进行分析,结果显示它们能够有效分离 DSPN 病例和对照组。
在对测试集样本进行预测时,大多数 DSPN 病例的预测概率高于对照组。病例组的年龄、腰围和身高值显著高于对照组,而神经系统疾病在 DSPN 病例中显著富集。
2.3分子数据提高了 DSPN 发病率预测的准确性
2.4炎症增加、SUMOylation 水平降低和必需脂肪酸水平降低是 DSPN 发病的重要标志
在预测 DSPN 发病的模型中,27 个最重要的特征中有 18 个是炎症蛋白,表明炎症在 DSPN 发病过程中起着关键作用。
SUMOylation 相关信号通路的下调在 DSPN 发病中具有显著性,涉及 DNA 复制和 DNA 损伤响应修复等过程,提示 SUMOylation 在疾病发展中的潜在影响。
三个必需脂肪酸(caprate、linolenate 和 adrenate)在 DSPN 发病中显著下调,这些脂肪酸与神经功能和炎症调节有关,其水平变化可能与 DSPN 的发病机制相关。
3.结语
(1)研究揭示了炎症、SUMOylation 和必需脂肪酸等在 DSPN 发病中的重要作用,这说明了需要从多因素、多层面的角度进行综合分析和研究,这有助于全面把握疾病本质,为后续研究和临床实践奠定基础。