(3) 样本及代谢物的运输与保存问题;
B2 LC-MS 数据质控与搜库
(1) LC-MS 实验过程中 QC 样本的设置方法;
(2) LC-MS 上机过程的数据质控监测和分析;
(3) XCMS 软件数据转换与提峰;
B3 R 软件基础
(1) R 和 Rstudio 的安装;
(2) Rstudio 的界面配置;
(3) R 的基本数据结构和语法;
(4) 下载与加载包;
(5) 函数调用和 debug;
B4 ggplot2
(1) 安装并使用 ggplot2
(2) ggplot2 的画图哲学;
(3) ggplot2 的配色系统;
(4) ggplot2 画组合图和火山图;
第三天
机器学习
C1 无监督式机器学习在代谢组学数据处理中的应用
(1) 大数据处理中的降维;
(2) PCA 分析作图;
(3) 三种常见的聚类分析:K-means、层次分析与 SOM
(4) 热图和 hcluster 图的 R 语言实现;
C2 一组代谢组学数据的降维与聚类分析的 R 演练
(1) 数据解析;
(2) 演练与操作;
C3 有监督式机器学习在代谢组学数据处理中的应用
(1) 数据用 PCA 降维处理后仍然无法找到差异怎么办?
(2) PLS-DA 找出最可能影响差异的代谢物;
(3) VIP score 和 coef 的意义及选择;
(4) 分类算法:支持向量机,随机森林
C4 一组代谢组学数据的分类算法实现的 R 演练
(1) 数据解读;
(2) 演练与操作;
第四天
D1 代谢组学数据清洗与 R 语言进阶
(1) 代谢组学中的 t、fold-change 和响应值;
(2) 数据清洗流程;
(3) R 语言 tidyverse
(4) R 语言正则表达式;
(5) 代谢组学数据过滤;
(6) 代谢组学数据 Scaling 原理与 R 实现;
(7) 代谢组学数据的 Normalization;
(8) 代谢组学数据清洗演练;
D2 在线代谢组分析网页 Metaboanalyst 操作
(1) 用 R 将数据清洗成网页需要的格式;
(2) 独立组、配对组和多组的数据格式问题;
(3) Metaboanalyst 的 pipeline 和注意事项;
(4) Metaboanalyst 的结果查看和导出;
(5) Metaboanalyst 的数据编辑;
(6) 全流程演练与操作
第五天
E1 机器学习与代谢组学顶刊解读(2-3 篇);
(1) Nature Communication 一篇代谢组学小鼠脑组织样本 database 类型的文献;
(2) Cell 一篇代谢组学患者血液样本的机器学习与疾病判断的文献;
(3) 1-2 篇代谢组学与转录组学和蛋白组学结合的文献。
E2 文献数据分析部分复现(1 篇)
(1) 文献深度解读;
(2)实操:从原始数据下载到图片复现;
(3) 学员实操。