摘要
代谢组学是个新兴领域,系统性地定量众多代谢物。关键目的是识别与每种生物表型相对应的代谢物,并进一步分析其中涉及的机制。尽管代谢组学对于理解相关的生物学现象至关重要,但在全面描述过程的能力上存在局限性。推荐采用综合分析策略,即将代谢、转录、蛋白质以及其他组学方法相结合。不同组学数据的整合需要专门的统计学和生物信息学软件。本综述着重于代谢组学研究中涉及的步骤,并总结了几种主要的代谢组学分析工具。还概述了多种癌症和疾病中最为异常的代谢通路,并讨论了多组学整合算法的重要性。总的来说,目标是概括当前的代谢组学分析工作流程及其主要分析软件,为建立优选的代谢或多组学分析流程提供有益的见解。
代谢组学分析工作流程
图1 代谢组学分析的典型工作流程
① 利用特定的检测技术(化合物检测)来识别代谢物。
② 原始信号预处理,以生成适合后续统计分析的数据格式(数据预处理)。
③ 数据标准化来减少系统和技术偏差。在非靶向研究中,代谢物依据某些给定数据库中的光谱信息被鉴定出来(数据处理)。
④ 采用单和多变量统计分析来识别显著表达的代谢物(统计分析)。
⑤ 将显著表达的代谢物通过富集和通路分析与生物学背景相联系(功能分析)。
⑥ 代谢可与其他组学数据(如转录、蛋白质或微生物)整合,以全面理解病理生理过程的分子机制(组学数据整合)。
代谢组学数据分析与整合软件工具
图2 MetFlow和MetaboAnalyst 5.0中的一些图形可视化特性
MetFlow
(a) 数据处理功能下RSD(相对标准偏差)图。高百分比RSD的特征应从后续分析中移除(建议阈值为LC-MS的20%和GC-MS的30%)。
(b) 统计分析功能中火山图,
(c)差异代谢物热图,可自主设定阈值。
(d) PCA分析,
(e) PLS分析。
(f) 通路富集概览,每个圆圈代表不同的通路,圆圈大小和颜色基于通路大小和p值。
MetaboAnalyst 5.0
(g) 差异分析火山图。
(h) PCA分析图。
(i) 统计分析功能中差异代谢物热图。
(j) 通路富集概览,颜色深浅基于p值。
(k) 富集的代谢通路示例。浅蓝表示非上传的代谢物,而是用于富集分析的背景;红表示存在于上传数据中的代谢物,代表不同水平。
(l) 联合通路分析的例子。上传候选基因和代谢物,生成相应的通路视图。方块代表基因,圆圈代表代谢物,红和绿表示不同的水平变化。所有图像均使用软件提供的示例数据生成。
图3 其他可用的代谢组学数据分析工具示例
(a) 由PaintOmics 3创建的通路总览图。点击任一圆圈后,
(b) 会生成对应的通路视图,展示参与该通路的所有基因及其互作。
(c) 由3Omics构建的相关网络图。
(d) MetPA通路分析。MetPA现已整合进MetaboAnalyst 5.0平台中。
(e) MassTRIX的通路分析视图。
表1 几种最常用代谢组学数据分析工具的特点
参考
[1] Metabolites. 2022 Apr 15;12(4):357. doi: 10.3390/metabo12040357
注:AI辅助翻译,如有错误欢迎指出。请以复制粘贴,附上本号名片的方式转载此文。