介绍一款|用于多组学整合和网络可视化分析的在线平台

介绍一款|用于多组学整合和网络可视化分析的在线平台

谷禾健康

为了使研究更系统更全面,越来越多的研究人员追求在多组学背景下解释分子数据。

OmicsNet (www.omicsnet.ca) 顺应而生,这是一个在线平台,允许用户轻松地构建、可视化和分析多组学网络

OmicsNet 2.0在原有基础上进行了升级,主要改进了三个方面:

(1) 可视化分析中2D图形布局选项增加了11个,以及一个新颖的3D模块

(2) 支持三种新的组学类型:

  • 来自遗传变异研究SNP列表
  • 来自微生物组分析的物种丰度矩阵
  • 来自非靶向代谢组学的液相色谱-质谱峰(LC-MS)

(3) 分析时将同时输出使用的R包OmicsNetR和历史命令,并生成共享链接可在网页查看和交互操作,从而提高研究的可重复性。

研究中使用OmicsNet 2.0对炎症性肠病(IBD)的数据进行多组学分析。

OmicsNet 2.0工作流程

img

如图,主要为4个步骤:

  • 上传数据(支持8种类型的数据)
  • 选择数据库(根据数据类型选择)
  • 构建网络
  • 可视化

OmicsNet 2.0 的改进

1、更新了分子相互作用数据库

包括PPI数据库(STRING,InnateDB和IntAct),TF-target数据库(TRRUST和JASPAR), miRNA-target数据库(TarBase和miRTarBase),代谢数据库(KEGG, Recon3和AGORA)。

2、支持三种新的组学类型

可支持来自遗传变异研究的SNP矩阵、来自非靶向代谢组学的 LC-MS 峰和来自微生物组分析的物种丰度矩阵数据的输入及互作分析。

对于那些对影响基因调控的变异感兴趣的用户,可以分别基于ADmiRE和SNP2TFBS将SNPs映射到miRNAs或TF结合位点。由此产生的网络可以通过proteins、miRNAs或TFs进一步扩展,以了解潜在的影响

对于代谢组学分析,使用最近发布的NetID算法对LC-MS峰(m/z, retention time, intensity和p-value)进行数据处理,可选三种数据库(KEGG, PubChemLite_BioPathway和HMDB)进行注释

使用Rcpp/C++ 引擎重新编写了核心算法,使其速度提高了10 倍以上。使用 lpsymphony 包进一步优化了整数线性规划。

直接上传物种丰度矩阵,可以使用贝叶斯逻辑模型预测潜在代谢物,该模型使用超过 6000 个高质量基因组规模的代谢模型进行训练。

3、代码开源

开放R包OmicsNetR(https://github.com/xia-lab/OmicsNetR),显示分析期间所执行的R命令。结果可输出为网页链接,有效期一个月

4、减少假阳性

对于来自人类和小鼠的数据,提供了一个基于ENCODE、基因型-组织表达(GTEx)或人类蛋白图谱(HPA)的基因表达数据的过滤器,这些过滤器帮助研究人员专注于与生物相关的相互作用,并减少假阳性。

5、支持 2D 和 3D 网络可视化

2D模块可支持11种图形布局3D模块可支持交互。图形化主要基于 igraph 包和 graphlayouts 包。

使用OmicsNet 2.0进行的IBD多组学研究

图A为2D视图,图B为3D视图

将获得的物种丰度矩阵,SNP矩阵和LC-MS峰数据上传至OmicsNet 2.0平台。

利用AGORA数据库预测潜在的微生物代谢物(potential score:0.9)。

利用PhenoScanner对基于eQTLs的基因进行SNP定位

利用KEGG数据库对LC-MS峰进行注释。

通过添加代谢物-蛋白质相互作用,从SNPs和LC-MS峰生成的个体网络进一步扩大,这样三个网络可以在代谢组学层合并

p-value过滤:(cut-off: 0.2)来排除p值较大的LC-MS峰值所贡献的节点。其网络连接基于其相关代谢物、基因或蛋白质。

如图A,生成的子网络1包含六种类型的节点(物种、SNPs、代谢物、SNPs或代谢物相关的基因/蛋白质),结果显示出glutathione是宿主-微生物相互作用中的重要交互作用点

由此推测包括大肠杆菌在内的几种微生物会产生glutathione,两个SNPs(rs3197999和rs1428554)通过编码谷胱甘肽过氧化物酶(GPx)的基因GPX1和GPX3与代谢产物相关

与此呼应的是,在以往的研究中证明大肠杆菌和相关物种在IBD中的过度表达可能是由于它们能更好地产生glutathione以抵抗氧化应激。

图B的3D分层网络提供了一个直观的多组学整合视角,突出显示了连接微生物组和宿主遗传的glutathione的流动路径。

OmicsNet 2.0与其它工具的比较

如下表,比较OmicsNet 2.0与其他基于web的多组学集成工具的关键特性

‘√’表示支持,‘-’ 表示缺失,“+”表示定量评估(“+”越多表示更好的支持)

附带各工具的官网及主要特点描述:

PaintOmics

(http://www.paintomics.org)

专注于在视觉上呈现多组学数据的探索分析,包括转录组学,代谢组学,表观基因组学,miRNA和转录因子,将其映射到KEGG通路联合分析。

MergeOmics

(http://mergeomics.research.idre.ucla.edu)

整合了来自单个组学层面的关联研究的汇总统计数据,以及不同功能基因组学数据,以获得机理上的见解,最近还加入了多组学信息的药物重新定位(drug repositioning)。

OmicsAnalyst

(https://www.omicsanalyst.ca)

基于输入的数据,利用多元统计、相关性分析和聚类方法,结合网络、热图和散点图进行多组学分析。

Arena3D

(https://www.arena3d.org)

擅长使用基于3D的分层布局对多层网络进行交互式可视化,适用于多组学网络数据。

NedRex

(https://nedrex.net)

是一个Cytoscape插件,专注于疾病模块识别药物再利用,使用各种模块识别和优先排序算法。

MetScape

(http://metscape.ncibi.org)

是一个Cytoscape插件,通过构建和分析不同类型的含有酶、代谢物和/或反应的网络,专注于基因表达和代谢组学数据的集成和可视化

OmicsNet

(https://www.omicsnet.ca)

通过将多个分子互作数据库与强大的2D/3D可视化网络分析相结合,对于多组学集成分析结果解释更好的理论基础,对以上工具的不足做了补充

结 语

OmicsNet 2.0是一个基于网络的多组学分析平台,支持2D和3D网络可视化探索

1.0版本中强调基于web的3D网络可视化

2.0版本中,进一步改进了其可视化分析系统,添加了一个功能完整的2D网络可视化系统,并支持三种新的组学数据输入(SNPs、微生物分类单元和LC-MS峰),目前的生物信息学工具无法很好地支持这些数据。

除了富集分析、搜寻模块和最短路径分析,用户还可以使用重启随机游走算法(Random Walk with Restart)搜索候选疾病标记物。最后,2.0版本通过发布底层的R代码和共享链接,改进了工具的可再现性和透明度

使用IBD多组学数据的案例研究表明,OmicsNet 2.0可以揭示与原始出版物和后续出版物以及IBD文献一致的有意义的模式、关系和功能。总之,OmicsNet 2.0解决了对多组学数据进行分析的一些需求。

参考文献:

Zhou G, Pang Z, Lu Y, Ewald J, Xia J. OmicsNet 2.0: a web-based platform for multi-omics integration and network visual analytics. Nucleic Acids Res. 2022 May 26:gkac376. doi: 10.1093/nar/gkac376. Epub ahead of print. PMID: 35639733.

Leave a Reply

客服