Tag Archive 报告解读

16s科研报告结果从这几个方面入手,快速获取关键信息

谷禾健康

16S科研项目是一个完整的闭环,前期的课题项目设计方案、取样和重复实验设置决定了后期分析报告的数据完整性项目类型

想要拿到一手有利用价值的科研报告和项目数据,前期的实验方案设计和后续的分析都起着关键性的作用。

然而有时候拿到报告不知道如何去解读,这里为大家梳理一下16s科研项目的全过程,帮助大家更好的了解报告内容,快速获取关键信息。

NO.1
实验方案设计

实验方案设计就像一个总工程的设计图纸,决定了未来科研分析报告的类型走向,并且前期的分组设计的越详细,各种理化指标、生化指标、代谢物等信息准备越充分,后续报告的完整度越高

明确项目课题类型

第一步要做的就是明确项目课题类型:

最常见的就是多分组之间差异分析比较:例如,要比较对照组、模型组、实验组,之间的差异结果。

还有多分组中,任意两组之间比较:例如某实验设计了正常组、疾病组、用药组服用奥氮平、阿立哌唑、氨磺必利、利培酮,像比较不同的用药组和疾病组之间的菌群的差异结果,就用到了分组之间两两差异比较

✦举个例子

图中1组与3组、4组、6组 组间差异显著

还有随时间的变化比较菌群之间的变化规律:例如在用药不同时间段包括3天,5天,2周,1个月,2个月,观察菌群的变化情况。如下图所示:

收集理化指标非常重要

如果前期搜集好每个样本的相关理化指标,还可以计算这些指标与菌群之间是否具有相关性

✦举个例子

例如该项目比较自闭症儿童与正常儿童的菌群差异。客户在样本信息单里还详细搜集了母孕期的各种详细指标,例如孕期天数、出生体重、白细胞介素6、肿瘤坏死因子a、五羟色氨等数值型理化指标

还搜集了是否顺产、是否妊娠高血压、是否孕期感染、是否妊娠糖尿病、是否先兆流产等因子型理化指标。其中0代表否,1代表是:

根据这些理化指标与菌群数据做相关性分析,从因子型的结果可以看出,自闭症(ASD)与正常儿童之间的分组与菌群之间相关性极显著**,其次是否有先兆流产的分组与菌群之间有显著相关性*,其他的包括是否喝牛奶、孕期是否感染、妊娠高血压都与菌群有相关性

在数值型理化指标中,孕期的天数与菌群之间相关性显著*,其次是白细胞介素6与菌群之间有相关性

小结

因此,前期搜集相关资料越详细充分,对分析报告的完整性也会有帮助,分析人员也会根据您的样本信息单提供的相关内容,做出个性化的分析和售后指导建议

NO. 2
取 样

首先基于样本类型,最常见的环境样本来源是人体、动物、土壤、水体等。而人体中的肠道菌群样本是目前研究最广泛,可鉴定的物种也最为丰富,谷禾在肠道菌群与人体健康方面有深入研究,目前已完成超20万例临床肠道菌群样本检测,并构建了超过60万各类人群粪便样本数据库。

其他样本类型还包括人体/动物唾液样本、组织样本、尿液样本等。

▸ 粪便样本

目前粪便样本从采样到提取数据分析技术较为成熟、应用较为广泛,谷禾最早在15年就开发了针对粪便样本的取样管,也是最早致力于研发粪菌取样盒的公司,方便实验室、个人日常取样需求,实现了粪菌样本的常温运输

谷禾取样管常温保存,取样也较为方便卫生,在家就可以轻松完成,相较于传统取样方法都有所升级。并且该取样管也有专利证书。该取样方法被大量客户采用并接纳,大大降低了采集粪便样本的难度,缩短了搜集样本的时间周期。

取样示意图

▸ 其他样本

土壤样本也相对较为容易提取出DNA,但需要注意的是土壤样本的菌群特征容易受植物腐殖质基因的影响和干扰,所以提取时要进行纯化

而口腔、组织、尿液等样本,由于DNA含量较少,在实验阶段提取相对较为困难,所以提前准备样本时,尽量多取一些,并且可以多取几个重复,尽量避免扩增不出来的情况。

并且这些样还很容易受到环境样的污染,所以在实验阶段,可以取空白样本,和阳性样本ST做对照,数据分析时可以用来纯化样本,排除来自环境的干扰序列

✦组间差异分析需重复取样

要做组间差异分析时,每组要重复取样,才能做组与组之间的统计检验。理论上,每个组至少3个样就满足基本的统计差异分析需求。所以在重复取样时,每个分组至少取3个样。取样时要保证每个分组内部的样本一致性,如果组内样本之间的个体差异性较大,则会影响后期组间差异结果分析。

✦举个例子

例如从该图可以看出,分组之间组间差异较大,并且组内的样本之间较为接近和相似。

但从该图可以看出,Control组中Control3样本明显与组内的其他样本差异较大,与DSS组内的样本较为相近,这样就对后期组间差异分析的时候会产生影响,需要将该样本去除。

又例如在该图中,TA200组中的TA3样本的Anaeroplasmatales物种丰度含量非常高,该样本与组内的其他样本明显差异较大,该样本可能受到环境污染等其他因素干扰,这样就没有办法保证组内样本的均一性,也会影响分组之间的差异分析统计结果,再后期分析的时候建议把该样本去掉重新分析。

建议

为了便于后期数据整理修改,每个分组需要保留一定量的重复样本,假如每个分组只取了3次重复,假如其中有一个样本质量不好需要去除,该分组只剩2个样本,则不满足每组至少3个样的分组条件,整体就没有办法做组间差异分析统计

所以这里建议每个分组至少取5个样做重复,一般6到10个样就能分析出比较完善的结果。具体分组和组内的重复取样数量视具体的实验设计方案而定。

在经费允许的情况下,建议多取一些重复。假设每组取50到100个重复或者以上,得到的分析结果就基本可以涵盖该分组情况所有的菌群构成情况,可以较为全面的研究分组之间的菌群构成差异情况。

NO. 3
科研分析报告

当拿到16S科研分析报告以后,面对纷繁复杂,各式各样的图表分析结果犯了难,不知道如何从这么多的图表中入手,快速找到报告中需要的图表结果。

这里对16S科研分析结果抽丝剥茧,概括出报告中的主要几大内容板块。

•16S科研分析究竟是在做什么?

16S rDNA 是一种对特定环境样品中所有的细菌进行高通量测序,以研究环境样品中微生物群体的组成,解读微生物群体的多样性丰富度群体结构,探究微生物与环境或宿主之间的关系的技术。

16S分析流程

主要是对原始数据进行拼接过滤得到的优化序列,降噪方法得到ASV,再对ASV进行物种注释,注释到门、纲、目、科、属、种各层次上的分类结果。

通过ASV表计算Alpha多样性,样本内的多样性指数,Beta多样性,样本间相似性的指标。

对ASV表进行功能预测,例如Picrust2功能预测分析、Bugbase菌群表型特征分析,FAPROTAX生态功能预测等。

得到的每个样的数据结果,根据客户提供的分组情况和理化指标,进一步做组间差异分析,以及和环境理化指标之间做关联分析,相关性分析,比较分组之间是否有差异,差异是否显著,来验证分组是否合理,和环境宿主之间是否有关联性

原始数据处理

Illumina NovaSeq测序平台测序得到的双端数据Raw PE,经过拼接和质控,根据一定的标准过滤掉低质量数据、接头或PCR错误,得到Raw Tags。再经过去重复序列,去singleton序列,过滤嵌合体,得到可用于后续分析的有效数据 Effective Tags。

OTU(ASV) 表生成

微生物多样性分析中最重要的就是OTU特征表,一切后续分析都围绕OTU表来进行。生成OTU除了传统的聚类的方法(一般按照97%的相似度进行聚类),现在最新用到的技术的是降噪的方法得到ASV。

简单来讲ASV就是在去除了错误序列之后,将Identity的标准设为100%进行聚类,常见的有DADA2、Deblur、Unoise三种降噪方法。项目里用到的是UNOISE2降噪方法获得ASV数据。

物种的分类与注释

采用QIIME2训练分类器方法对ASVs代表序列进行分类学注释,默认选用SILVA138数据库进行物种注释。并在各个分类水平上:domain(域),phylum(门),class(纲),order (目),family(科),genus(属),species(种)对每个样本的群落组成统计。

alpha多样性

Alpha多样性主要反映样本内多样性。对ASV表进行计算可以获得每个样本的simpson,ace,shannon,chao1以及goods_coverage等指数,alpha多样性指数用来来评估样本菌群物种的丰富度(richness)和多样性(diversity)

beta多样性

Beta多样性反映的是样本间多样性,Beta多样性是衡量个体间微生物组成相似性的一个指标。通过计算样本间距离可以获得β多样性矩阵,基于OTU的群落比较方法报告中给出了,欧式距离、bray curtis距离、Unweighted UniFrac距离和Weighted UniFrac距离等。

功能预测

得到群落的微生物组成之后,也可以对群落功能组成进行预测,常用的16S功能预测的相关软件有PICRUSt2、FAPROTAX、BugBase。

PICRUSt2用来预测功能,通常指的是基因家族,PICRUSt2支持基于多个基因家族数据库的预测,报告中包括了KEGG同源基因,KO直系同源物,EC酶分类编号,MetaCyc途径的丰度,CAZy碳水化合物活性酶数据库,GMM是肠道代谢模块和GBM是肠脑模块。

FAPROTAX是原核的微生物注释代谢或其他生态相关的功能(例如硝化,反硝化,发酵)的一个数据库和软件。FAPROTAX预测的功能主要集中在海洋、湖泊环境样本微生物的功能,特别是硫、碳、氢、氮的循环功能。

BugBase能进行表型预测,其中表型类型包括革兰氏阳性(Gram Positive)、革兰氏阴性(Gram Negative)、生物膜形成(Biofilm Forming)、致病性(Pathogenic)、移动元件(Mobile Element Containing)、氧需求(Oxygen Utilizing,包括Aerobic、Anaerobic、facultatively anaerobic)及氧化胁迫耐受(Oxidative Stress Tolerant)等7类。

以上这些部分,我们通过数据处理分析,得到了每个样本相关的大量数据结果,包括每个样本的序列统计、ASVs表格、物种分类注释统计、alpha多样性指数、beta多样性指数、功能预测等。这些数据主要集中在报告里的这些内容:

▸ 科研分析报告结果文件夹

01_pick_otu/ 文件夹主要是对样本ASV表格统计

02_sequence_statistic/ 文件夹是对样本序列数据的统计

03_diversity-metrics / 文件夹是对样本的alpha多样性指数、beta多样性指数的统计

04_Taxonomic/ 文件夹是对物种分类注释的统计(门到种水平)

Picurst2/ 文件夹是Picrust2功能预测得到的每个样本的相关功能预测数据

Groups/ 文件夹下是对组间差异分析结果

红框是样本个体的相关数据统计,Group是分组比较

根据以上常规分析得到的相关数据进行作图,其路径也在对应文件夹下,可以打开 分析报告.html 有相关分析的图表和对应文件的详细介绍路径说明。

★拿到样本后需要进行统计分析

当我们拿到这些样本大量的数据结果,之后关键的一步就是做对这些数据进行处理,做统计分析,比较分组之间的差异结果,找出菌群和环境之间的关联性等,对数据进一步做研究,找出课题方案对应的结果。

差异分析

不同的数据用到的统计检验方法也不太一样,接下来我们对报告中的不同的分析结果对应的统计差异分析方法进行介绍说明。

▸ alpha多样性

alpha多样性指数组间差异统计分析用到的检验方法是:单因素方差分析(如果只有两个分组,用Wilcoxon秩和检验,3个及以上的分组用Kruskal-Wallis 检验),图上方显示P值

▸ beta多样性

beta多样性指数的统计检验方法有ANOSIM相似性分析和Adonis多元方差分析,这两种都是基于距离矩阵的检验方法。

✦Anosim相似性分析

Anosim分析是一种非参数检验,用来检验组间的差异是否显著大于组内差异,从而判断分组是否有意义

报告中给出了加权距离和非加权距离的Anosim结果图,图中给出了R值和P值。

R值用于比较不同组间是否存在差异,R-value 介于(-1,1)之间,R-value > 0,说明组间差异大于组内差异。R-value < 0,说明组间差异小于组内差异。R只是组间是否有差异的数值表示,并不提供显著性说明。

统计分析的可信度用 P-value 表示,P< 0.05 表示统计具有显著性

图中能看出R>0,说明组间差异大于组内差异,P<0.05 ,说明差异显著,证明该分组情况效果较好。

✦Adonis多元方差分析

Adonis多元方差分析,其实就是PERMANOVA,亦可称为非参数多元方差分析。

其原理是利用距离矩阵(比如基于Bray-Curtis距离、Euclidean距离)对总方差进行分解,分析不同分组因素对样品差异的解释度,并使用置换检验对其统计学意义进行显著性分析。

它与Anosim的用途相似,也能够给出不同分组因素对样品差异的解释度(R值)与分组显著性(P值)。

报告中PCoA bray距离、PCoA weighted_unifrac距离、PCoA unweighted_unifrac距离的图片右下角有给出PERMANOVA检验的P值和R值。

图中看出PCoa bray距离得到的检验P<0.05 组间差异显著,并且分组之间区分较为明显。

PCoa bray距离的PERMANOVA检验结果路径:

多组间检验结果:

Groups/betadiv/pcoa_bray_analysis/PERMANOVA.result_all.csv

两组间检验结果:

Groups/betadiv/pcoa_bray_analysis/ PERMANOVA_paired_result.csv

不同分类水平下的检验方法

在很多分析报告当中,例如在不同疾病的肠道菌群分组中,本身样本个体之间肠道菌群的物种多样性,丰富度差异并不大,alpha多样性组间差异并不显著,beta多样性分组间区分不是很明显,这样就需要进一步找出分组之间的差异物种或者差异功能来进行分析。

对于不同分类水平的物种功能预测结果用到以下几种检验方法:

Tukey检验

Tukey主要应用于3组或以上的多重比较,适合于各组例数相等的每两两分组之间比较。

Tukey检验的一个重要的优点是非常简单,而且所需实验样本相对较少

其检验结果的可信度达到95%的置信水平时,最少的情况下只需6个样本进行验证(改善前3个样本、改善后3个样本)。

•举个例子

图中的字母代表显著性差异的字母表示法,只要含有相同的字母,就表明两组之间没有显著性差异

例如a和ab含有相同字母“a”,表示两组之间没有显著性差异。ab中的“b”表示这一组和其他含有字母b的组(比如bc)没有显著性差异,但是a和bc就有显著性差异了。

图中只展示Tukey检验差异显著的物种或功能,如果数量较多,则只展示前10个。

路径:Groups/diff_analysis/TukeyHSD/

图中显示的都是Tukey检验组间差异显著的物种,依次按照丰度从高到底排列,如果差异结果较大,则显示前10个物种。例如在该图中,Tukey检验结果,门水平物种Actinobacteriota在BB与MG1组、BB与MG2、BF与GG组、BF与MG1组、BF与MG2组,这些分组之间组间差异显著。

组间差异箱型图

组间差异箱型图用到的检验方法是通过单因素方差检验(只有两个分组,用的是Wilcoxon秩和检验,3个及以上的分组用的是Kruskal-Wallis 检验),Var检验和one-way相结合,筛选出组间差异性物种。

路径:Groups/diff_analysis/TaxaMarkers

图中每一个箱型图代表一个组间差异显著的物种

图中显示的都是统计方法得到的差异显著的物种,图中能看出这3个物种分组之间差异显著。

命名格式是,例如:Cen_Nitrosopumilus 指的是,当前分类水平(属水平)的名字 g__Nitrosopu 加上一级分类水平(科水平)的名字 f__Cenarchaeaceae 的前 3 个字母简写Cen,如果当前水平没有注释到名字则以全称的名字表示。

统计结果表:Groups/diff_analysis/TaxaMarkers/ xxx.Groups.sig.meanTests.csv

例如这是一个表格的截图

红框 mean_ 是分组组间的平均值

蓝框 sd_ 代表组间的标准差

粉色 .test 代表不同统计检验结果的P-value P值,这里有var检验 T 检验 Wilcoxon检验(或Kruskal-Wallis 检验)

绿色 _BH 例如Wilcoxon.test_BH代表Wilcoxon.test检验BH矫正的Q-value,Q值

UnivarTest检验(单因素方差分析)

单因素方差分析是指如果只有两个分组,用Wilcoxon秩和检验,3个及以上的分组用Kruskal-Wallis 检验。

路径:Groups/diff_analysis/UnivarTestXXX

Groups\diff_analysis\UnivarTestKEGG\figure 文件夹下有做成柱状图、箱型图和单个物种之间的图,其中有横着排列和竖着排列的,有用原始值计算的,还有对原始值取log后进行统计的。图中只展示Univar 检验组间差异显著的物种/功能。

统计结果表:Groups/diff_analysis/UnivarTestXXX/ UnivarTest_sign.txt

•举个例子

图中显示的是该统计检验差异显著的物种的柱状图或箱型图,按照丰度从高到低排列,如果差异物种/功能较大,则只显示前10个。例如该图中Therobifida、Staphylococcus、Streptomyces等物种用Kruskal-Wallis 检验得到的组间显著差异物种。

该图展示了Bacillus物种Kruskal-Wallis 检验差异结果,所有分组中P<0,001 多组间差异显著,两组间BB与GG、BB与MG1、BB与MG2、BF与GG、BF与MG1、BF与MG2,组间差异显著

LEfse分析

LEfse分析即LDA Effect Size分析,是一种用于发现和解释高维度数据生物标识(基因、通路和分类单元等)的分析工具,可以进行两个或多个分组的比较,它强调统计意义生物相关性,能够在组与组之间寻找具有统计学差异的生物标识(Biomarker)。

LEfSe用到的统计分析方法是将线性判别分析与非参数的Kruskal-Wallis以及Wilcoxon秩和检验相结合。

LEfse分析结果中一般会出现两个图一张表( LDA值分布柱状图、进化分支图以及特征表)。

LDA值分布柱状图

这个条形图主要为我们展示了LDA score大于预设值的显著差异物种,即具有统计学差异的Biomaker,默认值为2.0(看横坐标,只有LDA值的绝对值大于2才会显示在图中);柱状图的颜色代表各自的分组,长短代表的是LDA score,即不同组间显著差异物种的影响程度

路径:

Group/Lefse_Analysis/out_formant.cladogram.png

图中展示了不同分组特有的Lefse组间差异标记物,例如BB组的标记物是目水平的Bacillales和科水平的Bacillaceae,不同的分组标记物也不同,图中如果只展示了部分分组,则代表只有部分分组通过Lefse分析筛选出组间差异标记物。

进化分支图

小圆圈: 图中由内至外辐射的圆圈代表了由门至属的分类级别(最里面的那个黄圈圈是界)。不同分类级别上的每一个小圆圈代表该水平下的一个分类,小圆圈的直径大小代表了相对丰度的大小。

颜色: 无显著差异的物种统一着色为黄色,差异显著的物种Biomarker跟随组别进行着色,红色节点表示在红色组别中起到重要作用的微生物类群,蓝色节点表示在蓝色组别中起到重要作用的微生物类群。

未能在图中显示的Biomarker对应的物种名会展示在右侧,字母编号与图中对应(为了美观,右侧默认只显示门到科的差异物种)。

路径:Group/Lefse_Analysis/out_formant.png

图中右侧展示了分支图中的字母对应的物种信息,例如a 代表GG组的标记物目水平的Microtrichales ,b代表GG组的标记物刚水平的Acidimicrobiia。在分支图的最外层显示的是各分组门水平物种的标记物,例如BF组的是Actinobacteriota、MG1组的是Proteobacteria、

MG2组的是Cyanobacteria

特征表

路径:Group/Lefse_Analysis/out_formant.res.csv

第一列是样本中从门到属水平所有分类单位的列表

Lefse会逐一判断这些分类单位的在分组之间是否具有统计学显著性差异。

第二列:各组分丰度平均值中最大值的log10,如果平均丰度小于10的按照10来计算;如果该分类单位未体现出显著组间差异,则后三列为空。

对于具有统计学差异的分类单位:

第三列:差异基因或物种富集平均丰度最高的分组组名;

第四列:LDA差异分析的对数得分值;

第五列:Kruskal-Wallis秩和检验的p值,若不是Biomarker用“-”表示。

默认LDA>2,P<0.05

通常根据第4列的LDA差异分析对数得分值和第五列的P值,可以描述组间具有显著差异的分类单位统计学效力强弱。

metagenomeSeq

metagenomeSeq是用R开发的一个包,metagenomeSeq的基本思想,用normalization实现分类注释时的biases处理,同时用零膨胀高斯分布(zero-flated Gaussian distribution)处理了测序深度所带来的影响,在此基础上,利用线性模型找到存在的差异所在。

路径:Groups/diff_analysis/ metagenomeRXXX

metagenomeSeq 差异显著物种/功能 热图

图中颜色越深相关性越小,颜色越接近黄色相关性越大,从图中能看出Actinobacteria物种与BB组和BF组相关性较大。

metagenomeSeq差异菌属于功能代谢关联分析

图中红色代表正相关,蓝色代表负相关,颜色越深,圆圈越大,相关性也越大,例如图中能看出MGB049余MF0025 之间成正相关,且相关性较大。

随机森林模型

一种非线性分类器,随机森林属于集成类型的机器学习算法,挖掘变量之间复杂非线性相互依赖关系。通过随机森林重要性点图,可以找出分组间差异关键物种/功能

反映了分类器中对分类效果起主要作用的特征,按重要性从大到小排列。

Error rate:表示使用下方的特征进行随机森林方法预测分类的错误率,数值越高表示基于特征分类准确度不高,可能分组之间特征不明显。分值越低证明分组效果比较好

•举个例子

图中按照随机森林模型效果筛选出的对分组效果有重要性作用的物种,按照重要性从高到低进行排列,例如图中最终要的是a,依次往下是b、c等。错误率较小,表明该分组效果较好。

ROC曲线

ROC曲线分析是一种常用的统计学分析方法,在医学研究中主要用于评价诊断试验的效能。在16S测序报告中,我们通过绘制ROC曲线,并计算ROC曲线下面积(AUC),来确定分组对于菌群是否有诊断价值

ROC曲线图是反映敏感性特异性之间关系的曲线。ROC曲线下的面积值在1.0和0.5之间。在 AUC>0.5的情况下,AUC越接近于1,说明诊断效果越好

AUC在0.5~0.7时有较低准确性,AUC在0.7~0.9时有一定准确性,AUC在0.9以上时有较高准确性。AUC=0.5时,说明诊断方法完全不起作用,无诊断价值。AUC<0.5不符合真实情况,在实际中极少出现。

•举个例子

从图中能看出各分组的AUC都大于大于0.9,各分组的分组效果较好,BF组AUC等于1,该分组效果最好,可能样本之间较为相近,并且跟其他分组组间差异也比较大。

以上是组间统计差异的方法介绍,其他的还包括关联分析

例如客户提供了每个样的相关理化指标数据,想计算这些指标与均属之间有什么相关性,就可以做一下分析。

关联性分析

✦相关性热图

图中X轴代表属水平物种,Y轴代表代谢指标,红色代表正相关,蓝色代表负相关,**代表相关极显著P<0.01,* 代表相关性显著P<0.05相关性具有统计学意义。

例如从该图中能看出6与n物种成正相关,并且相关性极显著**,7与b物种成负相关,并且相关性极显著**

可以得到表格:任意菌属和代谢的相关性的值和P值

✦CCA图

可以分析样本、菌群、理化指标之间的关联关系。图中使用点代表不同的样本,从原点发出的箭头代表不同的环境因子

箭头的长度越长,表示环境因子的影响越大;夹角越小,代表相关性越高。样本点与箭头距离越近,该环境因子对样本的作用越强

图像中坐标轴标签中的数值,代表了坐标轴所代表的环境因子组合对物种群落变化的解释比例。

例如从图中能看出pH 、NO2N、02与 Acinetobacter、Weissella等物种成正相关,与T3D0、T1D0、T4D0等D0组的样本成正相关

✦RDA 冗余分析

例如从图中能看出pH与Helicobacer物种成正相关,相关性较大,pH与NC组有一定的相关性

✦Envfit分析

回归拟合分析结果:

图中能看出ASD与正常儿童之间的分组与菌群之间相关性极显著**,其次是否有先兆流产的分组与菌群之间有显著相关性*,其他的包括是否喝牛奶、孕期是否感染、妊娠高血压都与菌群有相关性

环境因子与功能/物种的相关性线形图P<0.05显著,图中红色点代表正相关,绿色点代表负相关,灰色相关性不显著

图中能看出pH 与Candidatus Rhabdochlamydia 之间成正相关,且相关性显著,pH 与Sinorhizobium、Euzebya 之间成负相关,切相关性显著。

Network网络分析

还可以做菌属之间的网络分析关联图,共发生网络图为研究复杂微生物环境的群落结构功能提供了新的视角。

由于不同环境下微生物的共发生关系截然不同,通过物种共发生网络图,可以直观看出不同环境因素对微生物适应性的影响,以及某个环境下占互作主导地位的优势物种、互作紧密的物种群,这些优势物种以及物种群往往对维持该环境的微生物群落结构和功能稳定发挥着独特以及重要的作用

•举个例子

图中展示了相关性的物种,例如Bacteroidota、Actinobacteriota、Proteobacteria 这些物种与其他物种相关较大,图中这些物种与其他物种连线较多,字体比较大也代表相关性较强,例如Actinobacteriota与Deinococcota连线是绿色的代表这两个物种是负相关。

这两个图类似的物种相关性的图,用同一个数据做出来的,图中能看出Bacillales、Desulfovibrionales、Selenomonadales与其他物种相关性较强

结 语

报告中已经基本都涵盖了16S科研数据分析所需要的图表差异统计,以及相关性分析结果。如果在几种不同类型的统计方法对比之下有略微的差异结果,选取其中一组差异结果即可。

报告里涵盖了大部分16S所需要的图片,不过也有个别个性化的图需要单独用到软件去做,可以单独完成个性化图表生成。

随着16s分析报告的不断升级,报告中的图表以及相应的解读也会越来越精细完善,谷禾也将尽可能为大家的科研之路带来更多便利。

谷禾|宏基因组测序报告解读

谷禾健康

宏基因组测序可以使我们深度全面地了解微生物群的构成,对于缺乏深度研究和高质量参考基因组的样本,宏基因组获得的较为完整的基因组不仅可以丰富参考基因组数据库,同时可以提供更加准确的物种分类。

关于宏基因组的介绍可见我们之前的文章:

在宏基因组分析过程中,可能遇到的问题,及问题相关解决思路如下:

更多关于宏基因组科研服务详询:

商务经理:13336028502(微信同号)

肠道菌群健康检测报告——常见问题解析

谷禾健康

在持续的肠道菌群检测实践过程中,我们收到很多新的问题反馈和对肠道菌群检测在具体问题中的疑问。在此谷禾基于长期和大规模样本群的经验以及实验分析,对部分常见问题进行汇总和整理。

一次肠道菌群检测好比一场健康考试,你拿到报告的那一刻,等同于拿到了你考的那张卷子,那么你首先会关心自己考了多少分。

在肠道菌群检测报告中,同样也有基于肠道菌群的健康评估分数,即健康总分

01 健康总分

基于大数据和整体性评估,报告中会给出健康总分这项指标。这个健康总分是如何计算得出的?

还是拿我们最熟悉不过的考试举例,一场语文考试可能包括了拼音词语、阅读理解、写作等模块,所以最后你的总分是综合各个模块的测试之后得到的(比如说拼音写错了扣1分,阅读理解错了一题扣5分……),通过各模块测评后得到的总分反映的是你的综合能力。

健康总分也是一样,综合计算了三个部分:肠道菌群健康状况疾病风险情况营养饮食均衡情况综合评估计算。总分100分,采取扣分制,疾病风险和营养不均衡以及菌群失衡都会相应的减分。

以上是具体的评分标准。

健康总分可以说是非常直观的一个指标,除此之外,整体性评估指标还有一个:肠道预测年龄

02 肠道预测年龄

生理年龄是指人达到某一时序年龄时生理和其功能所反映出来的水平,是从医学、生物学角度来衡量的。

谷禾肠道预测年龄是基于超过6万人群队列的深度学习模型构建的,对健康人群的肠道年龄预测真实生理年龄吻合度很好

肠道预测年龄和生理年龄就像齿轮运作,井井有条匹配状态,身体这个系统运作起来相对健康轻松。

疾病人群或菌群紊乱人群,肠道年龄会较大偏离真实年龄,也就是这个齿轮系统出现一些偏差问题。

如果肠道菌群多样性下降,且以大肠杆菌为主,可能会被预测为10岁以下儿童,也就是预测年龄远小于真实年龄。

如果存在较多病原菌,则预测年龄会偏向远大于真实年龄。

如果菌群预测年龄和实际生理学年龄相差很大,如何解读?

还是用考试来说,每个年龄段都应具备该年龄段的能力。如果你是一个初中学生,那么就应该答出初中阶段学生该会的题,这时候给你做个测评,发现还停留在幼儿园水平或者已经到了大学生水平,要么太幼稚要么太早熟,都不符合健康的身心发展规律

肠道预测年龄同样,如果肠道预测年龄偏离实际年龄很大,两种情况,一种是偏大,另一种是偏小

这两种情况均表明菌群发育成熟偏离了实际生长发育,我们均认为其代表菌群状况不太好,存在菌群异常或不健康状况。

如果偏小,即肠道年龄远小于生理学年龄,一般菌群发育滞后或者偏幼龄,菌群构成简单,代谢以及免疫功能不完善。

如果偏大,即肠道年龄远大于生理学年龄,一般菌群多样性下降,变形菌、肠杆菌等致病菌增多,核心菌属构成比例低等。

而在正常范围内,肠道预测年龄小于生理学年龄,那么表示菌群发育正常,菌群构成和代谢偏向于更年轻,比较好。那么什么是正常范围呢?

谷禾肠道年龄预测如下范围内表示正常:

0~2岁:偏差小于3个月

3~5岁:偏差在6个月以内

6~15岁:偏差在1岁左右

16~50岁:偏差在3岁以内

50岁以上:偏差在5岁以内

真实年龄与肠道预测年龄在范围内的差异可以反映其肠道菌群的发育和衰老状况。以下情况可能会导致肠道预测年龄完全偏离真实年龄,包括:

▪ 肠道菌群紊乱

▪ 菌群结构过于单一

▪ 近期服用可能严重干扰菌群的药物(如抗生素)

▪ 病原菌感染或者处于疾病状态

▪ 长期补充益生菌

由于肠道年龄考虑了整体的肠道菌群结构,如果肠道年龄严重偏离真实年龄,通过干预调整或去除上述干扰因素肠道年龄是能够恢复正常范围,但该干预周期一般需要1个月以上。

03 有益菌、有害菌

有益菌

有益菌包括益生菌,益生菌主要来自两个菌属:

分别是双歧杆菌属乳杆菌属,目前已获得批准的有效益生菌菌株均来自这两个细菌属。

其中双歧杆菌可有效改善肠道状况,而特定的乳杆菌菌株可以改善精神健康,包括焦虑和情绪,也能改善肠道健康。双歧杆菌和乳杆菌也是人体肠道菌群中常见的菌。

虽然说是常见菌,却不见得它们数量多。在成年人肠道菌群中,双歧杆菌的比例较低,在1%左右乳杆菌更是低于1%,甚至很多人(20~40%)的肠道菌群中比例低至万分之一

下表是谷禾检测的益生菌列表,列出了主要的常见益生菌。

除了上述益生菌,有益菌还包括下列种属,这些菌属是构建肠道菌群的核心菌属,在评估有益菌水平时根据菌属对肠道菌群结构的重要性会给予不同的权重。

Faecalibacterium、Ruminococcus、Roseburia

Phascolarctobacterium、Prevotella、Parabacteroides

Oscillospira、Megamonas、Lachnospira

Lachnoclostridium、Gemmiger、Eubacterium

Coprococcus、Dorea、Dialister

Clostridium、Blautia、Bacteroides

Akkermansia、Alistipes、Agathobacter

通常益生菌的检出率比较低,一般在益生菌补充一周左右报告中可以体现。从大数据来看,益生菌检出的同时,菌群的相关指标也会有所提升,比如说有害菌降低,改善菌群平衡状况。

有害菌

有害菌和肠道内的其他共生菌共同构成菌群微生态,也是大部分人群肠道内常见的菌群。

有害菌是相对而言的,正常肠道菌群也包含许多这些菌属的菌,但有害菌比例或个别菌属丰度超标可能预示着肠道菌群的健康状况受到破坏。这些菌过多会影响肠道内环境,如pH值,含氧量以及肠道内毒素等,可能会导致出现一些机会感染和机会致病菌入侵,进而诱发炎症和疾病

我们报告中的有害菌包含了致病菌条件致病菌,以及属内主要菌种为致病菌的属。为便于统计,我们在计算的时候统一按照属层级进行计算比例。

报告中的有害菌包括了以下的菌属:韦荣氏球菌属、葡萄球菌科、变形菌属、弓形菌属、弯曲菌属、螺杆菌属、厌氧螺菌属以及弧菌属等

在肠道菌群检测报告中会有对有益菌,有害菌的整体评估。

如果有害菌过多,通常建议服用益生菌或益生元的方式首先增加有益菌的比例,相应的有害菌比例就会降低。想要持久的改善菌群结构降低有害菌水平就需要改善生活方式适当增加抗性淀粉等膳食纤维并规律饮食和睡眠增加运动等。

04 肠道菌群平衡 / 失衡

整个生态系统平衡对于地球而言十分重要,同理,肠道菌群平衡对于我们人体健康也很重要。健康的肠道菌群丰富且多样性高。

菌群失调是指体内微生物群不平衡,这可以表现为某些细菌的出现率较高,细菌的出现率较低,细菌的多样性不足,有害菌,有益菌比例失调等。

通常临床上采用大便常规检查,通过显微镜下观察统计染色细菌中杆菌和球菌以及革兰氏阴性和阳性菌的比值是否超标来判别的。

其中致病菌多为球菌和革兰氏阴性菌,而肠道有益菌多为杆菌和阳性菌,因而在传统临床上简单比较两者的比值评估是否菌群紊乱,是相对比较粗放的。

谷禾菌群检测报告中的菌群失调

基于高通量测序可以精准的检测低至万分之一水平的菌,甚至可以分类到种水平,因此可以更加精细化评估菌群是否出现紊乱和异常。

基于谷禾超过30万人群的菌群数据库分析结果,我们将在90%的人群都有检出,且人群平均丰度1%以上的菌属做为核心菌属。这些核心菌属通过长期与人类共生,在帮助消化复杂碳水化合物和产生短链脂肪酸外还影响整个肠道环境,抑制病原微生物的定植生长。因此当这些核心菌属占总肠道菌群比例低于60%时,肠道菌群很可能处于紊乱状态。

【谷禾健康菌群数据库】

详见:肠道菌群失衡的症状、原因和自然改善

如果出现菌群严重失衡,例如致病菌占了相当大比例,那么首先应考虑针对致病菌使用相应的抗生素治疗,然后再通过益生菌补充饮食、生活方式的改变进行调理,直到菌群恢复平衡。

05 菌群多样性

多样性包含两个维度。

一个是肠道菌群种类,人群中肠道菌群的种类参考范围在100~2000种,种类数量越多样性越

另一个维度是均匀性,即各个菌种的含量丰度较为均一没有出现单一菌种占据绝大部分的情况。

多样性的评估一般通过一个叫做香农-维纳多样性指数的指标来进行评估,计算公式为:

H=-∑(Pi)(log2Pi)

其中Pi为每个菌的占比例,值越大代表物种种类越多,均匀性也更好相应的多样性也越高正常人群中香浓指数在2~9之间,一般大于3以上表明具有一定多样性。

换句话说,肠道菌群多样性表现在:微生态系统的稳定性,以及面对外界致病菌等入侵的抵御能力

一定范围内,更高的多样性通常代表饮食更加丰富多样,同时也意味着更健康的身体状况。

菌群多样性可能与下列情况有关:

环境,农村儿童比城市儿童菌群多样性高;

饮食,低脂饮食与菌群多样性较高有关;

年龄,长寿老人的菌群多样性较高;

……

多样性低不代表一定有疾病,但是更容易到饮食,环境或疾病的影响,包括更易发生水土不服或更容易因饮食不洁导致腹泻等。

多样性可能与下列情况有关:

分娩方式,剖腹产宝宝菌群多样性较低;

饮食营养,营养不良的孩子菌群多样性会下降;

药物,抗生素的使用会大幅降低菌群多样性,并且需要一段时间才能恢复。其他药物也会降低菌群多样性,如治疗胃溃疡和反酸的质子泵类药物也会导致菌群多样性降低;

环境,医院的ICU病房、更衣室等消毒严格,可能导致环境菌群多样性下降。

此外,神经系统、代谢、免疫等慢性疾病也与多样性下降有关。

你可以通过在饮食中增加纤维素,从高脂饮食逐渐转为低脂饮食来提高菌群多样性,另外规律运动也可增加多样性。

另外,我们在实际检测中会发现有这样一种情况:

多样性指标虽然很高,但是整体看起来健康总分并不理想。甚至还有很多慢性疾病风险,这是为什么呢?

这种情况可能是核心菌群丰度不够,核心菌群在代谢、免疫等方面都发挥重要作用,一旦核心菌群丰度下降,则可能造成外源物质侵入。感染、旅行等可能会出现这种情况。

06 致病菌/病原菌

看过我们检测报告的可能会发现,报告里有包括肠道致病菌病原菌,分别代表什么?

<篇幅关系,此处仅展示部分>

肠道致病菌列出了最主要和常见的感染类肠道致病菌。(注意这里重点是肠道

病原菌中给出的包括几十种人体的致病菌,不仅仅是肠道的。<如果没有检出就没有列出>

病原菌和条件致病菌的区别是什么?

病原菌一般极少存在于健康人的肠道菌群,正常范围很小,条件致病菌一般会在正常人群的肠道内存在,丰度较高或菌群结构单一到一定程度会引发疾病。如大肠杆菌和肺炎克雷伯氏菌正常人群中都会有检出,但当丰度较是就会导致肠道菌群紊乱或疾病

报告中如果出现病原菌超标的情况,不一定直接认为有病,需要结合症状

如果出现相应的腹泻等症状需要考是不是因为这些病原菌导致的。单纯超标如果没有症状只是表面有病原菌摄入,注意一下饮食和生活卫生,无须过于担心。

★ 幽门螺杆菌

为什么在医院检查出幽门螺杆菌感染,而报告中并未显示?

注意:本检测未检出并不代表完全不存在该致病菌感染,可能由于比例或其他因素未能达到检测丰度或未检出。

如果肠道菌群检测报告中检出幽门螺杆菌,是否需要去医院进行幽门螺杆菌呼气检测?

如果肠道菌群检测报告显示该项为超标,且同时存在胃部不适或其他胃酸、胃胀等症状,建议前往医院进行幽门螺旋杆菌检测,及早发现治疗。

 沙门氏菌

在食物中毒案例中,通常伴随着沙门氏菌,沙门氏菌粘附到肠上皮表面是发病机制中重要的第一步,并且是其在肠道定植的核心。

关于沙门氏菌的治疗及预防详见:食物中毒一文

扩展阅读:细菌大盘点(二) | 葡萄球菌、沙门氏菌、弯曲杆菌

通过以上部分,我们大概了解了菌群的构成及其扮演的角色,那么我们能利用检测到的这些菌的信息,给我们的健康带来什么帮助呢?

很重要的几个点:

第一,也就是前面所述的,菌群的构成本身就可以反映你的肠道内的环境是不是健康菌群,如果紊乱,它会带来很多的问题,比如说儿童菌群紊乱,可能会营养不良,因为菌群紊乱本身会影响营养吸收。

第二,对病原物的抵抗,也就是说身体是不是比较容易出一些状况,比如说腹泻,感染等问题。

第三,它还会诱发一些长期的慢性疾病,比如说糖尿病,实际上当然饮食是一个问题,但是有一些炎症相关的菌群,会诱发慢性的持续的炎症,从而导致慢性疾病的发展

这就是我们接来下要讲的,疾病风险这块内容。

07 疾病风险

目前我们疾病风险检测部分包括16类主要疾病,根据疾病检测准确度稳定性,我们将检测疾病的水平分为三个等级:低风险、中风险和高风险

根据每种病的分值,0~0.3归为低风险,0.3~0.5评估为注意,0.5~0.7为中等风险,超过0.7为高风险。

目前报告中提供的疾病均经过大量病例样本检验并且准确率超过90%,虽然不作为疾病的诊断依据,但是其分值的高低仍然具有很强的指示作用

0-0.3

如果某种疾病的风险值低于0.3以下表明菌群状态提示疾病风险较,不同身体条件和生活方式下会有0.05的波动

0.3-0.5

如果某种疾病的风险值位于0.3~0.5之间我们认为属于疾病前期阶段,通过饮食调理和相应的注意就可以降低风险。

0.5-0.7

如果某种疾病的风险值位于0.5~0.7之间表明可能患有该疾病处于疾病风险阶段,这时候我们建议最好前往医院相关科室进行检查,如果不便前往医院也可根据建议先进行饮食调理和相应的注意,一般一个月后再进行一次检测查看疾病风险是否下降到正常范围,如果仍然较高甚至升高建议最好前往医院复查。

0.7- 1

如果某种疾病的风险值超过0.7表明有很大可能已患有该疾病,且分值越高表明风险越高。因此我们强烈建议去医院进行相应检查并听从医生建议。

注意:本检测目前尚不属于医疗诊断,疾病分值作为提示,低分值不代表完全没有疾病,只表示风险较低,也可能存在一定的未检出。高分值只表示存在很大疾病风险,疾病的确诊和精确诊断需要通过进一步的医疗检查确认。

说到这里,可能有人对以上这个0.3,0.5…这些风险值有所不解,风险值是你们自己确定的吗?如何计算得出这个值的呢?有参考依据吗?

这里我们来了解一下风险值的计算。

通过模型的构建和大规模人群队列的测试和学习,现在大概已经有几十种病,我们可以比较好的通过菌的构成,来预测到底有没有这个疾病。虽然现在它还做不到直接确诊,但它可以起到一个很好的提示作用,以及对病程进展的评估。

那么,具体哪些方面的疾病跟菌群有重要的关系,并且能够用菌群来预测和评估呢?

消化系统疾病

首先当然是消化道疾病,这很好理解,因为菌群本身就在消化道环境内。像肠炎,就包括克罗恩病,溃疡性结肠炎之类的,还有消化性的腹痛、腹胀这些问题,可能是由于菌群的特征变化造成。

炎症性肠病中的菌群失调

详见:炎症性肠病一文

还有过敏性腹泻,有人可能对一些食物过敏,吃完之后会导致一些腹泻,菌群特征变化很明显,包括甚至一些肠道病毒的感染,比如说诺如病毒、轮状病毒的感染。它也会体现出非常特定的菌群变化特征

在肠道菌群检测报告中,这类疾病风险呈现如下:

上图样本可以看到胃病有中等发现,其备注信息里有填:胃痛,可能要开始注意这方面的疾病隐患,通过饮食等调理一段时间,或前往医院就诊。

★ 胃癌

胃部更严重一点的疾病就是胃癌,胃癌与肠道菌群之间也有很大关系,最近,在“谷禾开放基金项目”中,也有相关论文也已发表。

肠道菌群区分胃癌患者和健康人方面具有高度的敏感性和特异性,表明肠道微生物群是胃癌诊断的潜在无创工具

胃炎与胃癌具有某些微生物群特征,化疗降低了胃癌患者的微生物丰度和多样性乳酸杆菌Lactobacillus巨球菌Megasphaera,是胃癌的预测标志物

★ 结直肠癌

现在已经有多项研究表明,通过菌群可以做一个很好的标志物。虽然做不到所有的结直肠癌患者都能够被检出,但是最终的准确率相对来说还是挺的,甚至比一些,包括肿瘤标注可能还要更高一些。

我们现在大概能做到70%多的肿瘤患者是能被筛查出来。并且准确度其实能够到90%,作为普筛或者健康评估来说,已经是一个比较有效的标志物了。

化疗与手术大幅降低风险分值,但仍比健康人高。

此外,结直肠癌会经历从息肉到腺瘤到癌症多个阶段,应结合年龄和家族史判断息肉和结直肠癌。

肝胆类疾病

肝脏类疾病,比如说非酒精性脂肪肝跟肠道菌群有相当大的关系。

不同肝病有不同的菌群特征,尤其是脂肪肝的严重程度,肝功能异常的严重程度。

扩展阅读:深度解析 | 肠道菌群与慢性肝病,肝癌

因为菌群会产生大量的刺激代谢物,这些代谢物本身可能会加重肝脏的负担,并且诱发一些肝脏的疾病,但反过来肝脏的代谢能力的减弱和一些慢性肝脏疾病进展又会反映在菌群的构成上,所以它们是相互的。当然也可以用菌群的构成来反映具体肝病的特征。

由于不同阶段肝功能异常,脂肪肝等情况都统一归类在肝病这个大类,因此目前还无法判断确切的疾病分类,后续如果有更多细分疾病的样本用于建模,报告也会随之迭代更新。

代谢类疾病

代谢类疾病,比如糖尿病,肥胖等,都与肠道菌群有密切关联。

★ 2型糖尿病

2型糖尿病的发病率越来越高,也有更多人开始关注菌群与2型糖尿病的关系。很多文献都有报道它们之间的关联性。

2型糖尿病人群中个体微生物群的差异

Cunningham A L et al., Gut Pathog, 2021

在2型糖尿病患者普遍具有相对高丰度的特定属:Blautia、Coprococcus、Sporobacter、Abiotrophia、Peptostreptococcus、Parasutterella、Collinsella

2型糖尿病患者中,产生丁酸菌特别缺乏,特别是梭菌目,包括:

Ruminococcus、Subdoligranulum,Eubacterium rectale、Faecali prausnitzii、Roseburia intestinalis 、

Roseburia inulinivorans

详见: 2型糖尿病如何做到可防可控?肠道菌群发挥重要作用

通过肠道菌群检测,一方面健康人群可以查看是否有患病风险,另一方面如果已经患病人群,也可以查看菌群是否异常,推测是否是因菌群显著变化导致的,从而能进行更有针对性的干预。

肠道菌群检测报告中疾病风险预测如下:

2型糖尿病的检出率相对较高,可以达到95%以上,准确的也较高,可以预测早期糖尿病风险

★ 肥胖

目前已有很多关于肠道菌群和肥胖之间关系的研究。

人体摄入大量营养素、肠道菌群与肥胖的关系

↑, 增加;↓,减少;NA,不可用;第三列:营养物质和/或饮食基质与肠道微生物群之间的关系

有人说,为什么我们的肠道菌群报告没有判别测试者是否肥胖?

首先,肥胖不肥胖这个症状是肉眼可见的,也就是说测试者自身已经了解,这种情况下用模型来判别没有意义。

而我们更希望通过肠道菌群检测来可以告诉你,可能是什么因素造成的肥胖,饮食结构的,还是某些菌属代谢问题。

通过菌群知道营养构成,以及是否存在一些特定代谢菌的异常,比如说Akk菌,它是一种在一定程度上帮助减肥的菌群。

如果在你的肠道内该菌特别少,那么可能同样减肥,控制饮食,别人一个月假设瘦十斤,你就不一定能达到这个效果。这些都是菌群可以提供的一些信息。

在肠道菌群检测报告中,会列出肥胖正负相关菌群,及其是否超标。

同理,其他各类肉眼可见的症状(包括腹泻、便秘、腹胀、过敏、皮肤状况等)正负相关菌群都会在报告中呈现,此处就不一一列举。

神经系统疾病

听起来神经系统好像没什么关系,但实际上很多肠道菌群能代谢产生大量神经递质及其他代谢产物。

肠道菌群会影响HPA轴的发育,该轴调节压力反应并参与皮质醇的释放。在抑郁和长期处于压力下的人中,HPA轴可能失调,导致过量的皮质醇(一种压力激素)被循环。

详见:深度解读 | 肠道菌群和中枢神经系统的关系

肠道菌群的部分代谢物质也会通过免疫系统影响神经系统。促炎性细胞因子的失衡可导致慢性炎症和自身免疫性疾病,通常与抑郁症同时发生

通过肠道菌群检测,可以了解体内血清素水平及激素水平,同时也可以了解神经系统相关疾病风险,包括自闭症,抑郁症,阿尔兹海默症等。

肺部疾病

宿主,微生物组和环境之间的三重相互作用在健康功能中维持了肺稳态。

Liu NN, et al., NPJ Precis Oncol. 2020

在大量的临床样本数据当中可以发现,肺部感染,包括社区性肺炎,慢性阻塞性肺疾病,通过血氧浓度和全身的免疫反应,一定程度上是可以反映在肠道菌群上

另外像肺部的感染,比如说在肺炎链球菌之类的感染中,肺部的病原菌可以通过痰或者是呼吸进入到肠道,所以我们在肠道当中是能检测到这些肺部的感染菌,并且随着其严重程度和感染进程,菌群的丰度会越来越高。

肠道菌群检测报告中也有对肺部相关疾病风险提示。

免疫疾病

肺部感染会出现咳嗽等症状,但咳嗽不一定仅是肺部感染,也可能是哮喘。

★ 哮喘

在哮喘中,微生物群是导致肺和肠道之间相互作用的重要因素。肠道微生物可以影响肺部的免疫反应,而肺部刺激可以导致肠道反应。

在一项研究中,来自加拿大的三个月大婴儿哮喘高风险的粪便样本中观察到 Lachnospira, Veillonella, Faecalibacterium, Rothia显著下降。这种菌群特征在1岁时不再明显,同时伴随着粪便乙酸的减少和肝肠代谢物失调

肠道微生物对哮喘的影响部分是由细菌代谢物介导的,1岁时粪便中含有大量丁酸和丙酸的儿童,其特应性敏感性明显降低,3至6岁之间哮喘可能性较小。此外,哮喘患者的粪便中Akkermansia muciniphila 菌水平均有所降低

★ 过敏

已知的婴儿期与过敏性疾病相关的微生物群改变如下:

Diego G. Peroni et al, Front.Immunol. 2020

肠道菌群检测报告中有列出与过敏正负相关菌群,及是否超标。

< 篇幅关系,此处仅展示部分 >

08 营养代谢

菌群生长需要养分,它的食物来源取决于你的肠道,有句话叫:you are what you eat (在我们这篇文章中有详细解释它们之间的关系 深度解读 | 饮食、肠道菌群与健康)。

也就是说,你吃的食物会帮助构建你的专属菌群。有的菌擅长代谢碳水化合物,有些菌擅长代谢脂肪,所以饮食结构不同,也就是食物来源比例不同,最后会塑造不同的菌

那反过来,如果知道你的菌群的构成,就可以相对数量化的去了解你的饮食构成,包括营养摄入具体是什么样子,所以菌群很大的另外一个作用就可以反映你的营养饮食摄入状况

这部分内容在我们报告中的呈现如下:

那么这里可能又会有疑惑,以上这些数值是什么意思,如何计算的呢?

不同的细菌有不同的代谢能力,需要不同的营养物质进行繁殖。通过评估特定营养供给下的偏好菌群的比例,即可反映不同营养物质的摄入比例。所以报告中的主要营养代谢分值评估的是主要营养物质摄入的比例在人群中的分布水平

因此不会出现所有主要营养物质均高或均低的情况,也因此主要营养指标的最佳分值在70,且更关注不同营养物质的均衡性

单项营养物质的分值低于5,表明摄入比例在人群中属于最低的5%,评估为缺乏,低于15评估为偏低。

而如果某项指标达到或超过95,则表明该项可能摄入比例偏高通常对应会有其他营养成分较低。只需要针对性的增加缺乏或偏低的营养成分摄入,维持不同营养成分相对一致即达到营养均衡的目标。

为什么会出现所有的营养指标都很低?

这可能是菌群失调引起的。营养指标的评估是基于菌群构成特征和菌群代谢生成特定营养素的途径来评估的,如果菌群结构异常,将导致后续的预测失常,例如大量氨基酸都评估缺乏的情况。

这时候需要先调节菌群,等菌群指标恢复到一定水平后再次检测,评估营养指标。

09 微量元素

我们日常摄入的除了上一小节提到的宏量营养素之外,还包括微量元素和维生素等。有些维生素比如说B族维生素中有相当一部分,甚至百分之六七十需要通过肠道菌群对初始原料进行代谢之后才会产生,也就是说有些细菌会代谢我们食物中的一些成分,转换成B族维生素

而你的菌群构成代谢B族维生素的能力,会直接决定是否缺乏该类维生素。当然也有部分受基因影响,因此肠道菌群相应的基因和代谢途径的丰度水平也会直接反映这些维生素的摄入水平。

总的来说,菌群在这其中起重要作用。在我们报告中呈现如下:

微量营养元素和维生素的评估分值与主要营养物质不同,是通过调查人群的单项营养成分水平,然后寻找与该项成分异常相关的菌群基于这些菌群和代谢途径计算丰度并转换为人群分布后的值。

简单来说,报告中的微量营养元素的分值即代表该营养元素的摄入水平。

菌群检测营养状况与血液检测有什么区别吗?

通过肠道菌群评估的维生素一般反映一段周期内的维生素状况,因为肠道菌群在没有突发疾病的情况下相对稳定,受一段周期的饮食影响为主,一般是2周。B族维生素是水溶性维生素,每日摄入后会通过尿液代谢排出,通过血液检测,不同时间检测波动较大

菌群评估营养和血液检测营养趋势是一样的,在极端缺乏和极端过量是吻合的,中间档可能在数值上不是完全吻合,血液反映的营养水平比较及时。

当了解了体内的营养素和维生素是否缺乏,以及哪方面的缺乏,就可以进行有针对性地补充。菌群也是需要营养物质的,这就离不开我们的日常饮食,那么该如何补充呢?

10 个体化饮食推荐

我们的肠道菌群检测报告中有个体化饮食推荐表。

<篇幅关系,此处仅展示部分>

以上食物推荐表是怎么来的?

这是经过综合考虑疾病风险营养缺乏状况计算得到的。主要是计算每种食物的营养构成与目前营养状况匹配度,以及特定疾病需要避免的食物

该表推荐的食物分数从-100~100,排序为不推荐到强烈推荐,日常饮食可以参考这个推荐表。推荐分值,表示基于目前的菌群和营养状况对食物的推荐指数,正数分值越大,建议优先选择,同时也是对改善最有帮助;负数分值越大,并不表示不能吃,而是目前状况下不优先推荐或尽量少吃。

p.s. 如果有特殊疾病需要忌口的,优先遵医嘱。

该表包括几百种日常食物,如下图。

<个体化饮食推荐,建议用电脑查看,目前手机端展示不太美观>

对于长期调理菌群而言,饮食无疑是最主要的驱动因素之一。

下一步我们将利用更全和详细的菌群结构,食物营养,人群膳食构成以及营养数据库推出个性化膳食营养升级方案,特别会针对个别菌属的异常和失衡状况以及营养元素异常和缺乏问题。

11 饮食影响菌群检测吗?

前面章节我们知道,通过菌群可以反映你的饮食状况,那么反过来,如果你吃了一个东西,会对菌群检测造成影响吗?是不是菌群就变了,那检测就不准了?

这也是比较重要的一部分,也就是肠道菌群检测的准确性,它能允许多大范围内的变化?什么因素会影响?

其实,菌群变化算快,也不算快。饮食对菌群是有一定影响没错,但这种影响呢,一般来说是前一天的饮食会影响第二天的菌群结构的百分之十几,也就是说,假设你昨天吃大餐,大量吃肉,蛋白摄入非常高,而你之前是以碳水化合物为主的,那么第二天饮食当中,你的蛋白质相关的这部分菌的比例可能会有15%,最高到20%可能会有,但一般来说是在15%以内,会有一个波动

然而,总体的核心菌群构成,不会因为你今天一顿大餐,就直接从素食的变成肉食的菌群结构,核心菌是相对稳定的,那么多久会发生变化呢?

一般来说坚持两周,饮食结构的变化,核心菌群就会发生一个迁移改变。但两周只是一个短暂的周期,如果你两周后又换回先前的那种饮食方式,菌群也会随之改变到之前的状态。那要怎么样才能持久改变菌群呢

这个时间线可能要拉长到两个月

这是在我们的菌群干预中,很多人会遇到的一个周期性的问题。也就是如果你想有效改善菌群,至少需要两周会见到相对明显的菌群结构变化,那如果把干预延伸到持续两个月的周期,甚至是持续干预周期更长,那效果会更好

12 如何正确取样?

取样前饮食会不会造成影响?

前面我们知道,菌群会受检测前一天饮食的影响,造成15~30%的菌群改变,同样也会反映在营养状况的评估上,因此建议检测前一天尽量保持近期正常饮食,这样能更好的反映真实的营养饮食状态。

此外,如果你是在调理一段时间后再次检测,想要和上次比较的话,最好在检测前保持饮食大体相似(意思是不要突然吃和平时不一样的食物或者吃完大餐后取样)。

取样过少会怎么样?

取样不能太少,如果太少的话,可能会影响DNA提取,另外会导致一些低丰度的菌检测不到。

取样过多会怎么样?

如果说取样太少导致样本不合格可以理解,那么取样过多为什么也会有问题呢?

我们的采样管中有保存液,可以将菌群固定在采样的瞬间,但是如果取样过多的话,可能导致部分粪便无法完全溶解于粪便,这部分样不能正常保存可能会使其中的大肠杆菌等兼性厌氧菌开始在管内繁殖。

正确合格取样量(黄豆大小,约200mg,如果是稀便,反复沾取)

只需棉签沾取少量,混匀于保存液,固体粪便取样不能超过管子1/5体积(右图刻度线)。且保存液带有粪便颜色即可。(右图所示)

详见:肠道菌群取样方法

注 意 事 项

如3天内使用过抗生素类、质子泵类胃药、阿片类精神药物请停药3天后进行检测(如果长期服用某种药物,如降压、降血糖药等,不建议停药,检测反映的是用药控制的菌群和身体状况)。

感冒、腹泻或其他症状期间不影响取样,拉稀或稀便可以用棉签反复沾取粪便至取样管。

总的来说,取样虽然很重要,但也只是其中一个环节。每一个样本的结果呈现都凝聚了我们与你共同的努力。那么,从取样到结果报告呈现的那一刻,中间经历了什么?

样本之旅

在你取完样之后,把样本用快递寄到我们这里之后,它会经历提取->测序->分析->报告到你手上。下图绿色标注部分是你需要完成的。

13 展望

近年来,我国将全面健康和预防作为国家重点领域。我们致力于将信息技术(IT)与生物技术(BT)相融合,发展推动肠道菌群基因检测进入成为精准和预防医学时代下的“生命健康新基建”,尽管目前的菌群检测,包括疾病关系,算法,数据库,后端干预均在成长积累阶段,但是菌群检测正在进入大数据时代,菌群基因中蕴藏海量对人体生命和健康的重要数据,我们致力于将这些数据和实际应用相结合,最终转化为疾病预防、改善健康的有效方案。

前沿技术正在不断创新发展,报告也在迭代更新中,谷禾肠道菌群健康检测在辅助判别慢病风险、精准营养、亚健康管理、临床治疗干预中显示出其广泛的社会需求和指导价值。

你问我答

不同部位间的样本(如前段/中段/后段),检测结果差异性有多大?

答:会有不同的,不过主要反映在具体的菌种丰度上,有无这种菌的差异不大。另外慢病的评估也影响不大慢病模型中使用了高维特征丰度的变化波动对结果的影响没那么大营养和代谢部分受菌群丰度影响相对大一些,同一个人的前后两天的取样最大可能有15%左右的差异

肠道菌群在肠道内不同部位以及粪便的不同部分其实都存在差异,含水量、连续几餐的饮食构成和排便周期的长度都会对菌群各个菌种的丰度造成影响。单纯从绝对丰度上来看是一个动态变化的过程,各个菌属在继承之前的构成比例的情况下因各种因素的变化增长或降低。因此并不存在一个绝对的菌群构成以及完全准确的单一指标。肠道菌群检测获取的丰度含量本身信息量很大,但是稳定性和一致性并不很高。

更高层级的菌群相对比例顺序则相对稳定一些,之后具体包含的菌种也相对稳定。目前我们使用的疾病预测模型主要通过高维的菌群结构特征,并不单纯依靠每个菌的绝对丰度来评估,稳定性很高。针对一些特定的病原菌或问题菌,需要通过与人群范围比较,在正常范围内并无问题。

日常多添加有益菌或益生菌的酸奶,可以改善肠道菌群状况吗?

答: 大范围人群调查显示添加益生菌的酸奶可以改善肠道健康,但效应因人和状态而定。总体而言我们支持服用益生菌酸奶有益,但需要注意酸奶饮料可能包含果糖,游离糖等,其作用仍然非常有限

同一份样本,不同批次的实验环节如上机测序,差异有多大?这种差异率是否有一个范围呢?

答:不同批次上机影响很小,菌群数据相关性不低于98%。我们会在每轮设置一个阳性对照,一个上轮检测样本对照,一个阴性对照。评估污染,轮次比对。理论上不同的实验室,扩增引物,方法都会带来对不同菌丰度的系统误差,我们尽力保证本实验体系下各个轮次之间最小化的实验误差。另外使用的引物是经过大量验证的标准化引物。

实际患者建不建议送检,我们这个产品主要针对健康体检,还是也可以辅助诊断和预后治疗呢?

答:产品主要针对健康体检,如果临床诊断判断可能菌群异常或疾病症状与菌群相关,产品可以通过菌群检测提供临床参考,用于辅助诊断和治疗方案的评估。产品关于疾病和菌群相关指标的评估仅限于菌群相关方面,以临床诊断为准,不适用于单独使用产品进行疾病诊断。

抗生素是如何影响菌群的,菌群的敏感性和抗性基因是什么?

答:广谱抗生素会杀死细菌,但是部分细菌在抗生素选择或滥用的情况下会在抗生素靶点基因产生突变携带耐药基因,从而对特定抗生素产生耐药。不同菌目前的耐药菌比例以及携带的耐药基因水平不同,对应的抗生素耐药水平和种类也有不同

有在吃富含某种事物或者相关营养素,为什么报告显示缺乏?

答:营养指标的评估是基于菌群构成特征菌群代谢生成特定营养素的途径来评估的,直接的营养素补充会反映在相关菌群构成上,但部分营养素因为吸收部位不同以及菌群代谢途径上下游的影响,预测可能有一定差异。另外菌群构成异常的情况也会导致营养指标预测失常,如大量氨基酸都评估缺乏的情况。

有人说长期服用益生菌,会让肠道自己产生的益生菌的能力减弱或者可以说是肠道自主平衡的能力减弱,不能长期服用。这种说法是否有依据?长期服用一种益生菌,也容易产生耐药性,那么是否建议定期更换或者调整益生菌的菌种和数量呢?

答:持续服用单一或特定组合的益生菌确实会存在效力减退的情况,主要是菌群具有适应性,如果不配合生活方式和饮食结构的改变,会较快失效。可以根据菌群检测结果调整益生菌的方案。

样品的稳定性对于那些数据的影响是比较大的哪些是影响比较小的?

答:越是直接和具体菌相关的指标变化越快越大,和菌群结构相关的指标,比如一些慢病风险还有总体饮食结构一类的变化较稳定

从波动性排序来看,具体菌丰度>多样性>微量营养(锌 铁 氨基酸 维生素)>消化道疾病风险评估 (受当前状态影响较大)>肠龄>宏量营养素(碳水 蛋白 脂肪 纤维素 乳制品)>抗生素水平 >菌属是否出现>其他慢病风险

中大龄儿童小孩检测到自闭症风险高,如何解读?

答:肠道菌群在1-3岁期间主要是菌群发育滞后会影响神经发育和营养3~6岁左右菌群参与的神经递质代谢异常加剧自闭症的程度,但这个年龄段已有的神经发育滞后不光靠菌群改善就能解决了。

所以如果是0~2岁的如果这个风险值较高,不管有没有症状都建议改善菌群。如果是3~6岁甚至6岁以上,如果就风险值高没有相应的神经或行为异常,就问题不大,可能是菌群代谢构成不太好,不会导致自闭症的。如果有症状那改善菌群有助于改善症状。

肠道菌群平衡,为何多样性指数是低的?

答:菌群平衡和多样性指数是2个不同指标;

多样性仅仅评估肠道菌群的种类数量和丰度分布具体是有益和有害无关。多样性主要与饮食摄入,药物如抗生素类以及疾病状态有关。

菌群平衡对应的异常称为肠道菌群失调,临床上有I度失调和更严重的II度失调。大便常规检查是通过显微镜下观察统计染色细菌中杆菌和球菌以及革兰氏阴性和阳性菌的比值是否超标来判别的。本报告同时提供了另一评估算法,通过有益菌/有害菌的总体情况来评估菌群平衡状态,低于2为重度失衡,低于5为失衡,同时分值也提示菌群平衡水平,越高越正常

菌群失衡如何调整?

从菌群失衡的评估角度来看,首先就是快速增加有益菌特别是双歧杆菌的丰度可有效改善该项指标。因此临床上通常提供多联的益生菌制剂来快速补充益生菌,可以短期有效改善菌群平衡比例

菌群平衡和多样性分值都高的,但是肠道年龄预测比实际大,年龄预测模型是不参考多样性和平衡性参数的?

答:肠道年龄是靠机器学习人群大队列做的,不是只根据菌群平衡和多样性,每个年龄段都有核心和标致的菌群特征,比如婴儿的双歧杆菌,老年人瘤胃球菌等,这几个指标都是表征菌群的状态和健康的。

END

声明

谷禾专注于提供肠道菌群基因检测和基于此的健康评估咨询,肠道菌群对人体健康的影响和关联性已被广泛研究和认可,但基于对健康的慎重和法规,谷禾重申其提供的肠道菌群基因检测目前不用于临床疾病诊断,仅作为菌群状况构成检测和健康评估以及基于菌群的科研。分析报告中疾病风险和健康相关评估来自于公开研究数据和谷禾构建的大人群队列数据分析的预测评估结果,涉及临床诊断和医疗建议请遵照临床诊断和医生的医嘱。由于技术进步和样本数据不断积累,报告中可能存在尚未完全涵盖的因素或状况,不可避免的存在一定概率部分风险未被完全检出的情况。

1
客服