技术

谷禾健康君验—肠道菌群(肠道微生物)临床版

谷禾健康

肠道菌群检测临床版(16S rRNA测序),作为谷禾健康最早推向市场、历经十余年打磨的经典产品,凭借其成本效益、高效性与成熟度,为临床端肠道微生态评估以及诸多科研项目基线建立,提供了坚实、可靠且极具价值的数据基础(注:仅用于菌群科学研究和辅助参考,不直接用于临床诊断 )。

临床版对报告版式进行简化,以更符合临床检验的形式呈现分析结果,便于临床医生快速查看和判断异常。

临床版是主要面向临床和医疗机构的版本,主要用于临床科室已有明确症状或诊断,需要对肠道菌群进行进一步分析以为临床提供辅助判断。

该版本减少了基本介绍和文字说明,并对部分指标的异常判定范围和计算方式进行调整,更加适应临床需求。

报告内容截图:

谷禾健康君验—宠物肠道菌群(肠道微生物)精准检测

谷禾健康


随着“它经济”的蓬勃发展和“科学养宠”理念的深入人心,宠物已成为家庭的重要成员。然而,面对“毛孩子”们无法言说的病痛,如反复腹泻、顽固皮肤病、食欲不振、呕吐等,传统兽医诊断往往面临挑战。

宠物健康市场现状

从宠物医院的实际经营来看,慢性疾病正成为他们面临的核心挑战。慢性肾病、老年痴呆、精神类疾病等病症不仅治疗费用昂贵,而且现有手段往往无法覆盖,特别是小型诊所更是心有余而力不足。

在与许多B端合作伙伴的深度交流中我们发现

宠物腹泻,肾病以及其他疾病等正在增加

后期医疗费用高昂让宠物主人无能为力

异常行为严重影响生活质量和主人养宠体验

情感难舍却不得不放弃…

因此,迫切需要一种更加

科学、经济、精准的健康管理方式

既能降低医疗成本

又能提供个性化的健康方案

还能避免过度医疗

这就需要我们从根本上

重新思考宠物健康管理的方法论

从”治疗导向“转向”预防导向

✲✲✲✲✲✲✲✲✲✲✲✲✲✲✲✲✲✲✲✲✲✲✲✲✲✲✲✲✲✲

谷禾凭借在人类健康领域积累的深厚微生物组学经验,战略性延伸至动物医学领域,推出宠物菌群精准检测服务。

我们致力于解码宠物肠道微生态的奥秘,为兽医临床、宠物营养和家庭养护提供科学依据,开启宠物健康管理的精准化新时代。

从人类微生态到宠物微生态,不是简单的复制,而是技术能力的升维应用。人类肠道微生态的复杂性研究为我们提供了强大的算法基础和数据分析能力,以及多年来在宠物菌群科研中的持续投入,这些经验在宠物领域的应用中展现出了独特的技术优势。

研究表明,宠物肠道菌群不仅影响消化吸收功能,更与免疫调节、神经系统、皮肤健康等多个生理系统密切相关,成为宠物整体健康状况的重要晴雨表。

谷禾正有序推进构建涵盖不同品种、年龄、健康状况犬猫的肠道菌群数据库,结合最新的机器学习算法,实现对宠物肠道微生态健康状况和营养进行精准评估(注:仅用于菌群科学研究和辅助参考,不直接用于临床诊断 )。

谷禾宠物菌群报告主要内容

宠物菌群报告展示采用更温馨活泼的配色,通过可视化图表和情感化设计,让复杂数据更直观,帮助主人轻松了解爱宠健康。

谷禾宠物菌群检测报告中包括菌群评估(整体指标)、肠道基础功能评估(屏障功能、炎症水平、代谢状态)、菌群代谢物评估(短链脂肪酸等)、炎症免疫评估(促炎、抗炎等指标)、营养饮食评估(维生素、微量元素)等。

症状相关菌群分析,包括腹泻、呕吐、过敏等。

菌群代谢物评估(短链脂肪酸等)。

从多维度全面评估宠物肠道健康状况,为宠物主人提供科学的健康管理依据和个性化调理建议。


适用场景

  • 适用于全年龄段猫、犬;
  • 尤其是消化系统异常如慢性腹泻、便秘、呕吐等;
  • 生长发育与代谢困扰,例如营养不良、肥胖症慢性肾病、食物过敏、免疫力低下导致的反复感染;
  • 皮肤健康问题如 特异性皮炎 等;
  • 接受抗生素治疗、或术后康复期宠物等

谷禾健康君验—阴道菌群(阴道微生物)精准检测

谷禾健康



高水平期刊引领妇科微生态


在肠道菌群检测系列产品成熟之后,谷禾健康将深耕多年的微生物组学技术平台,延伸至关乎女性全生命周期健康的另一核心领域——阴道微生态。



还包括子宫颈沙眼衣原体、HPV、HSV、EB病毒、巨细胞病毒等。

谷禾阴道菌群检测主要报告

谷禾阴道菌群检测报告引入科学前沿的菌群状态分型(CST)概念,将复杂的菌群构成归纳为几种易于理解的健康状态类型。

例如,以卷曲乳杆菌为主的CST-I型代表健康的稳定状态,而以加德纳菌等多种厌氧菌为主的CST-IV型则与细菌性阴道病高度相关。这为临床判断和干预效果评估提供了科学支持。

谷禾阴道菌群检测报告中包括阴道菌群总体评估、CST分型、致病菌表(细菌性阴道病,需氧菌性阴道炎,外阴念珠菌病等)、列出异常菌群及相关说明,菌群详细构成等(注:仅用于菌群科学研究和辅助参考,不直接用于临床诊断)。

检测意义

阴道菌群检测让我们能够更全面地了解阴道微生物组的组成及其变化,以及它是如何随着时间的推移或对各种因素(如环境、激素变化、性活动和抗生素使用等)的反应而变化的。


适用场景

  • 适用于成年女性,围绝经期女性,有性生活女性;
  • 有妇科相关健康症状,例如反复性阴道炎,外阴瘙痒、灼痛,白带异常,异味等;
  • 生育健康困扰,例如不孕不育,流产、早产等;

注:本产品可辅助评估和筛查,不用作临床诊断。

05

谷禾健康君验—肠道菌群(肠道微生物)精准检测 – Plus版

谷禾健康

此图像的alt属性为空;文件名为image.php

谷禾16S+tNGS技术结合了超多重PCR和高通量测序的优势,旨在提供比传统16S rRNA测序和宏基因组测序更优、更全面的病原体及耐药基因检测方案。

传统16S + 病原体精准分型 = 全新升级

它在保留16S报告的基础上

以接近16S的成本和周期

用靶向测序技术在原16S的基础上

增加了125 种消化道病原体的检测

还包括耐药基因和毒力基因等

如幽门螺杆菌、大肠杆菌、艰难梭菌分型

弥补了传统16S无法检测

非细菌/古菌病原体的不足

这是一款突破传统16S检测瓶颈而生的产品

此图像的alt属性为空;文件名为image.php
此图像的alt属性为空;文件名为image.php

谷禾16S+tNGS产品技术攻关

值得一提的是,谷禾在tNGS技术的研发道路上并非一帆风顺。这项看似成熟的技术,在不同应用场景下却面临着截然不同的挑战难度。

tNGS对血液和上呼吸道样本检测较简单,因其主要含病原体。但在消化道特别是粪便样本检测时,技术难度大幅增加。

经过无数次的实验优化和迭代

我们最终突破了这一技术瓶颈

为大家带来真正可靠的

消化道病原体检测解决方案

谷禾16S+tNGS产品特点

弥补16S检测技术边界

实现靶向病原体精准检测

此图像的alt属性为空;文件名为image.php
此图像的alt属性为空;文件名为image.php
此图像的alt属性为空;文件名为image.php

谷禾16S+tNGS报告内容

谷禾16S+tNGS报告内容涵盖所有16S报告的内容,即包括健康总分评估、慢病风险预警、肠道屏障及代谢物、神经递质分析、个性化营养评估等。此外还包括常见消化道病原体(注:仅用于菌群科学研究和辅助参考,不直接用于临床诊断)。

例如:

细菌病原体

此图像的alt属性为空;文件名为image.php

病毒

此图像的alt属性为空;文件名为image.php

真菌、寄生虫、其他病原体

此图像的alt属性为空;文件名为image.php

毒力基因

此图像的alt属性为空;文件名为image.php

耐药基因

此图像的alt属性为空;文件名为image.php

也包括相关病原微生物的解释

此图像的alt属性为空;文件名为image.php

检测价值:从预警到精准用药

此图像的alt属性为空;文件名为image.php

例如,通过检测幽门螺杆菌毒力基因组合,可判断是否需立即治疗,避免对弱毒株患者的不必要抗生素使用。强毒株感染会损伤胃黏膜,增加胃炎和溃疡风险,早期预警能在胃黏膜不可逆损伤前提供治疗窗口期。

注: 由于该技术是检测粪便中的幽门螺杆菌,当浓度低于检测下限(50 copies/mL)时,可能出现假阴性结果。因此,对于临床症状明显但检测结果为阴性的患者,建议结合其他检测方法。

技术优势

此图像的alt属性为空;文件名为image.php

适 用 场 景

  • 消化道感染患者已知或疑似患有消化道感染的患者,需要明确病原体和耐药情况。
  • 腹部检查异常患者存在腹痛、腹泻、腹部压痛及反跳痛、腹肌紧张等临床表现的患者。
  • 免疫力低下反复感染人群由于免疫系统功能下降而容易受各种病原体侵袭的人群,包括老年人、慢性疾病患者、长期服用免疫抑制剂的患者等。
  • 不明原因发热患者发热原因不明,伴有呕吐、腹痛、腹泻等症状,需要全面排查消化道病原体。
  • 特殊病原体感染风险人群如幽门螺杆菌、艰难梭菌、大肠杆菌等特定病原体感染高风险人群。
  • 关注特定消化道病原体人群除了细菌之外,还关注其他消化道病原体包括真菌、病毒、寄生虫的人群。


开始写作或按/来选择区块

如何判断和正确评价疾病模型预测的精准性?

谷禾健康

目前随着高通量测序,微生物以及代谢、蛋白组学和高精度影像学等快速的发展,有关人体疾病健康相关的海量数据正在不断产生,依托各种算法尤其AI的算法等,涌现出很多优秀的“模型”用于预测人体疾病以及健康相关的辅助诊断或筛查

谷禾在人体肠道菌群检测领域深耕多年,积累了大量肠道菌群和个体健康信息数据,并运用建模方法结合人工智能等算法构建了多种疾病和营养预测模型

对于不是从事专业的人员或大众来说,什么样的预测模型是准确的?如何评价一个模型的好坏?里面涉及比较多的概念和知识,今天谷禾和大家简单聊下这方面的内容。

首先大家评估下:

对于肿瘤筛查,以一个人群发病率1%的肿瘤为例:

模型A的检出率50%,假阳性为1%

模型B的检出率为90%,但是假阳性是10%

请问哪个检测模型作为肿瘤筛查类产品更好 ?

换句话说就是回答:“鉴于测试结果为阳性,该患者患有这种疾病的可能性有多大?

为了回答上面问题,我们需要了解和正确认识以下模型评价参数/指标:

• 该测试的阳性预测值(PPV)是多少?——返回阳性结果的人实际上患有疾病的概率是多少?

• 该测试的阴性预测值(NPV)是多少? ——返回阴性结果的人实际上是健康的概率是多少?

• 测试的灵敏度如何?——它正确地将多少个患病个体识别为患病?

• 测试的特异性是什么?——它正确地将多少个健康个体识别为健康个体?

阳性预测值(PPV)

要回答这个问题,我们需要计算两个模型的阳性预测值(Positive Predictive Value, PPV)。然后一步步分析:

▸ 什么是阳性预测值(PPV)?

阳性预测值(PPV)是样本检测阳性为真阳性的概率值。

发病率较低时的阳性预测值(PPV)

模型A

人群发病率:1%

检出率:50%

假阳性率:1%

模型B

人群发病率:1%

检出率:90%

假阳性率:10%

接下来使用贝叶斯定理来计算每个模型的阳性预测值

对于模型A:

真阳性率 = 1% × 50% = 0.5%

假阳性率 = 99% × 1% = 0.99%

总阳性结果 = 真阳性 + 假阳性 = 0.5% + 0.99% = 1.49%

阳性预测值(PPV) = 真阳性 ÷ 总阳性结果 = 0.5% ÷ 1.49% ≈ 33.6%

对于模型B:

真阳性率 = 1% × 90% = 0.9%

假阳性率 = 99% × 10% = 9.9%

总阳性结果 = 真阳性 + 假阳性 = 0.9% + 9.9% = 10.8%

阳性预测值(PPV) = 真阳性 ÷ 总阳性结果 = 0.9% ÷ 10.8% ≈ 8.3%

模型A的PPV为33.6%,而模型B的PPV仅为8.3%。

因此,我们可以看到尽管模型B的检出率更高(90%vs50%),但其阳性预测值(PPV)显著低于模型A。

★ 低发病率人群中,高特异性比高敏感性更重要

这意味着:

模型A的阳性结果更可靠

模型A的假阳性风险更低

模型A在这种低发病率的情况下,作为肿瘤筛查产品更好。

这里对于我们应用的启示:在低发病率的人群中,高特异性(低假阳性率)比高敏感性(高检出率)更重要。选择产品时,不仅要看检出率,还要关注假阳性率和阳性预测值。

发病率较高的阳性预测值(PPV)

可能接下来有人会问,这个问题中以肿瘤发病率比较低的例子举例,那对于发病率比较高的疾病,比如心脑血管、糖尿病等如何?

接下来,我们继续举例:

让我们用同样的方法计算发病率为20%时的阳性预测值(PPV)。

模型A

人群发病率:20%

检出率:50%

假阳性率:1%

模型B

人群发病率:20%

检出率:90%

假阳性率:10%

一样的计算

对于模型A:

真阳性率 = 20% × 50% = 10%

假阳性率 = 80% × 1% = 0.8%

总阳性结果 = 真阳性 + 假阳性 = 10% + 0.8% = 10.8%

阳性预测值(PPV) = 真阳性 ÷ 总阳性结果 = 10% ÷ 10.8% ≈ 92.6%

对于模型B:

真阳性率 = 20% × 90% = 18%

假阳性率 = 80% × 10% = 8%

总阳性结果 = 真阳性 + 假阳性 = 18% + 8% = 26%

阳性预测值(PPV) = 真阳性 ÷ 总阳性结果 = 18% ÷ 26% ≈ 69.2%

可以看到当发病率提高到20%时,情况发生了显著变化

模型A的PPV提高到92.6%

模型B的PPV提高到69.2%

对比之前1%发病率的情况:

模型A:PPV从33.6%提高到92.6%

模型B:PPV从8.3%提高到69.2%

可以发现随着发病率的提高,两个模型的阳性预测值都大幅提升。但是模型A仍然保持更高的PPV,但优势不如低发病率时那么明显。

★ 发病率越高,阳性预测值越高

发病率越高,阳性预测值越高,这是因为真阳性的比例增加。

因此在高发病率的人群中,两种模型的检测价值都显著提高。但模型A仍然是更好的选择,因为其假阳性率更低

评估不同检测模型和询问检测准确率时,要综合考虑不同疾病的发病率、检出率和假阳性率。

对于要检出阳性结果而言,这个例子就很好地说明了发病率检测结果解读的重要影响,也体现了贝叶斯定理在医学诊断中的应用。

阳性预测值(PPV)具有多维意义,对于不同视角的人群可能意义不同:

➤ 政府视角下的PPV

⑴公共卫生决策基础

资源分配效率:高PPV意味着确诊投入的资源浪费更少,每发现一个真实病例的成本更低;

筛查项目评估:决定是否推行大规模筛查项目时,PPV是核心考量因素之一;

卫生经济学分析:假阳性导致的后续检查、治疗和心理干预成本需纳入卫生政策评估。

⑵监管与标准制定

差异化监管:对不同严重程度疾病的筛查产品可设置不同PPV要求;

强制信息披露:要求厂商在不同疾病流行率下公开产品的PPV值;

患者保护:防止低PPV产品导致过度医疗和不必要的医源性伤害。

➤  受检者视角下的PPV

⑴个人决策与心理影响

决策参考价值:“我的阳性结果有多可靠?”—这是患者最关心的问题;

心理负担差异:假阳性可能导致严重心理压力,尤其对严重疾病筛查;

后续检查意愿:了解PPV有助于患者决定是否及时进行确诊检查。

⑵风险认知与理解

个体化解读:同一PPV值对不同风险人群的意义不同;

检前概率影响:有症状个体的PPV通常高于无症状筛查人群;

教育需求:医生需帮助患者理解PPV与个人情况的关联。

➤  产品评估的情境差异

⑴临床应用场景分析

筛查工具:可接受相对较低PPV,但应有明确后续路径;

确诊工具:需要更高PPV,减少误诊风险;

监测工具:对症状性疾病监测,PPV要求可能介于两者之间。

⑵疾病特性影响

致命但可治疗疾病:可接受较低PPV,以高灵敏度优先;

慢性管理疾病:需较高PPV避免不必要长期干预;

高耻感疾病:需更高PPV避免标签化伤害。

⑶社会经济环境考量

医疗资源丰富地区:可能更关注灵敏度,接受较低PPV;

资源有限环境:高PPV更为重要,避免资源浪费;

支付方式影响:商业保险vs自费vs政府支付下对PPV的需求不同。

➤  PPV优化与应用建议

⑴预测模型调整

风险分层应用:根据人群特征调整决策阈值;

多指标综合评估:结合阴性预测值(NPV)、阳性/阴性似然比(LR+/LR-)综合评估;

贝叶斯思维应用:根据先验概率(患病率)调整PPV期望。

⑵实际应用最佳实践

透明沟通:向受检者清晰解释结果可靠性;

分级报告:提供风险概率而非简单阳性/阴性结果;

智能决策支持:AI辅助工具结合临床特征提供个性化PPV估计。

阴性预测值(NPV)

那么下面我们看下什么是阴性预测值(NPV),简言之就是把健康人检测为健康的概率

阳性预测值(PPV)是样本检测阳性为真阳性的概率值,而阴性预测值(NPV)是样本检测真阴性的概率值

阴性预测值(NPV) =(真阴性数量)/(真阴性数量+假阴性数量)

例如你有一个600人的样本量,根据有效性,假设你知道肯定患有这种疾病的样本(480)或没有这种疾病的个体样本(120)。

测试后,将结果与已知的疾病状态进行比较,发现:

真阳性(测试阳性和正确阳性)= 480

假阳性(试验阳性但实际为阴性)= 15

真阴性(测试阴性和真阴性)= 100

假阴性(试验阴性,但实际为阳性)=5

我们可以计算PPV和NPV如下:

阳性预测值(PPV)=480/(480+15)≈0.97(97%)

阴性预测值(NPV)=100/(100+5)≈0.95(95%)

因此,如果检测结果为阳性,则有97%的机会是正确的,如果结果为阴性,则有95%的机会是正确的。

拓展:什么是假阳性和假阴性?

假阳性:健康人被错误地识别为患病;

假阴性:病人被错误地认为是健康;

真阳性:患病的个体已被正确识别为患有疾病;

真阴性:未患有疾病的个体已被正确诊断为未患有疾病。

或:

真阳性:患者患有疾病且检测呈阳性;

假阳性:患者没有疾病,但检测呈阳性;

真阴性:患者没有疾病,检测结果为阴性;

假阴性:患者患有疾病,但检测结果为阴性。

敏感性和特异性

敏感性

敏感性(Sensitivity)是测试正确识别疾病患者的能力,也称为真阳性率(TPR),即被正确识别为患有疾病的患者的百分比。

敏感性的计算公式为:

敏感性 = 真阳性数 / (真阳性数 + 假阴性数)

或者表示为:

敏感性 = TP / (TP+FN)

其中:

TP (True Positive): 真阳性,即测试正确地将患病者判断为阳性的数量;

FN (False Negative): 假阴性,即测试错误地将患病者判断为阴性的数量。

从另一个角度看,敏感性也可以表示为:

敏感性 = 真阳性率 = 1 – 假阴性率

敏感性的值范围在0到1之间,通常以百分比表示。例如,敏感性为0.95或95%意味着测试能够正确识别95%的实际患病者。

★ 高敏感性特别适用排除诊断

在医学诊断中,高敏感性的测试特别适用于排除诊断(rule-out test),因为如果一个高敏感性测试的结果为阴性,则疾病存在的可能性很小(即”阴性结果可靠”)。

例如:表述中敏感性为100%的检测可正确识别所有患者,敏感性为80%的检测可检出80%的疾病患者(真阳性),但20%的疾病患者未被检测到(假阴性)。

当检测到非常严重的感染类型时,例如前两年进行的COVID-19大流行,高敏感性对于适当的管理和治疗非常重要。COVID-19 IgG/IgM诊断测试是一种筛查COVID-19的测试,据报道敏感性为95%。

当测试用于识别严重但可治疗的疾病(例如宫颈癌)时,高敏感性显然很重要。通过宫颈涂片检测筛查女性人群是一项敏感的检测。然而,它不是很特异,很大一部分宫颈涂片阳性的女性继续进行阴道镜检查,最终被发现没有潜在的病变。

特异性

临床试验的特异性是指检测正确识别无病患者的能力。

特异性的计算公式是:

特异性 = 真阴性数 /(真阴性数 + 假阳性数)

Specificity = TN/(TN + FP)

其中:

TN (True Negative): 真阴性,即正确识别出的健康者数量

FP (False Positive): 假阳性,即错误地将健康者判断为患病的数量

特异性也可以表示为: 特异性 = 正确识别的健康者数/所有实际健康者总数

或: 特异性 = 真阴性率 = 1 – 假阳性率

例如:假设一项检测在100名实际健康者中:

95人被正确判断为阴性(TN = 95)

5人被错误判断为阳性(FP = 5)

特异性 = 95/(95 + 5) = 95/100 = 0.95 或 95%

特异性表明该检测能够正确识别95%的健康者,有5%的健康者被误判为患病。

TIPs:

一种具有高敏感性但低特异性的测试会导致许多没有疾病的患者被告知他们有疾病的可能性,使受检者要接受进一步的测试。理想情况下,测试应该是100%准确的,但这是一个不切实际的场景。或者,对患者进行高敏感性和低特异性的测试,然后进行低敏感性和高特异性的第二次测试,可以识别所有假阳性和假阴性。

这些参数的临床价值和应用差异

在考虑检测对临床医生的价值时,阳性和阴性预测值很有用。它们取决于该疾病在目标人群中的患病率

但是灵敏度(sensitivity)、特异性(specificity)这两术语对于理解和评估模型的效用也至关重要。敏感性和特异性是用于评估临床试验的术语,它们与测试的目标人群无关。

★ 敏感性和特异性取决于检测阳性的临界值

检测的敏感性和特异性取决于高于或低于检测阳性的临界值。一般来说,敏感性越高,特异性越低,反之亦然。

★ 阳性和阴性预测值取决于被测人群和患病率

与敏感性和特异性不同,阳性预测值(PPV)和阴性预测值(NPV)取决于被测人群,并受疾病患病率的影响。

例如以下示例:使用抗核抗体在普通人群中筛查系统性红斑狼疮(SLE)的PPV较低,因为它产生的假阳性数量很高。然而,如果患者有SLE的迹象(例如 颊部潮红和关节疼痛),测试的PPV会增加,因为患者所在的人群不同(从SLE患病率低的一般人群到患病率高得多的临床可疑人群)。

另一个举例也可以考虑产后出现呼吸困难的女性,其中一种鉴别诊断是肺栓塞。在该患者群体中,D-二聚体检测几乎肯定会升高;因此,该测试的肺栓塞PPV较低。然而,肺栓塞的NPV很高,因为低D-二聚体不太可能与肺栓塞相关

★ 患病率高时,PPV和NPV准确性更高

阳性预测值(PPV)和阴性预测值(NPV)对疾病患病率的依赖性可以用数字来说明:例如,在一个4000人的人群中,病人和健康人各占一半。该病症筛查试验的灵敏度和特异性均为99%。因此,筛查结果将产生1980个真阳性和1980个真阴性,其中20名健康人被误判为阳性,20名病人被误判为阴性。

该测试的PPV为99%。但是,如果人口中的患病人数只有200人,而健康人数为 3800 人,则假阳性数量从20增加到38人,PPV下降到84%。

本举例实际上想强调这样一个事实,即诊断或筛查疾病的能力既取决于检测的区分价值也取决于疾病在相关人群中的患病率

与此同时,要注意:

PPV的互补值是错误发现率(FDR),NPV的互补值是错误遗漏率(FOR),分别等于1减去PPV或 NPV。FDR是错误的结果或 “发现” 的比例。FOR 是被错误拒绝的假阴性的比例。从本质上讲,PPV和NPV越高,FDR和FOR就越低——这对您测试结果的可靠性来说是个好消息。

该如何平衡敏感性和特异性?

如果结果是按值的滑动比例给出的,而不是明确的阳性或阴性,则敏感性和特异性值尤为重要。它们允许确定在何处绘制预测结果为阳性或阴性的临界值,甚至可能建议重新测试的灰色区域。

例如:谷禾结直肠癌模型

例如,通过将阳性结果的临界值置于非常低的水平,可以捕获所有阳性样品,因此测试非常敏感。但是,这可能意味着许多实际为阴性的样本可能被视为阳性,因此该测试将被视为特异性较差。找到平衡点对于有效和可用的测试至关重要。

★ ROC曲线有助于平衡假阴性和假阳性

在科研项目分析中经常使用受试者工作特征 (ROC)曲线有助于达到最佳平衡点平衡假阴性和假阳性。但是,对于假阴性是否比假阳性问题更小,或者反之亦然,分析的内容也很重要。例如,在生死攸关的问题上,那么您可能愿意容忍更多的假阳性,以避免遗漏任何真阳性。

▸ 什么是ROC曲线?

ROC曲线是一种图形表示,显示测试的敏感性和特异性如何相互变化。为了构建 ROC 曲线,使用该检验测量已知为阳性或阴性的样本。


对于给定的截止值,将TPR(敏感性)与FPR(1-特异性)作图,得到类似于下图的曲线。理想情况下,选择曲线肩部周围的一个点,这既能限制假阳性,又能最大限度地提高真阳性

图片来源:Technology Networks

给出ROC曲线(如黄线)的测试并不比随机猜测好,淡蓝色很好,但由深蓝色线表示的测试会更好。这将使临界值确定相对简单,并以非常低的假阳性率产生高真阳性率

结语

在医疗科技和人工智能快速发展的今天,我们面临着海量的健康相关数据和不断涌现的疾病预测模型。在选择和评估医疗检测产品时,必须综合考虑疾病特性、人群特征具体应用场景。对于普通大众和医疗从业者而言,理解这些指标不仅是一种专业素养,更是做出明智医疗决策的基础。

我们需要超越简单的”阳性”或”阴性”结果,深入理解检测结果背后的概率和风险。正如本文所强调的,一个优秀的医疗检测模型,应该能够在保证高敏感性的同时,最大限度地降低假阳性和假阴性的风险,为个人健康和公共卫生提供更精准、更有价值的信息。

主要参考文献:

technologynetworks.com/analysis/articles/sensitivity-vs-specificity-318222

Faith Mokobi. What is Sensitivity, Specificity, False positive, False negative? 2021 April 18, Microbenotes.

重新认识你的年龄——基于肠道菌群预测的生物年龄

谷禾健康

近年来,随着微生物组学研究的深入,科学家们发现肠道菌群与人体年龄之间存在着远比想象更密切的关联。一系列突破性研究表明,肠道菌群不仅能够反映个体的实际年龄,更可能是调控生物学年龄的关键因素之一。这一发现正在改变我们对发育、衰老和健康的传统认知。

最新研究揭示,肠道菌群的组成和功能随年龄发生系统性变化。这种变化表现在多个层面:从婴幼儿期菌群的快速建立与稳定,到成年后菌群多样性的动态平衡,再到老年期特征性菌群的衰退。基于这些规律,研究人员开发出了一系列基于肠道菌群的年龄预测模型,其准确度已经达到前所未有的水平。

更引人注目的是,肠道菌群年龄与多种疾病的发生、发展密切相关。研究发现,肠道菌群年龄加速老化往往预示着代谢紊乱、免疫功能下降,甚至认知能力衰退。相反,保持年轻和健康的肠道菌群,可能是延缓衰老、预防疾病的重要途径。

本文将重点探讨三个核心问题:

  • 为什么人体肠道菌群可以预测发育和衰老?
  • 基于肠道菌群的谷禾年龄预测模型的最新突破和应用前景。
  • 肠道年龄的应用价值和超越数字的生物学意义。

通过梳理最新研究进展,我们将看到肠道菌群不仅是年龄的被动标记物,更可能是一个调控的”生物时钟”。这一认识正在开启精准医疗和个性化健康管理的新篇章。

doi: 10.14218/ERHM.2024.00008

随着研究的深入和技术的进步,基于肠道菌群的年龄干预策略很可能成为未来医学实践的重要组成部分。

01
肠道菌群与生命早期发育

从无菌到共生——婴幼儿肠道菌群的“黄金塑造期”

近年来研究表明,肠道微生物群在婴幼儿早期发育阶段的变化与其发育年龄密切相关。婴幼儿的肠道微生物群呈现出明显的年龄相关性变化特征:在早期阶段主要表现为不稳定的群落结构和较低的微生物成熟度,随着年龄增长,菌群组成从以FirmicutesBifidobacterium为主,逐渐过渡到以BacteroidesPrevotella为主导。这种转变具有确定性和可预测性,为年龄预测模型的建立提供了基础。

肠道微生物群的发育受多种因素影响,包括喂养方式、出生方式、地理位置和环境暴露等。研究发现,母乳喂养与Bifidobacterium的高水平密切相关,而停止母乳喂养则会加速肠道微生物群的成熟。此外,出生方式也显著影响微生物群的发育,如阴道分娩的婴儿肠道中Bacteroides的水平较高。尽管存在这些普遍性特征,但个体间的肠道微生物群发育轨迹仍存在差异,这与特定的生活方式和环境因素密切相关。

doi: 10.3233/NHA-170030

在预测模型研究方面,近年来取得了显著进展。2025年发表在《Nature Communications》上的研究开发出了一个高精度的预测模型,该研究分析了来自12个国家的1,827名婴幼儿的3,154个样本,使用随机森林模型进行预测,预测误差仅为2.56个月

研究还识别出了关键的分类学预测指标,包括双歧杆菌的减少和粪杆菌的增加。另一项2024年的研究则开发出了“肠道微生物群健康指数”,该指数不仅能够预测婴幼儿在前5年的整体健康状况,提供了一个可靠的微生物群年龄评估基准

最新研究进一步证实,婴幼儿肠道微生物组的发育成熟度与年龄高度相关仅通过肠道微生物群组成就能准确预测婴儿的年龄。研究人员建立了”微生物组年龄”的评估标准,这不仅可以用于年龄预测,还可以作为评估早期肠道发育的重要指标。这些研究成果不仅证实了基于肠道菌群预测婴幼儿年龄的可行性,还为评估婴幼儿的发育状况和健康水平提供了新的工具和方法。

肠道菌群发育滞后会对婴幼儿的多个系统产生深远影响。

在神经系统方面,可能导致认知发育迟缓、语言发育延迟、注意力不集中,甚至增加自闭症谱系障碍(ASD)的风险;

在免疫系统方面,常见表现包括反复呼吸道感染、特应性皮炎、食物过敏,以及哮喘等过敏性疾病的发生率升高;

在代谢系统方面,可能引起生长发育迟缓、体重增长异常、微量元素吸收不良等问题;在消化系统方面,则可能出现腹泻、便秘、肠痉挛等功能性胃肠道疾病。

特别是在出生后最初1000天这个关键期内,肠道菌群的发育状况对婴幼儿的长期健康具有决定性影响。

在这种情况下,规范的肠道菌群检测在婴幼儿发育评估中具有重要意义。检测内容应包括微生物多样性指数、关键菌群(如双歧杆菌、乳酸菌、粪杆菌等)的丰度,以及潜在致病菌的监测。

建议在以下关键时间点进行检测:出生后1-2个月、辅食添加期(4-6个月)、断奶期(12个月左右)以及2岁左右。对于高危人群,如早产儿、剖宫产婴儿、有过敏家族史或自身免疫性疾病家族史的婴幼儿,需要更频繁的监测。

研究显示,及早发现和干预菌群异常可以显著改善预后。具体干预措施包括:调整饮食结构(如添加低聚糖、膳食纤维等益生元),补充特定益生菌(如婴儿双歧杆菌、鼠李糖乳杆菌等),改善生活习惯(如规律作息、适度运动),以及环境因素的调整(如避免不必要的抗生素使用、增加户外活动时间)。对于特定问题,如食物过敏,可以通过补充特定菌株(如常见的LP299V益生菌)来改善症状;对于免疫功能低下,则可以考虑添加具有免疫调节作用的益生菌。

因此,建议在婴幼儿发育的关键时期进行系统的肠道菌群检测和跟踪监测。这种检测不仅能够及早发现发育风险(如自闭症倾向、过敏风险、免疫功能异常等),还能为个性化干预方案的制定提供科学依据特别是对于已经出现发育迟缓、免疫功能低下、消化吸收障碍等问题的婴幼儿,定期的肠道菌群检测对评估干预效果和及时调整治疗方案具有重要的临床指导意义。

02
道菌群与衰老的隐秘对话

通过肠道菌群的视角:解密衰老时钟背后的微生物密码

➤ 老年肠道菌群的三大特征:

多样性下降、促炎菌增加、代谢功能衰退

随着年龄增长,我们的肠道菌群会发生显著变化。研究发现,老年人的肠道菌群具有三个显著特征,这些变化与多种衰老相关的健康问题密切相关。

◆ 首先是菌群多样性的显著下降

与年轻人相比,老年人的肠道菌群种类明显减少,特别是厚壁菌门数量减少,而拟杆菌门的比例相对升高同时,一些对健康有益的细菌,如双歧杆菌瘤胃球菌等数量也显著减少。这种多样性的降低会影响肠道微生态的稳定性。

◆ 第二个特征是促炎菌群的增加

老年人肠道中肠杆菌科(Enterobacteriaceae)和肠球菌属(Enterococcus)促炎菌群数量明显增多,而具有抗炎作用的普拉梭菌(Faecalibacterium prausnitzii)等益生菌则显著减少。这种失衡会导致肠道处于慢性低度炎症状态,不仅影响局部肠道健康,还可能加速整体衰老进程。

◆ 第三个特征是代谢功能的衰退

老年人肠道中产丁酸菌如真杆菌(Eubacterium)、瘤胃球菌等数量减少,这些菌群对维持肠道健康至关重要。它们的减少会影响营养物质的吸收和能量代谢,同时也会降低肠道屏障功能,增加肠道通透性。这种变化可能导致营养吸收不良,并增加有害物质进入血液的风险。

这三个特征之间相互关联,共同构成了一个复杂的失衡网络。例如,菌群多样性的下降会影响代谢功能,促炎菌群的增加又会进一步降低有益菌群的数量。这种恶性循环可能是老年人更容易出现各种健康问题的重要原因之一。了解这些特征对于开发针对性的干预策略,改善老年人健康状况具有重要意义。

➤ 虚弱的菌群特征

虚弱是老年人一种特殊的临床状态,表现为机体对内外压力源的脆弱性增加,往往伴随着食欲下降、肌肉减少、认知功能下降、活动能力减弱以及独立生活能力的丧失。近年来的研究发现,肠道菌群的改变与虚弱程度之间存在着密切的关联,这种关联并不完全依赖于年龄因素。

研究显示,虚弱老年人的肠道菌群具有独特的“虚弱特征”。首先是普氏菌(Prevotella)和普拉梭菌(F. prausnitzii) 的显著减少,这些菌群对维持肠道健康和免疫功能具有重要作用。其次是产丁酸菌,如Eubacterium haliiEubacterium rectalis的含量降低,这与肌肉蛋白合成的减少密切相关。

研究人员还观察到,在虚弱评分较高的老年人中,乳酸菌(Lactobacilli)、拟杆菌/普氏菌(Bacteroides/Prevotella)等有益菌群显著减少,而瘤胃球菌属(Ruminococcus)、Atopobium和肠杆菌科(Enterobacteriaceae)等菌群则明显增加

doi: 10.1016/j.advnut.2025.100376

这些菌群变化的意义重大。产丁酸菌的减少会影响能量代谢和肌肉功能,而有益菌的减少则可能导致免疫功能下降和炎症水平升高。相反,在功能状态良好的老年人中,往往可以观察到较高水平的产丁酸菌,特别是普拉梭菌(Faecalibacterium prausnitzii)的含量,这进一步证实了菌群组成对机体功能的重要影响。

这些发现为我们理解和干预老年虚弱提供了新的视角。通过调节肠道菌群,特别是补充特定的益生菌和益生元,可能有助于改善老年人的虚弱状态。这也提示我们,在老年医学实践中,应当将肠道菌群作为评估和干预虚弱的重要靶点之一

➤ 百岁老人长寿菌群的特殊组成

研究发现,百岁老人的肠道菌群具有独特的“长寿特征”,这种特征不仅区别于普通老年人,更展现出与健康长寿密切相关的微生物组成模式。这一发现为我们理解人类长寿的生物学机制提供了新的视角。

在菌群组成上,百岁老人的肠道中普遍存在较高水平的拟杆菌和罗氏菌属(Roseburia)。这两类菌群在维持肠道健康和免疫平衡方面发挥着重要作用。作为重要的丁酸盐产生菌,能够通过产生短链脂肪酸来调节肠道微环境,增强肠道屏障功能。

更引人注目的是,百岁老人的肠道中还富含Christensenella双歧杆菌和阿克曼氏菌(Akkermansia)。这些菌群被认为是“长寿菌群”的代表。其中,长寿菌群与人类的遗传因素高度相关,被认为是最具遗传性的菌群之一;双歧杆菌能够维持肠道健康,增强免疫功能;而阿克曼氏菌则在调节代谢、维持肠道屏障完整性方面发挥关键作用。

研究还发现了一些在百岁老人肠道中特有的菌种,如腐生链菌(Alistipes putredinis)和气味杆菌(Odoribacter splanchnicus)。这些特殊菌群的存在可能与长寿个体特有的代谢特征和免疫调节功能有关,为我们理解长寿的微生物学机制提供了重要线索。

这些发现不仅帮助我们理解了百岁老人独特的肠道菌群特征,更为延缓衰老、促进健康长寿提供了新的思路。通过深入研究这些”长寿菌群”的功能和调节机制,有望开发出基于微生物组的健康干预策略,为实现健康老龄化提供新的方案。

值得注意的是,这些长寿相关的菌群特征并非简单的个体差异,而是反映了人体在长期健康状态下的微生态平衡。这种平衡可能是遗传因素、生活方式和环境因素长期共同作用的结果,对于我们理解和促进健康长寿具有重要的指导意义。

➤ 菌群-肠-脑轴在认知衰退中的作用路径

肠道菌群与大脑的关系远比我们想象的要复杂。研究表明,肠道菌群通过复杂的菌群-肠-脑轴与认知功能密切相关。这条轴线不仅包括神经元的直接连接,还涉及神经递质、激素和免疫介质等多重信号分子,构成了一个精密的双向调控网络。

◆ 第一个关键通路是神经递质调节

肠道菌群可以直接产生或调节多种神经递质的合成。研究发现,乳酸菌和双歧杆菌能够将肠道中的谷氨酸转化为GABA(γ-氨基丁酸),这是大脑中主要的抑制性神经递质,对情绪调节和认知功能具有重要作用。

此外,肠道菌群还参与乙酰胆碱和多巴胺等神经递质的产生。动物实验证实,补充Lactobacillus helveticus NS8可以通过降低血浆中皮质醇和促肾上腺皮质激素的水平来改善应激反应,同时提高血清素和去甲肾上腺素的水平。

◆ 第二个重要机制是免疫-炎症通路

随着年龄增长,肠道菌群失调会导致肠道通透性增加,使脂多糖(LPS)、脂蛋白和细菌RNA等细菌代谢产物进入血液循环。这些物质可以激活免疫系统,导致TNF-α、IL-1β、IL-6等促炎因子的释放,引发系统性炎症反应

这些炎症因子可以穿过血脑屏障,在大脑中引起神经炎症,加速认知功能的衰退。值得注意的是,小胶质细胞(占中枢神经系统固有免疫细胞的约10%)在这个过程中发挥着重要作用,它们能够快速识别和响应环境变化,参与维持神经系统的稳态。

◆ 第三个关键环节是神经营养因子的调节

肠道菌群对脑源性神经营养因子(BDNF)和神经生长因子(NGF)的表达具有重要影响。这些神经营养因子对神经元的存活、突触可塑性和神经回路的重塑起着关键作用。研究发现,某些益生菌的补充可以提高BDNF的水平,改善认知功能。例如,在小鼠实验中,补充长双岐杆菌(Bifidobacterium Longum)能够显著改善动物的推理能力。

此外,肠道菌群还通过产生短链脂肪酸等代谢产物发挥作用。这些代谢产物可以调节血脑屏障的完整性,影响神经元功能和神经胶质细胞的活化状态。研究还发现,某些菌群数量变化与认知功能直接相关,如AlcaliganeceaePorphyromonadaceae的数量增加推理能力下降正相关

在治疗干预方面,益生菌的应用显示出了积极的效果。例如,LactobacillusBifidobacteriumS. thermophilusEnterococcusBacillus等益生菌可以通过增加色氨酸衍生的神经营养因子水平来促进神经递质的释放。

然而,益生菌补充的效果会受到多种因素的影响,如剂量、菌株、补充时间以及患者的年龄、疾病状态、药物使用(尤其是抗生素)、饮食和生活方式等。

需要指出的是,尽管菌群-肠-脑轴的研究取得了显著进展,但仍有许多问题需要进一步探索。目前的研究主要基于动物模型和临床观察,还需要更多的多学科、多系统的研究来阐明相关机制和干预机会。这些研究将有助于开发以肠道菌群为靶点的早期干预策略,为预防和治疗神经退行性疾病提供新的思路。

03
精准预测年龄的微生物模型

用AI构建年龄的生物标记——肠道菌群的年龄预测模型

近年来,随着测序技术的进步和机器学习方法的发展,基于肠道菌群的年龄预测模型取得了显著进展。2020年,研究人员通过深度学习方法分析了4000多份来自18-90岁人群的宏基因组数据,构建出预测误差为10.6年的模型。同年,另一项基于随机森林算法的研究分析了4434份样本的16S rRNA测序数据,将预测误差控制在11.5岁。这些早期研究证实了利用肠道菌群特征预测年龄的可行性。

2022年的突破性研究展示了多维度数据整合的优势。通过分析4478份成年人粪便样本,研究发现单独使用分类特征或代谢途径特征的预测模型误差分别为9.5年和10.2年,但将两类特征结合并考虑宿主因素后,预测误差可降至8.3年。这一发现为后续模型开发指明了方向。

2024年一项新研究开发出了基于肠道微生物组多维数据的生物学年龄预测模型(gAge)。该研究通过创新的机器学习方法,成功整合了微生物组的分类学和功能学特征,显著提高了年龄预测的准确性。研究团队识别出164个标志物物种和35个关键代谢通路与宿主年龄变化密切相关,并根据其对衰老的影响将其分类为促进和抑制两类。

doi: 10.1080/19490976.2023.2297852

研究验证显示,gAge模型及其预测残差与个体健康状况和虚弱程度高度相关。特别是在老年群体中,模型识别的年龄相关标志物与多种疾病和虚弱特征显著重合,为评估和预测衰老风险提供了新的工具。

doi: 10.1080/19490976.2023.2297852

这些研究基础上,谷禾开发的GUHEAge模型实现了更大的突破。该模型基于60万例不同年龄人群的6万个菌群特征首次完整分析了从0-120岁的肠道菌群演变过程。通过深度神经网络,我们识别出381个标记物种和1574个标记基因,并根据其对衰老的影响将其分为促进和抑制两类。

在这些标记物中,产短链脂肪酸的有益菌(如双歧杆菌属、嗜粘蛋白阿克曼氏菌和拟杆菌属)表现出抑制衰老的作用。这些菌群可增强肠道屏障功能,调节机体代谢、炎症和免疫反应。相反,某些致病菌(如大肠杆菌和空肠弯曲杆菌)则显示出促进衰老的特征。

更重要的是,GUHEAge模型不仅能准确预测年龄,其预测结果还与个体健康状况和虚弱程度高度相关。验证集表明,模型识别的年龄相关标志物与多种疾病和虚弱特征显著重合,这为精准医疗和个性化健康管理提供了新的思路。

这些进展表明,基于肠道菌群的年龄预测模型已经发展成为一个可靠的生物年龄评估工具。通过整合多维度数据和先进的机器学习方法,为干预衰老提供新的靶点

<来源:谷禾健康肠道菌群数据库>

可以看到,肠道年龄和实际年龄基本是符合的。健康人的肠道菌群年龄恰恰是最符合真实年龄的,与真实年龄差异大意味着肠道菌群出现偏离。

健康的人存在更多样化且平衡的肠道菌群。微生物群中与年龄相关的变化归因于生理,生活方式和健康状况。这些因素中的每一个都与某些菌群的相对丰度变化有关。

例如,饮食、卫生、兄弟姐妹、宠物、过敏、儿童疾病和抗生素是影响儿童微生物组的一些突出因素。到了成年期微生物群相对稳定,而到了老年期,一些有益菌开始逐渐下降,菌群又向另一个阶段过渡。

04
肠道年龄的临床意义

理解肠道年龄超越数字的生物学意义

➤ 发育迟缓儿童的菌群年龄滞后现象

发育迟缓儿童的肠道菌群呈现出明显的“年龄滞后”特征,这种现象反映在菌群的多样性、组成结构和功能等多个方面。研究表明,这些儿童的肠道菌群发育水平往往落后于其实际年龄,这种滞后可能是导致发育迟缓的重要因素之一

我们之前发表在《Gut》上的针对自闭症儿童菌群发育的研究显示,自闭症儿童的菌群发育要滞后于健康儿童。

在菌群组成方面,发育迟缓儿童表现出显著的特征性改变。首先是有益菌群的明显减少,特别是双歧杆菌和乳杆菌的含量显著低于同龄健康儿童。这些菌群对维持肠道健康、促进营养物质吸收和调节免疫功能具有重要作用。同时,研究还发现这些儿童的肠道中普氏菌(Prevotella)和粪杆菌(F. prausnitzii)等核心菌菌含量也明显降低

doi.org/10.1136/gutjnl-2021-325115

这种菌群滞后现象可能通过多个机制影响儿童发育:

免疫调节机制:菌群失调导致肠道免疫功能发育不良,增加炎症风险,影响生长发育。研究发现,这些儿童体内往往存在低度慢性炎症状态。

营养代谢影响:关键有益菌群的减少影响营养物质的吸收和利用效率。特别是产丁酸菌的减少,会影响能量代谢和营养物质的吸收。

神经-内分泌调节:菌群失调可能通过菌群-肠-脑轴影响生长激素和其他内分泌激素的分泌,进而影响生长发育。

针对这一问题,目前研究提出了几种潜在干预策略,包括结合营养补充、运动干预和益生菌治疗或全面的菌群置换可以有效改善儿童的生长发育状况。

通过调节肠道菌群,有望开发出更有效的干预策略,帮助发育迟缓儿童实现健康生长。同时,这也提示我们在儿童保健实践中,应当将肠道菌群作为评估和干预的重要指标之一。

➤ 早衰综合征患者的菌群年龄加速特征

早衰综合征患者的肠道菌群呈现出显著的“年龄加速”特征,其菌群组成和功能状态明显超前于实际年龄水平。研究发现,这种菌群年龄加速现象与多种生理功能的提前衰退密切相关。

doi: 10.2147/CIA.S414714

在菌群组成方面,早衰患者表现出显著的特征性改变。有益菌群如粪杆菌(Faecalibacterium prausnitzii)、直肠真杆菌(Eubacterium rectale)和扭链瘤胃球菌(Ruminococcus torques)的含量明显降低。同时,代谢通路也发生了重要变化,包括支链氨基酸代谢通路(如L-缬氨酸和L-异亮氨酸合成)的显著下降,丙酮酸发酵(PWY-7111)能力减弱,以及NAD合成相关代谢通路的异常。

这些改变通过多个机制影响机体功能。首先是炎症反应的加速,表现为促炎因子(TNF-α、IL-6和IL-1)水平升高,导致慢性低度炎症状态持续存在。其次是代谢功能的紊乱,包括氨基酸代谢异常、能量代谢效率下降和营养物质吸收受损。此外,肠道屏障功能受损也是重要特征,导致肠道通透性增加,细菌代谢产物进入血液循环,进一步加重系统性炎症反应。

针对这些问题,研究提出了几种潜在的干预策略:

精准菌群干预:通过补充特定益生菌,如双歧杆菌和乳酸菌,同时添加益生元促进有益菌群生长。研究表明,这种干预方式可以改善肠道菌群组成,延缓衰老进程。

代谢通路调节:包括补充NAD前体物质、调节氨基酸代谢和改善能量代谢。特别是NAD水平的提升,已被证实可以预防衰老和相关疾病。

生活方式干预:优化饮食结构,增加膳食纤维摄入;保持适度运动,提高体能状态;改善睡眠质量,维持昼夜节律。

综合干预方案:结合营养补充、心理支持、运动康复和定期监测菌群状态,全面改善患者状况。

通过对肠道菌群的精准干预,有望延缓早衰进程,改善患者生活质量。

➤ 糖尿病/心血管疾病的菌群老化预警

在代谢性疾病领域,肠道菌群年龄作为一个新兴的生物标志物展现出重要的预警价值。研究发现,糖尿病和心血管疾病患者的肠道菌群往往表现出提前衰老的特征,这种菌群老化现象通常早于临床症状的出现,为疾病的早期预警提供了新的时间窗口。

在菌群组成方面,研究显示代谢性疾病患者的肠道菌群存在显著变化。这些变化与血清生化指标密切相关,特别是与碱性磷酸酶和胰岛素水平显著相关。研究还发现,某些代谢通路的改变,如支链氨基酸代谢通路(BCAA)、NAD合成相关代谢通路的异常,可能是疾病发展的早期信号

通过肠道年龄预测模型的应用,研究人员发现菌群年龄与多种疾病风险指标具有显著相关性。在一项针对老年人群的研究中,gAge预测残差与个体健康状况和虚弱程度呈现高度相关。特别是在2型糖尿病(T2D)患者中,尽管疾病本身可能不会显著影响预测年龄,但菌群组成的特定改变可以作为疾病进展的预警指标。

在心血管疾病方面,研究发现血清碱性磷酸酶水平与心脑血管疾病风险显著相关,而这一指标与肠道菌群年龄存在明显关联。通过分析不同gAge残差人群的菌群特征,研究者识别出了一系列可能与心血管健康相关的关键菌种和代谢通路,为疾病预防提供了新的干预靶点。

这些发现为代谢性疾病的早期筛查和预防提供了新的思路。通过监测肠道菌群年龄的变化,结合传统的临床指标,可以更早地识别疾病风险,实现更精准的健康管理。随着检测技术的进步和预测模型的完善,基于肠道菌群的疾病预警系统有望成为临床实践中的重要工具。

05
重新定义健康管理的新维度

实现从被动治疗到主动预防的转变

随着人口老龄化加剧,深入理解和干预衰老过程变得愈发重要。近年来,肠道微生物组研究为我们提供了全新的视角,从发育到衰老的全程监测和干预成为可能。

肠道年龄概念的提出,标志着生物学年龄评估领域的一次重要范式转变。这一转变不仅打破了传统chronological age的局限,更是将微生物组这一动态指标引入健康评估体系,为个体化健康管理提供了新的思维框架。

发育领域,研究发现肠道菌群年龄可以有效反映儿童发育状况。发育迟缓儿童往往表现出明显的”菌群年龄滞后”现象,这为早期干预提供了新的靶点。同时,在早衰综合征患者中观察到的菌群加速衰老特征,以及在糖尿病、心血管疾病患者中发现的菌群老化预警信号,都展示了微生物组在疾病预防和健康管理中的重要价值。

谷禾团队通过分析60万例不同年龄人群的6万个菌群特征,这种基于海量数据的个体化健康监测方法,为微生物组研究开辟了新的范式。通过持续监测个体肠道菌群的动态变化,有助于更早地发现健康隐患,实现疾病的早期预警和干预。

<来源:谷禾健康肠道菌群检测数据库>

精准医学的角度来看,肠道年龄的概念为个体化健康管理提供了新的工具。通过整合微生物组数据与传统临床指标,我们可以构建更全面的健康评估体系。这种多维度的评估方法不仅能够反映个体当前的健康状态,还能预测未来的健康轨迹,为精准医疗干预提供决策依据。

尽管目前研究已取得显著进展,但仍面临诸多挑战:微生物组与衰老的因果关系有待厘清,个体差异和环境因素的影响需要进一步研究,预测模型在特定人群中的适用性也需要验证。此外,如何将研究成果有效转化为临床应用,实现精准干预,也是未来需要重点解决的问题。

展望未来,随着高通量测序技术的进步和人工智能算法的优化,结合多组学数据的整合分析将帮助我们更全面地理解肠道微生物组在人体发育和衰老过程中的作用。精准医学的未来将更加依赖于这种整合的、动态的健康评估体系,结合人工智能分析,可以更好为每个个体制定个性化的健康管理方案,实现从被动治疗到主动预防的转变。

主要参考文献:

Min M, Egli C, Sivamani RK. The Gut and Skin Microbiome and Its Association with Aging Clocks. Int J Mol Sci. 2024 Jul 8;25(13):7471.

Hohman LS, Osborne LC. A gut-centric view of aging: Do intestinal epithelial cells contribute to age-associated microbiota changes, inflammaging, and immunosenescence? Aging Cell. 2022 Sep;21(9):e13700.

Tao X, Zhu Z, Wang L, Li C, Sun L, Wang W, Gong W. Biomarkers of Aging and Relevant Evaluation Techniques: A Comprehensive Review. Aging Dis. 2024 May 7;15(3):977-1005.

Wang H, Chen Y, Feng L, Lu S, Zhu J, Zhao J, Zhang H, Chen W, Lu W. A gut aging clock using microbiome multi-view profiles is associated with health and frail risk. Gut Microbes. 2024 Jan-Dec;16(1):2297852.

微生物测序报告中的多样性数据详细解读

谷禾健康

随着技术的发展,高通量测序技术已成为研究微生物群落的重要工具。这种技术使得科学家们能够解析巨量微生物DNA序列,从而获得丰富的微生物组数据,包括16S rRNA基因ITS序列宏基因组。然而,这些数据只是迈向揭示微生物群落复杂性的第一步。

通过对环境样本的可变区域如16S、18S、ITS序列进行高通量测序获得的原始序列数据,再对其进行聚类,数据分析统计学差异比较等得到微生物多样性分析报告。那么,什么是微生物群落多样性

微生物群落多样性(Microbial Community Diversity)是指在特定环境中存在的微生物种类的数量和分布情况,它不仅包含不同种类微生物的丰度,还包括它们之间的相互关系。多样性可以从不同角度进行评价,主要分为以下几种:

α多样性(Alpha Diversity): 这是衡量某一特定样本内部多样性的一种指标。常用的α多样性指标包括物种丰富度(Species Richness)、香农指数(Shannon Index)和辛普森指数(Simpson Index)。这些指标可以帮助我们了解样本内部的复杂性和均一性

β多样性(Beta Diversity):不同样本之间的多样性比较被称为β多样性。常用的β多样性指标包括Bray-Curtis距离Jaccard指数,通过这些指标可以探索样本之间的相似性和差异性,揭示不同环境或条件下微生物群落的变化模式

γ多样性(Gamma Diversity): 这是指在一个更大尺度、多个样本的总体多样性,通常用以评估一个较大区域的整体多样性水平

为理解这些多样性指标,我们可以借助一些简单的比喻来形象解释。例如,α多样性就像是在观察一个花园的花卉种类和数量;β多样性则是比较不同的花园之间的相似性或不同之处;而γ多样性则是对一个城市中所有花园的总览评价。

在接下来的部分中,我们将深入探讨这些多样性指标的详细内涵,以及从多个角度展示如何通过高通量测序技术解析微生物群落中的这些多样性规律。

▸ 基本流程

下图是实验上机测序流程,提取的样本总DNA经过质检、PCR扩增建库等步骤进行高通量测序得到测序原始数据。

原始数据经过Reads拼接tags过滤去嵌合体等步骤得到有效数据clean data。在特定的相似度下进行聚类得到OTU/ASV,报告中通过降噪方法得到ASV表,一切后续分析都围绕ASV表来进行。根据ASV表可以继续做物种分类注释丰度计算多样性分析差异分析功能预测等。所以ASV特征表是微生物多样性分析中关键数据结果。

OTU和ASV的区别

OTU和ASV是微生物组学中用来表示微生物多样性的两个不同概念。两者都是从环境样本中获得的DNA序列数据,通过一定的分析方法分类得到的用于表示微生物种类或种群的单位。它们之间的主要区别在于定义的精确度和建立的方法

– OTU(Operational Taxonomic Units):

OTU是一种将序列通过相似度聚类的传统方式,来表示相似序列组成的种群。通常,这种聚类方法会将序列之间相似度达到97%(或其他设定的阈值)的序列分到同一个OTU。OTU聚类通常不考虑序列中的单个变异位点,而是基于整体相似度

由于使用阈值聚类,OTU不能准确反映序列之间的实际差异,可能会将生态学意义上不同的微生物序列归为一个OTU。OTU分析可能过于简化,有时无法捕获低水平的微生物多样性

– ASV(Amplicon Sequence Variants):

ASV采用较新的降噪方法,可以精确地解析序列中的每一个核苷酸差异,简单来说就是以100%相似度进行聚类,对低质量序列进行去除和校正,这种方法可以生成“零半径OTU”,即互不相同的基于序列的变体。

ASV通常使用误差校正算法来排除测序错误,从而提供更精确的序列变体识别。ASV方法对单一核苷酸变异敏感而能提供更细粒度的微生物多样性解析。ASV为每一种变异提供更一致、可复制的标识符,这在比较不同研究之间的微生物群落组成时非常有用。

简而言之,ASV方法提供了比OTU更高分辨率、更精准的序列变体检测。换句话说,ASV提供了一种微生物组多样性分析的“高清”视角,它更可能捕捉到微生物群落内变化的微妙差异,尤其是在不同环境或时间点间的比较中。

▸ 测序原始数据情况

原始序列数据(raw tags)经过质控、过滤、去嵌合体,最终得到有效数据(effective tags)。再对有效数据进行UNOISE降噪处理,得到ASV特征表。数据处理过程中各步骤得到的序列进行途径统计,可以直观的反映每个样本的数据量和物种丰度

文件目录:

01_pick_otu/summary/sumOTUPerSample.txt

raw-tags:每个样本的原始序列数据;

singleton :每个样本中无完全匹配的单条序列的数量。singleton ASV 是指只有单条代表序列的 ASV,可能由于测序错误,或者是来自于PCR过程中产生的嵌合体;

tagsmatchedASVs: 每个样本中比对到ASVs的最终有效序列数据 及其比例,聚类的同时vsearch会根据UCHIME算法将singleton ASV及嵌合体去除,得到最终的有效序列数据 Effective Tags;

ASVs:每个样本的ASVs数量。

一般文献中的测序原始数据量raw-tags 要求达到3万条以上,可以满足数据分析的基本要求。绝大多数文献数据量平均在5万条左右。世面上不同公司承诺的数据指标有所不同,谷禾测序得到的原始数据一般可以达到10万 reads左右,足够满足当前文章发表要求的参考数据量。

若原始数据量低于1万条,尤其是少于3000条reads以下,则很有可能受环境污染的杂带较多,建议重新上机补测数据。ASVS列可以反映每个样本的物种多样性,一般一个ASVs就代表一个物种。因此可以用ASV数量来代表物种数量。将每个样本的有效原始数量和ASVs数据可视化做成柱状图,可以更直观的观察每个样本/分组数据量的变化

每个样本/分组可能会有一些共有的和独有的ASV,通常用韦恩图或花瓣图表示(样本数/分组数<=5个样本用维恩图,数量大于5出花瓣图)。除了用Venn图将几个数据集之间的交集进行可视化,还可以使用upset图表示。

韦恩图中不同颜色的圆圈代表一个样本/分组,圈之间的重迭区域表示样本/分组间共有的ASVs,每个区域的数字大小表示该区域对应的ASVs数目

UpSet图主要包含三个部分:上部分为各个分组独有和共有的ASV数量,下部分为各个分组独有和共有的分类情况,左部分每一个行代表一个分组。

alpha多样性分析—微生物丰富度和多样性

alpha多样性主要用来衡量单个样本内的菌群多样性不涉及样本之间的比较。alpha多样性与两个因素相关,分别是:一、丰富度(richness),二、多样性(diversity)。

丰富度指的是单个样本物种的种类数目;而多样性是指菌群在个体中分配的均匀度。样本的丰度高不一定就代表菌群的多样性丰富,丰度高如果是因为里边含有较多低丰度的杂带,这些可能是来源于环境的污染物导致的,这些低丰度的物种并不会使菌群的多样性增加

alpha多样性有三类相关指数,其中包括菌群丰度指数(Chao1和ACE)、菌群多样性指数(shannon和simpson)和测序深度指数(Goods coverage和Observed spieces)。

▸ 计算群落丰富度的指数:

Chao1:Chao1算法用于评估样本中所含ASV数目的指数,Chao1在生态学中常用来估计物种总数,由Chao(1984)最早提出。通过计算群落中只检测到1次和2次的ASV数估计群落中实际存在的物种数。chao1指数可以评估一个样本中的ASV数量,chao指数越大,ASV数目越多,说明该样本物种数越多

计算公式如下:

编辑​

其中:

Schao1=估计的OTU数;

Sobs=观测到的OTU数;

n1=只有一条序列的OTU数目(如“singletons”);

n2=只有两条序列的OTU数目(如“doubletons”)。

ACE:用来估计群落中含有ASV数目的指数,由Chao提出,是生态学中估计物种总数的常用指数之一,与Chao1的算法不同。预设将序列量10以下的ASV都计算在内,从而估计群落中实际存在的物种数。

计算公式如下:

其中

ni=含有i条序列的ASV数目;

Srare=含有“abund”条序列或者少于“abund”的OTU数目;

Sabund=多于“abund”条序列的OTU数目;

abund=被视为“优势”的ASV的阈值,默认为10。

▸ 计算群落多样性的指数

Shannon:香农-威纳指数综合考虑了群落的丰富度均匀度,是用来评估样本中微生物多样性指数之一。Shannon指数值越高,表明群落的多样性越高

计算公式如下:

其中:

Sobs=观测到的ASV数目;

ni=含有i条序列的ASV数目;

N=所有的序列数。

Simpson:辛普森多样性指数对菌群多样性评估,Simpson指数值越高表明群落多样性越高。由EdwardHugh Simpson(1949)提出,在生态学中常用来定量描述一个区域的生物多样性。一般而言,Shannon指数侧重对群落的丰富度以及稀有ASV,而Simpson指数侧重均匀度和群落中的优势ASV

计算公式一如下:

计算公式二如下:

此时,Simpson指数越大,说明群落多样性越大。报告中用到的是计算公式二。

其中:

Sobs=观测到的ASV数目;

ni=含有i条序列的ASV数目;

N=所有的序列数。

▸ 测序深度指数

Coverage:是指各样品克隆文库的覆盖率,其数值越高,则样品中序列被测出的概率越高,而没有被测出的概率越低。该指数反映本次测序结果是否代表了样品中微生物的真实情况。

计算公式如下:

其中:

n1=只含有1条序列的ASV数目;

N=所有的序列数。

下表统计了每个样本的各项alpha多样性指标:

结果目录:

03_diversity-metrics/alpha/alpha_div.txt

可以选择不同的alpha多样性指数进行显著性差异比较,一般常用丰富度指数Chao1,多样性指数Shannon、simpson,比较不同组间指数是否有显著差异。Alpha多样性分析将样本的菌群群整体研究并转换为具体的指数与p值,来说明群落的变化与差异

▸ 物种多样性相关曲线

•稀释性曲线(Rarefaction curve)

稀释曲线是从每个样本中随机抽取一定数量的序列,统计这些序列所代表的ASV数目,以随机抽取的序列数与ASV数量来构建曲线。可以用来比较不同样本中的物种多样性,也可以用来说明样本出测序数据量是否足以反映环境中的物种多样性


菌群多样性指数(shannon和simpson)

丰度等级曲线(Rank abundance curve)是分析多样性的一种方式。构建方法是统计单一样品中,每一个OTU所含的序列数,将OTU按丰度(所含有的序列条数)由大到小等级排序,再以OTU等级为横坐标,以每个OTU中所含的序列数(也可用OTU中序列数的相对百分含量)为纵坐标做图。

Rank-abundance曲线可用来解释多样性的两个方面,即物种丰度物种均匀度。在水平方向,物种的丰度由曲线的宽度来反映,物种的丰度越高,曲线在横轴上的范围越大;曲线的形状(平滑程度)反映了样品中物种的均度,曲线越平缓,物种分布越均匀

beta多样性分析—样本间菌群相似度

Beta多样性指的是样本间多样性,Beta多样性是衡量个体间菌落构成相似度的一个指标。通过计算样本间距离可以获得beta多样性距离矩阵,Beta多样性计算主要基于OTU的群落比较方法,有欧式距离、bray curtis距离等,这些方法优势在于算法简单,考虑物种丰度(有无)和均度(相对丰度),但其没有考虑OTUs之间的进化关系,认为OTU之间不存在进化上的联系,每个OTU间的关系平等。

另一种算法Unifrac距离法,是根据系统发生树进行比较,并根据16s的序列信息对OTU进行进化树分类,因此不同OTU之间的距离实际上有“远近”之分。而其他距离算法认为OTU之间的关系是平等的。Unifrac距离分为加权距离和非加权距离。

1

欧式距离(Euclidean distance):

欧几里得距离是空间中两点间“普通”(即直线)距离。

2

Bray-Curtis距离:

Bray-Curtis距离是生态学中用来衡量不同样地物种组成差异的测度。由J. Roger Bray and John T. Curtis 提出。其计算基于样本中不同物种组成的数量特征(多度,盖度,重要值等)。

计算公式为:

SA,i=表示A样本中第i个OTU所含的序列数;

SB,i=表示B样本中第i个OTU所含的序列数。

3

Unweighted UniFrac距离:

非加权距离包含特征之间的系统发育关系的群落差异定性度量

4

Weighted UniFrac距离:

加权距离包含特征之间的系统发育关系的群落差异定量度量

两者的区别在于:Weighted Unifrac 距离是一种同时考虑各样品中微生物的进化关系和物种的相对丰度,计算样品的距离,而Unweighted Unifrac则只考虑物种的有无,忽略物种间的相对丰度差异

一般采用PCA、PCoA、NMDS等进行图像化展示,区分样本间的菌群组成差异。其原理是利用降维思想把样本平铺到二维平面上,使得相似的样品距离相近,相异的样品距离较远。

PCA图是基于ASV table的欧式距离,PCoA是基于两两样品之间的距离矩阵(有Bray-Curtis距离、加权距离、非加权距离),基于距离矩阵的统计检验方法有ANOSIM相似性分析Adonis多元方差分析

▸ Anosim检验

Anosim分析是一种非参数检验,用来检验组间差异是否显著大于组内差异,从而判断分组是否有意义。对 Anosim 的分析结果,基于两两样本之间的距离值排序获得的秩(组间的为 between,组内的为 within),这样任一两两组的比较可以获得三个分类的数据,并进行箱线图的展示(若两个箱的凹槽互不重迭,则表明它们的中位数有显著差异)。

该方法主要有两个数值结果:R值,用于比较不同组间是否存在差异;P值,用于说明是否有显著差异

R-value 介于(-1,1)之间,R-value > 0,说明组间差异大于组内差异。R-value < 0,说明组间差异小于组内差异, R只是组间是否有差异的数值表示,并不提供显著性说明。统计分析的可信度用 P-value 表示,P< 0.05 表示统计具有显著性。

▸ Adonis检验

Adonis检验,多元方差分析,其实就是PERMANOVA,亦可称为非参数多元方差分析。其原理是利用距离矩阵(比如基于Bray-Curtis距离、Unifrac距离)对总方差进行分解,分析不同分组因素对样品差异的解释度,并使用置换检验对其统计学意义进行显著性分析。它与Anosim的用途相似,也能够给出不同分组因素对样品差异的解释度(R值)与分组显著性(P值)。

▸ PCA分析

PCA(Principal Components Analysis)即主成分分析,首先利用线性变换,将数据变换到一个新的坐标系统中;然后再利用降维的思想,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上。

这种降维的思想首先减少数据集的维数,同时还保持数据集的对方差贡献最大的特征,最终使数据直观呈现在二维坐标系。经过一系列的特征值和特征向量进行排序后,选取PCA分析得到的前三个主成分(PC1、PC2和PC3)中的任意两个数据作图。通过PCA 可以观察个体或群体间的差异

▸ PCoA分析

主坐标分析 PCoA (Principal component analysis)是一种非约束性的数据降维分析方法,可用来研究样本群落组成的相似性或相异性。通过 PCoA 可以观察个体>或群体间的差异。

它与PCA类似,两者的区别为PCA是基于样本的相似系数矩阵(如欧式距离)来寻找主成分,而PCoA是基于距离矩阵(欧式距离以外的其他距离)来寻找主坐标。我们基于Bray-Curtis 距离、 Weighted Unifrac 距离和Unweighted Unifrac 距离来进行 PCoA 分析。

该图是基于Bray-Curtis距离做的PCoA图,图中右下角的P值就是基于Adonis检验得到的结果:

编辑​

▸ NMDS分析

非度量多维尺度分析 NMDS 分析(Nonmetric Multidimensional Scaling)与上述 PcoA 分析类似,也是一种基于样本距离矩阵的分析方法,通过降维处理展现样本特定的距离分布

与 PcoA 的区别是 NMDS 分析不依赖于特征根和特征向量的计算,而是通过对样本距离进行等级排序,使样本在低维空间中的排序尽可能符合彼此之间的距离远近关系(而非确切距离数值)。因此,NMDS 分析不受样本距离的数值影响,对于结构复杂的数据排序结果可能更稳定

谷禾健康君验—肠道菌群(肠道微生物)宏基因组健康检测

谷禾健康

谷禾宏基因组精准检测

谷禾以往在科研领域深耕十余年,积累了丰富的科研项目经验和数据分析能力,几年前,谷禾成功实现了从科研到大健康应用的技术转化,推出了谷禾宏基因组精准检测。

对于一些特定需要深度检测的应用场景,如健康管理机构的差异化服务需求,或者临床应用需求,宏基因组精准健康检测提供了另一种专业的技术选择。


谷禾整合多维数据库

宏基因组数据库的物种涵盖范围和菌株构成,直接影响着宏基因组物种鉴定分类的准确性和分类精度。

针对宏基因组数据库不完善的问题,谷禾整合了最新的NCBI refseq数据库,涵盖细菌、病毒、真菌和寄生虫,结合自研多元统计模型和机器学习算法,极大提升了物种鉴定和功能注释的准确性。

谷禾宏基因组产品特点

物种精准鉴定

分辨率更加精细,可达“种”和“菌株”水平,并对复杂的多菌种感染进行精细化解构。

肠道功能评估

肠道基础功能:包括蛋白质发酵能⼒、消化吸收效率、肠道产气情况、肠道屏障完整性、肠道炎症状态等,在菌群整体评估指标中也增加了包括菌群恢复力、革兰氏阴性菌、好氧菌等指标。


功能基因分析

– 全面评估菌群的基因功能潜力

如次生代谢产物合成通路、维生素合成能力、碳水化合物利用能力等,为个性化营养和精准干预提供科学证据。


耐药基因

– 分析耐药基因

不局限于已知靶点,可鉴定出各种已知和新型耐药基因,全面评估耐药基因的种类和数量,例如,在人体肠道宏基因组中发现了大量β-内酰胺酶等耐药基因。


– 追踪耐药基因的传播途径

通过比较不同环境(如土壤、水体、动物和人体)中耐药基因的分布情况,可推测耐药基因的来源和传播途径。

– 辅助指导耐药风险评估和防控策略

宏基因组学评估环境和宿主中耐药基因的分布特点,识别高风险区域和人群,为制定针对性监测和干预措施提供依据。

毒力基因

宏基因组检测技术在病原微生物毒力基因研究中具有独特优势,可在基因组水平系统分析其毒力基因组成及调控网络,加深对致病机理的理解。


免疫炎症分析

肠道菌群通过调控免疫平衡维持健康,⽽炎症标志物则作为评估机体炎症程度的关键指标。


宏基因组测序技术挑战:数据量与成本的平衡

宏基因组测序对测序深度要求较高,当数据量不足时,一些低丰度的真菌、寄生虫等病原体可能覆盖不到;然而,若要获得足够的测序深度来确保全面覆盖,则会显著增加测序成本,同时对分析能力和计算资源提出更高要求。

因此,宏基因组检测看似”简单粗暴”,只要更多数据量,实则真正的挑战在于,如何在成本与深度之间找到最优平衡。

谷禾持续迭代升级自有数据库

整合最新的NCBI refseq数据库

并结合十余年积累的临床样本数据

让相对较小的测序量

也能获得高精度的物种鉴定结果

同时,谷禾致力于深入挖掘

数据背后的生物学意义

通过专业团队的生物信息学分析

从宏基因组数据中构建

炎症状态、消化功能异常等关键健康指标

通过机器学习算法将海量基因信息

转化为实用的健康评估结果

通过这种”数据挖掘+算法迭代

尽可能为大家控制成本的同时提供

媲美高深度测序的检测精度

极力追求技术创新与商业价值的完美结合

谷禾宏基因组主要报告内容

宏基因组报告中的解读更详细,还整理了一些评估指标,检测指标的总结等。



其他谷禾肠道菌群检测专业版的内容,宏基因组报告里面也都涵盖了,包括慢病风险、菌群代谢物及神经递质代谢、个性化营养等板块。

个性化饮食板块也在谷禾16S版本的基础上进行了迭代升级。

特殊应用场景

宏基因组检测并不常用于常规检测,其高昂的成本和复杂的数据分析决定了它更适用于关键时刻。

特定菌群感染的判别

对于一些复杂的多菌种感染,宏基因组能够更精细化鉴定感染菌群的构成,为临床辅助诊疗提供依据。

真菌与病毒感染的深度判别

相比传统培养,宏基因组学诊断真菌感染的敏感性和特异性更高,适用于一些真菌感染疾病。也可能鉴定出可疑的新病原体,为后续的病原学研究、药物和疫苗开发奠定基础。

适用场景

  • 全年龄段人群
  • 特定感染的深度分析
  • 新病原体的发现与鉴定
  • 预算足够、关注更全面的真菌和病毒信息的用户
  • 指导后端干预例如,益生元、益生元、粪菌移植、营养膳食补充剂等对菌群功能影响的机制研究;
  • 人群队列评估例如横向、纵向科研或临床项目研究;

赋能前沿科研与产品研发


<来源:谷禾宏基因组精准检测报告>

缺点

  • 数据浪费建库、测序成本较高,不适合大规模筛查
  • 宿主基因组背景噪音宏基因组更适合宿主含量不高的样本。
  • 数据库尚不完善分析疾病模型和预测,需要大的数据库,包括范围的界定,数据的标准化和优化等

总的来说,宏基因组测序仍存在技术瓶颈和生物学解释的局限性。然而,针对某些特殊情况研究需要,宏基因组测序也是一种有用的微生物组学研究工具。

特殊应用场景

  • 特定菌群感染的判别

对于一些复杂的多菌种感染,宏基因组能够更精细化鉴定感染菌群的构成,为临床辅助诊疗提供依据。

  • 真菌或病毒感染的问题

与传统方法相比,宏基因组学诊断真菌感染的敏感性和特异性更高,适用于一些真菌感染疾病。也可能鉴定出可疑的新病原体,为后续的病原学研究、药物和疫苗开发奠定基础。

以上是谷禾宏基因组精准检测报告的一些节选,其全面、精准、个性化分析肠道菌群的组成和功能,可帮助评估菌群失衡的风险和预后,为个性化诊疗和健康管理提供科学依据。

注:报告仅用于菌群科学研究和辅助参考,不直接用于临床诊断 。

高通量测序是什么技术,通俗易懂点

谷禾健康

DNA 测序是测量各种生命形式主要特性的基础。自20世纪50年代发现DNA双螺旋结构后,全世界科学家们就开始致力于确定不同物种基因组的原始序列。这一任务被称为基因组测序,旨在揭示不同生物的基因组组成和基因的排列顺序。

现代基因组研究标志之一是生成大量原始序列数据。这项工作的重要性在于,基因组序列的破译可以提供关于生物的遗传信息,包括基因功能、遗传变异和进化关系等方面重要线索。

在过去的几十年里,随着测序技术的不断发展和突破,测序的速度和精度都得到了显著提高。早期的测序方法主要依赖于Sanger测序技术,该技术基于DNA链延伸的原理,通过测量DNA链延伸反应中释放的荧光标记物来确定DNA序列。然而,由于其低通量和高成本的限制,Sanger测序逐渐被新一代测序技术(NGS)所取代。

随着新一代测序技术的兴起,如Illumina的高通量测序和454 Life Sciences的Roche测序平台以及华大基因(BGI)DNBSEQ-T7等测序平台,基因组测序进入了一个全新的时代。这些技术利用并行测序的原理,可以同时测序数百万个DNA片段大大提高了测序的速度和效率。同时,这些技术也在成本和准确性方面取得了显著的突破,使得大规模基因组测序成为可能

随着测序技术的不断进步,越来越多的原核和真核基因组序列被测序出来,并存储在公共数据库中,目前四个主要的数据库是:

  • 美国国家生物技术信息中心 (NCBI) 的 GenBank
  • 我国自己的数据库CNCB(China National Center for Bioinformation,国家生物信息中心)
  • 日本 DNA 数据库 (DDBJ)
  • 欧洲分子生物学实验室 (EMBL)

它们目前拥有丰度的实验以及样本核苷酸序列原始数据,此外还有蛋白质序列或大分子结构数据。这些数据库为科学家们提供了宝贵的资源,可以用于研究和比较不同物种的基因组,从而增进对生物多样性、进化和基因功能的理解。

除了基因组序列的分析,还需要开发各种生物信息学工具和数据库,以帮助解释和注释基因组数据。这些工具可以用于预测基因的功能、识别调控元件、比较不同物种之间的基因组差异等。

随着计算机技术的不断进步,测序数据也逐渐借助人工智能和机器学习等技术。这些技术可以辅助人们更快速、准确地分析和解释基因组数据,发现隐藏在数据中的模式和关联机器学习算法可以用于预测基因的功能、识别基因组中的重要调控区域或精确区分相近物种等。

例如谷禾肠道菌群16S数据库,是谷禾健康从几十万人肠道菌群检测数据中提取的16S序列库,通过宏基因组匹配数据和模型构建,重新完成到种的物种注释。进一步通过基因组数据研究和分析,为您提供深度个性化的健康检测方案。

目前测序技术已经在许多应用领域产生了广泛的影响。例如,基因组测序为研究人类遗传疾病的发病机制提供了重要线索,短读长、高测量通量和低成本为个体化医学和精准治疗奠定了基础。此外,测序还广泛应用于农业、环境科学和生物工程等领域,为改良作物、保护环境和生产高效生物工艺提供了有力支持。

因此本文和大家分享DNA测序相关的知识以及测序技术的发展和测序的注意事项等。

01
DNA基础知识

DNA(脱氧核糖核酸)是遗传物质,存在于所有生物的细胞中,以双螺旋结构存在,由核苷酸组成,包括磷酸基团、脱氧核糖和四种氮含基(腺嘌呤A、胸腺嘧啶T、胞嘧啶C和鸟嘌呤G)。DNA负责存储遗传信息,指导蛋白质合成,并在细胞分裂时复制自身,确保遗传信息传递给子代

不同物种的DNA在结构上非常相似,但在序列和组织上存在差异

人类DNA包含约30亿个碱基对,组成大约2万到2万5千个基因,这些基因分布在23对染色体上。人类DNA中的遗传信息决定了我们的外貌、生理功能和健康状况。人类的遗传多样性虽然存在,但所有人类的DNA序列大致相似,约有99.9%的相似度。个体基因组有 3-400 万个碱基对位置存在差异。这些变异可在单核苷酸多态性(SNP)中捕获 ,但也存在一些称为结构变异(SV) 的较大变异。

大多数病毒基因组有 10000 个 bp;某些植物的基因组长达数千亿个碱基对。细菌,通常具有较小的基因组,可以从几百万到几千万碱基对不等。细菌的DNA通常是单个环状染色体,而不是多条线性染色体。此外,许多细菌还含有质粒,这些是小型的DNA分子,可以在细菌之间进行转移促进基因的水平传播,这是细菌适应环境和抗药性发展的重要机制。

总之,不同物种的DNA在功能上都是遗传信息的载体,但是在大小、形态和序列上存在差异,这些差异导致了物种之间的多样性

不同物种个体基因组差异的产生有两个原因:

➼ 随机突变,在进化过程中发生,因为自然选择有利于某些表型。这些主要是由于细胞分裂期间 DNA 复制过程中的“错误”造成的。大多数突变都是有害的,会导致有害的表型变化并导致细胞死亡。有时,自然选择有利于某些突变,而这些突变会保留在种群中。

➼ 重组,发生在哺乳动物等高等生物的繁殖过程中。在重组过程中,亲本生物体传递给子代的遗传物质是来自亲本生物体的遗传物质的混合物

DNA双链碱基互补

DNA 是双链的,并以双螺旋形式构建,其中核苷酸对作为螺旋的“横档”(因此称为“碱基对”)。腺嘌呤总是与胸腺嘧啶发生化学结合,而胞嘧啶总是与鸟嘌呤发生化学结合。换句话说,A 与 T互补,类似地 C 与 G 互补。AT 和 CG 对称为互补对。

DNA的结构如下所示:

图源:medlineplus

DNA序列通常以5’端(头部)到3’端(尾部)的方向展示或写入。当我们有一条 DNA 链时,由于知道互补对,所以可以推断出另一条链是第一条链的反向互补链。

为了获得反向互补,可以反转原始字符串中核苷酸的顺序,然后互补核苷酸(即,将 A 与 T 互换,将 C 与 G 互换)。

下图显示了 DNA 片段及其反向互补链的示例。

DNA 补体

DNA复制

DNA 是细胞复制的基础。当细胞进行细胞分裂(也称为有丝分裂)时,细胞核中的 DNA 会被复制,并通过下图所示的一系列步骤,一个亲代细胞产生两个相同的子细胞。

有丝分裂的图

图源:wikipedia

有丝分裂过程中涉及多种生物分子,我们在这里对有丝分裂过程进行了高度简化的解释。

在图中,我们从两条染色体开始:红色和蓝色。

首先,DNA 被复制,产生更熟悉的 X 形染色体。通过生物分子信号的复杂级联和细胞内重组,(现已复制的)染色体在细胞中部排列。对于每条染色体,两半被拉开,两个子细胞中的每一个都会收到原始染色体的副本。这会产生两个与原始亲本细胞在遗传上相同的子细胞

DNA 复制是这张图中最重要的部分;这是用来进行测序的基础过程。DNA复制如下图所示:

在 DNA 复制过程中,两条 DNA 链首先被解压缩产生两条单链每条链都充当复制的模板。然后将短 RNA 引物附着到 DNA 上的特定位点;引物中的碱基与位点中的碱基互补。酶促进(或“催化”)化学反应,DNA 聚合酶是催化新核苷酸与延伸结合引物的模板 DNA 互补配对的酶。

DNA 聚合酶用来延伸链的核苷酸称为dNTP(脱氧核苷酸三磷酸)。从生物化学角度来看,它们与核苷酸略有不同,因为它们在 DNA 复制过程中更容易使用。对应于A、C、G和T的dNTP分别是dATP、dCTP、dGTP和dTTP。

获取DNA序列主要依赖于测序技术。常用的测序技术有桑格测序法下一代测序法。下一章节会详细介绍。

图源:praxilabs

桑格测序法准确度高但通量低。下一代测序法代表了高通量测序技术,它实现了并行化操作,大大提高了序列通量,降低了测序成本和时间,因此适合进行整个基因组或transcript组的测序。这些技术使大规模、高精度的DNA测序分析成为可能。

02
DNA测序

DNA 测序方法的发展在 2000 年左右达到顶峰,主要基于四位研究人员的贡献。

Allan Maxam 和 Walter Gilbert 在 70 年代开发了一种 DNA 测序的化学方法,其中末端用放射性磷标记的 DNA 片段经过碱基特异性化学切割,并通过凝胶电泳分离反应产物。

1977 年,Frederick Sanger采用另一种方法,通过使用链终止双脱氧核苷酸类似物完善了测序方法,该类似物导致引物DNA合成的碱基特异性终止。在这种方法中,引物通常用放射性磷标记。

Leroy Hood 与他的同事 Michael Hunkapiller 和 Lloyd Smith 在1986年通过使用荧光标记的双脱氧核苷酸将 Sanger 方法修改为更高的通量配置。这种方法可避免使用寿命有限的放射性化合物,而是使用稳定的荧光探针。此外,所有核酸碱基的分析可通过仅读取一个而不是四个电泳泳道来完成,并且读取过程可以自动化

这种高通量配置用于第一个人类基因组的测序,该测序于 2003 年通过人类基因组计划完成,该计划历时 13 年。

由于方法的改进和自动化,2008 年,另一个人类基因组在 5 个月的时间内完成了测序。第一份人类基因组草图的完成只是现代 DNA 测序时代的开始,它带来了更多的发明和新的、先进的高通量 DNA 测序策略,即所谓的下一代测序 (NGS)。

NGS 策略的发展正在满足我们对测序通量和成本的需求,从而在基因组研究中实现多种当前和未来的应用。这些先进方法需要开发新的生物信息学工具,作为分析过程中产生的大量数据的必要先决条件。

第一代测序——桑格测序

Fred Sanger 及其同事开发了一种基于放射性标记部分消化片段检测的相关技术。

著名的桑格测序起源于 20 世纪 70 年代末,当时桑格开发了一种基于凝胶的方法,将 DNA 聚合酶与标准核苷酸和链终止核苷酸 (ddNTP) 的混合物结合起来。将 dNTPS 与 ddNTP 混合会导致 PCR 期间测序反应随机提前终止。四个反应并行进行,每个反应包含一种版本的链终止核苷酸。使用凝胶电泳可视化该过程使得能够逐个碱基读取序列。在当时,这项技术是革命性的。它能够对 500-1,000bp 片段进行测序。

图源:praxilabs

桑格方法的一种变体——加减法,由桑格和艾伦·科尔森开发,于1977年获得了第一个DNA基因组序列,即噬菌体φX174。

图源:pixels

两年后,艾伦·麦克萨姆和沃尔特·吉尔伯特发表了他们的化学裂解技术,该技术成为第一个广泛采用的 DNA 测序方法。

到了 20 世纪 80 年代,桑格最初的方法已经自动化(毛细管电泳)。大块凝胶被更细的丙烯酸毛细管取代,结果可以在电泳图上查看。这项技术对于 2003 年人类基因组计划的完成至关重要。尽管如此,即使在人类基因组计划之后,毛细管电泳的成本仍然过高,无法实现大规模测序项目。

到 2000 年代中期,人们做出了一些努力来降低测序成本。世界各地的实验室正在测试用于更高通量筛选的新方法和技术。

第二代测序技术

第二代测序,也称为下一代测序(NGS)。简单来说,二代测序是依靠PCR文库构建和激光探针荧光信号读取的短读长测序

目前最常见的平台有Illumina华大基因(BGI)

Illumina测序平台

由 illumina 等公司开发的第二代 NGS 技术可分为两大类:杂交测序合成测序

  • 杂交测序是一种将重叠寡核苷酸序列集合组装在一起以确定 DNA 序列的方法。
  • 合成测序技术使用聚合酶或连接酶将核苷酸与荧光标签结合,然后对其进行鉴定以确定 DNA 序列。

华大测序平台

华大基因测序化学方法被称为组合探针锚定合成(cPAS)。它采用Phi 29 DNA聚合酶进行滚动圆环复制,合成一条长的单链DNA,自组装成约300纳米大小的纳米球。然后进行鉴定以确定 DNA 序列。

随着大规模双脱氧测序技术的进步,一项新技术的出现奠定了下一代测序(NGS)技术的基础。这项名为焦磷酸测序的方法,利用DNA合成过程中焦磷酸盐产生的光信号来确定核苷酸序列。在这个过程中,模板DNA被固定在一个固相表面上,随着每个核苷酸的加入,通过检测焦磷酸释放的光信号来推断DNA的序列。此技术后续还引入了珠子,以便更有效地附着DNA分子。

焦磷酸测序技术被454 Life Sciences公司所开发,并最终被罗氏公司收购,成为市场上第一个取得重大成功的商业化NGS平台。

乳液PCR

在这一平台中,DNA文库通过油包水乳液PCR技术附着在微小珠子上。在测序过程中,当较小的珠联酶和dNTPs被引入到反应板上时,便可进行焦磷酸测序。这种高度并行化的方法显著提高了测序的吞吐量,实现了数量级的提升

桥式放大

454测序技术取得成功之后,许多新的并行测序技术相继出现。其中最显著的是Solexa测序技术,该技术后来被illumina公司收购

  • 在illumina测序方法中,待测的DNA分子首先通过接头与固定在流动池表面的互补寡核苷酸相结合。
  • 接下来,一个称为桥式PCR扩增的过程允许在流动池表面形成高密度的DNA片段簇。
  • 在随后的合成测序过程中,每次添加一个标记有荧光的dNTP(去氧核苷酸三磷酸),通过检测荧光信号来确定其加入的顺序。
  • 随着时间的推移,可以并行读取成千上万个这样的簇。

Illumina测序平台因此成为了第一个实现商业化的高通量并行测序技术

其他

随着时间的推移,新技术不断涌现,其中包括:

  • Ion Torrent,这种技术通过测量DNA聚合过程中的pH值变化来进行测序;
  • SOLiD技术,它采用的是连接测序的方法,这种方法不依赖于聚合酶催化的合成过程。

图源:slideserve

这些创新技术已经成为下一代测序(NGS)技术领域的一部分。NGS平台目前是主流的测序技术,它们可以以相对较低的成本进行高通量的测序工作。然而,这些平台的读长通常有限,一般产生的读长在50到500碱基对(bp)之间。

本文我们主要介绍Illumina和华大这两个平台的测序原理。其他的简单说明一下。

Illumina测序平台介绍

Illumina 的首个测序平台是通过收购Solexa公司获得的,被命名为基因组分析仪,并于2007年开始商业化运作。这台设备能够在每个测序通道中对600万个扩增的DNA片段进行测序,最初每个片段的读取长度大约是30个碱基。Illumina 不久后提升了这一读取长度,增至100多个碱基对。同时,流动池中扩增片段的数量也得到了提升,使得基因组分析仪的输出能力达到了80吉字节的碱基信息。

注:吉字节(GigaByte),又称千兆字节,是计算机存储容量单位,简称GB。

2010年,Illumina 推出了其第二代NGS设备——HiSeq。这款设备配备了两个流动池:

  • 一个用于执行碱基添加的化学反应
  • 一个用于扫描识别每次扩增中加入的碱基

紧接着,Illumina 又发布了HiSeq X10,该设备通过使用图案化的流动池凹坑(代替了传统的随机扩增簇),进一步提高了可分析片段的数量。

目前,Illumina 提供了多种测序设备,包括NextSeq 和 NovaSeq 系列,以及适用于不同规模需求的台式测序仪,如iSeq100 MiniSeq

NextSeq

NextSeq 500 于 2014 年推出,采用两种染料测序技术,而不是其前代产品使用的四种染料测序技术。仅拍摄红色和绿色图像,从而显着缩短周期和数据处理时间。该仪器能够在大约 30 小时的运行时间内读取4亿个碱基对。

NextSeq 1000 和 2000 机器于2020年发布,旨在通过提供机载信息学和基于云的技术来简化工作流程。P3 流动池扩展了 NextSeq 2000 仪器的范围,在单次测序运行中提供 11 亿次读取。

NovaSeq6000

NovaSeq 6000于2017年发布。它能够运行三种不同的芯片,并且可以生成100 GB的序列输出,价格仅为375美元——这个价格仅适用于测序,不包括DNA分离、文库制备、测序分析或数据贮存。

本质上,该机器每次运行能够对多达 48 个完整人类基因组进行测序,这可能需要长达 44 小时。其他关键应用包括单细胞分析、转录组测序和宏基因组分析。

HiSeq X 系列

HiSeq X Ten 测序仪是一种高性能的测序系统,它能够在单次运行中产生高达16 Tb的序列输出。使用该系统,可以以不到1000美元的价格对人类基因组进行30倍或更高倍数的测序,并且每年可以提供超过18,000个人类基因组的测序数据。每个流动池可以生成多达520亿次的读取,最长运行时间为48小时。

该系统具有超越人类物种的全基因组测序能力,并且还可以用于全外显子组测序、转录组测序、单细胞分析和多组学研究。

华大测序平台(BGI) 介绍

华大基因集团成立于1999年、参与人类基因组计划的中国公司。华大基因于2012年收购了Complete Genomics,其产品由子公司(华大智造)销售。

DNBSEQ-T7

DNBSEQ-T7于2019年推出,旨在支持健康项目和临床研究的一系列大规模测序应用。据报道,与百万基因组整体解决方案软件和硬件一起,DNBSEQ-T7 每年可以对多达 800,000 个样本进行测序。

硬件解决方案包括自动化文库制备系统,这意味着测序机可以24小时运行,无需人工干预,每天可以完成60个人类全基因组测序。其商业化预计将把个人全基因组测序的成本降低至 500 美元以下,从而改变测序格局。

华大基因测序化学

BGI的测序化学方法被称为组合探针锚定合成(cPAS)。它采用Phi 29 DNA聚合酶进行滚动圆环复制,合成一条长的单链DNA,自组装成约300纳米大小的纳米球。荧光探针被结合在其中,纳米球被连接到硅片流动池上,选择性地与带正电的材料高度有序地结合。然后,荧光发射被成像和测量,以记录碱基位置。

所有短读取测序方法一样,BGI平台主要缺点是无法获得长的DNA序列。然而,基于cPAS的测序的一个重要优势是Phi 29 DNA聚合酶的高准确性,确保了环状模板的准确扩增。此外,由于DNA纳米球在流动池上保持不动,它们不会产生光学重复,并且不会干扰相邻的DNA。

DNBSEQ-G99(G99)

DNBSEQ-G99(以下简称“G99”)基因测序仪采用的是基于聚合酶链式反应(PCR)原理的测序技术。测序过程中,首先使用特定的引物引导 DNA 序列进行体外扩增,然后添加一种含有测序所需的四种不同颜色的 dNTP(脱氧核苷酸)和荧光标记物。当引物与待测序列结合后,聚合酶开始合成新的链,同时荧光标记物被激活并发出不同颜色的荧光。通过记录这些荧光信号,并使用计算机进行数据分析和解码,最终确定每个碱基的序列。

G99突破性地实现了12小时可完成PE150测序,从用户需求出发,在提供高质量的测序数据的同时,做到快速、简单、灵活,能为测序工作带来更好的体验,应用场景大大扩展了。

而且DNBSEQ-G99获批国家药品监督管理局(NMPA)医疗器械注册证(国械注准20233221289)。此次获批意味着,中小通量测序仪中的“速度王者”DNBSEQ-G99被准许在国内市场应用于临床,将能够充分发挥其快速、灵活的优势,服务于临床方向的应用需求。

第三代测序技术

第三代测序技术的原理主要基于单分子测序或合成测序方法,通过直接读取DNA分子的序列来进行测序。

单分子测序:通过将DNA固定在表面上,并使用荧光染料或其它探针进行测序。

单分子实时测序(SMRT):使用PacBio公司的SMRT技术,通过监测DNA聚合酶在DNA模板上的荧光信号来进行测序。

纳米孔测序(Nanopore):使用Oxford Nanopore Technologies(ONT)的纳米孔测序技术,通过将DNA分子通过纳米孔,测量通过纳米孔的电流变化来进行测序。

合成测序:通过在反应体系中逐步合成DNA序列,并使用荧光标记的核苷酸来标记每个碱基。第三代测序技术通常具有较长的读取长度,可以读取数千到数百万个碱基。

第三代测序技术的不断发展和改进,为基因组学研究提供了更多的可能性,可以更好地解析复杂的基因组结构和功能。适用于长片段的测序,如全基因组测序、长读段转录组测序、甲基化测序等。然而,第三代测序技术也面临一些挑战,如测序错误率、数据处理和分析等方面的问题,需要进一步的研究和改进。

市场上的其他三代测序平台:

MinION:MinION设备是一种便携式的纳米孔测序仪器,可以实现实时测序,并且具有较小的体积和较低的成本。

GridION:GridION设备是一种高通量的纳米孔测序仪器,可以同时进行多个样品的测序。

PromethION:PromethION设备是一种高产量的纳米孔测序仪器,可以进行大规模的基因组测序。

此外国内目前也有多家公司已推出或正在开发三代测序仪,包括真迈生物,齐碳科技等。

03
DNA测序的前步骤及注意事项

测序将继续变得越来越高效和经济实惠,彻底改变与基因组学相关的多个领域。目前,所有高通量测序(NGS )方法都需要文库制备。该方案发生在 DNA 片段化之后,其中接头连接到每个片段的末端。接下来通常是 DNA 扩增步骤,以产生一个文库,然后可以通过 NGS 平台进行测序。

➦1

样品制备分步指南

样品制备的本质是将生物样品中的核酸混合物转化为不同类型的文库,以准备进行NGS技术所需的测序步骤。如果未正确遵循方案,测序将会受到影响。每个准备步骤都是基础性的,并且根据样本和NGS平台的类型有不同的考虑因素。因此,在开始实验之前,考虑如何执行最有效的方案以确保最高质量的结果非常重要。

样品制备的一般步骤如下:

步骤1:提取遗传物质

这是每个样品制备方案的第一步。从各种生物样品中提取核酸(DNA 或 RNA)。

步骤2:文库准备

生成文库需要一系列步骤,最终目标是将提取的核酸转换成适合所选测序技术的格式。这是通过将目标序列片段化至所需长度,然后将特定的接头序列连接到这些目标片段的末端来完成的。

适配器还可以包括条形码,识别特定样品并允许多重分析。片段化可以通过物理或酶促方法完成。

步骤3:放大

这是一个可选步骤,但通常也是必需的。这取决于 NGS 的应用和样本量。扩增对于获得足够的覆盖范围以对含有少量起始材料的样品进行可靠测序至关重要。聚合酶链式反应(PCR) 是增加 DNA 量的常用方法。有关可实现小样本核酸检测的 PCR 方法出现的更多信息。

步骤4:纯化和质量控制

此步骤是必要的,以去除可能阻碍测序的任何不需要的材料。一些NGS平台可能对尺寸要求较窄,因此丢弃太大或太小的片段可以提高测序效率。最佳文库大小由测序应用决定。这种“清理”通常通过基于磁珠的清理或琼脂糖凝胶来完成

质量控制是进行测序之前的最后一个过程。确认 DNA 的质量和数量可以提高测序数据的可信度。后续的实验既耗时又昂贵,因此需要严格的质量控制步骤以确保所有样品都适合其应用。

➦2

样品制备中的常见挑战

挑战 1

许多样本是从有限数量的样本或甚至单个细胞中提取的。它们本身并不能提供足够的遗传物质,因此需要进行 PCR。然而,该扩增步骤很容易给样品引入偏差。PCR 重复是指存在完全相同的 DNA 片段的多个拷贝。太多的 PCR 重复会导致实验的测序覆盖率不均匀

解决方案 1:消除所有偏差来源有些不可能,但了解偏差发生的位置并采取所有实际步骤将其最小化非常重要。高 PCR 重复率表明文库制备需要进行一些修改,可能需要提高 NGS 文库的复杂性。

许多程序都可以删除 PCR 重复项,最常用的是 Picard MarkDuplicates  SAMTools。此外,特定的PCR 酶已被证明可以最大限度地减少扩增偏差。最终,文库制备的目标是最大限度地提高样品的复杂性,并最大限度地减少扩增造成的偏差。

挑战 2

建库效率低下是样品制备过程中面临的问题。具有正确适配器的片段比例较低反映了这一点。其后果是获得的测序数据量减少,嵌合片段数量增加。嵌合读数源自基因组中彼此不相邻的部分,并且是测序期间错误的来源。

解决方案 2:据报道,PCR 产物的有效A 加尾可防止嵌合体形成,该程序是通用的,可应用于多种不同的文库构建技术。此外,链分割伪影读数 (SSAR) 已被建议减少样本中嵌合伪影的数量,并且嵌合体检测程序可用于过滤原始序列,以实现仅 1% 的总体嵌合率

挑战 3

样品污染是一个固有的问题,因为单独的文库通常是并行制备的。最可能的主要污染源是预扩增,这是一种在 PCR 之前增加核苷酸序列量的方法。

解决方案 3:可以通过质控,阴性对照,设置重复等步骤识别污染,确保在样品制备过程中使用无菌技术和无菌实验条件,以防止外源性污染的引入。

此外使用独特的条码和标签对样品进行标识(谷禾所有样本全程唯一条形码溯源识别管理),以避免混淆和交叉污染。最后,做好定期清洁和消毒:定期清洁和消毒实验室设备和工作区域,以减少污染的积累和传播。

挑战 4

文库制备的巨大成本主要归因于实验室设备、需要经过培训的人员和试剂成本。

解决方案 4:通过优化实验步骤和条件,可以减少试剂的使用量和浪费,从而降低成本。确保实验室人员接受适当的培训和技术支持,以提高实验的效率和准确性。与其他实验室或研究团队合作,共享设备和资源,共同承担成本和实验负担。随着自动化技术变得越来越流行,样品制备的准确性和效率可能会提高。

04
NGS测序过程注意问题

碱基平衡

什么是碱基平衡?

测序中一个不可忽视的原则就是碱基平衡,是指测序过程中,每个循环中A、C、G和T四种碱基,比较均匀地存在。需要兼顾的平衡度与复杂度。在测序过程中,保持碱基平衡是非常重要的,可以确保测序结果的准确性和可靠性

什么是碱基不平衡文库?

就是扩增子产生的文库,扩增子的特点是有特定的起始位点的。反应到测序图像上,就会呈现一张照片特别亮,光点很多,而其他三张照片就特别暗。这时软件做空间上比对就比较难。结果是判断的可靠性比较差,导致对于碱基的判读就会出现错误,从而导致测序质量值大幅度下降。一般添加诸如基因组DNA文库,或掺入大量的平衡碱基文库,包括phix文库等。同时,也可以尽量多掺入不同类型的扩增子文库。

此外,碱基平衡还涉及到检测和纠正测序过程中的碱基偏差。在测序过程中,可能会出现碱基的插入、缺失或错误,这些错误会影响测序结果的准确性。为了纠正这些错误,开发了各种生物信息学工具和算法,例如质量控制和碱基校正等。

文库长度

文库长度含两侧测序接头和插入目标片段,整个文库的长度范围不能过宽,一般建议在250bp-450bp之间比较好,超过600bp以上就会造成一些不利影响。

过长的文库长度会降低测序效率

在Illumina测序等高通量测序平台上,测序片段长度会影响测序的质量和效率。过长的文库长度会增加测序过程中的错误率,并且会导致测序片段的读取长度变短。这会降低测序的可靠性和准确性,影响后续的生物信息学分析和数据解读。但是如果文库片段过短的话,该短片段测序到后期,就是要测接头序列了,有的时候连接头序列都测完了,那就没有信号了,后续会读取一些假信号,降低测序质量值。

过长的文库长度会降低簇密度

簇密度是基于单次只测一个碱基的边合成边测序原理,要求对各个分子簇的反应时间要求一致。也就是各个分子簇必须同时进行反应。理想状态当然是如此,但是实际PCR反应过程中,各个分子的反应时间还是不尽相同的(一般体系和酶要控制好)。因此,会产生有的分子簇内的分子反应的快,有的慢的情况过长的文库长度会降低簇密度。在Illumina测序中,DNA片段会被固定在测序芯片上的聚合酶链反应(PCR)产物中,形成簇。过长的文库长度会导致PCR扩增效率降低,从而降低簇密度。低簇密度会减少每个簇中的测序片段数量,进而降低测序的覆盖度和深度,影响后续的数据分析和解读。

过长的文库长度可能导致碱基偏移

在测序过程中,由于DNA聚合酶的滑动等原因,长片段的文库容易出现碱基偏移的情况。

05
二代测序数据质量评价

数据量(yield)

数据量指一次测序所获得的PF数据的总量。注意,是PF数据(PF数据是指通过滤波后的有效测序数据,即通过质量控制筛选后的测序片段),而不是原始数据。数据量当然越多越好,实际成绩与测序仪型号有关,不同的机器,产量不一样。

PF数据的总量是衡量测序深度和测序质量的一个重要指标。较高的PF数据总量表示测序过程中得到了更多的有效测序片段,可以提供更高的测序覆盖度和深度,从而提高后续数据分析的可靠性和准确性。

Q30

Q30是指在测序过程中,质量值(Quality Value,QV)大于或等于30的碱基。质量值是根据测序仪器对每个碱基的测量结果和信号峰值计算得出的,用来表示该碱基的质量好坏。Q30值越高,表示测序数据中高质量的碱基比例越高。

by:Alexander William Eastman

需要注意的是,Q30的大小与测序片段(read)的读长有关如果读长较长,即测序片段包含的碱基数较多,那么要求每个碱基的质量值都达到或超过30就更加困难,因此平均%Q30可能会降低。相反,如果读长较短,即测序片段包含的碱基数较少,那么要求每个碱基的质量值达到或超过30就相对容易,平均%Q30可能会提高。

比对率(mappingrate)

将测序数据与参考序列(reference)进行比对,是测序数据分析中的一项重要步骤。比对率是指在比对过程中,测序数据与参考序列完全一致的碱基占测序数据总碱基数的比例。比对率越高,表示测序数据的准确性和可靠性越高。在细菌16S测序中,可以根据具体的需求选择适合的比对工具。

常用的比对工具是基于Smith-Waterman算法的BLAST(Basic Local Alignment Search Tool)和基于Burrows-Wheeler变换的Bowtie、BWA等工具。高比对率是测序数据质量好的重要指标之一。它表示测序数据的准确性和可靠性较高,能够提供更准确的基因组信息和变异位点等重要信息(在谷禾16s测序中,尤其粪便样本约超过 70%能比对到)。在后续的数据分析和解读中,高比对率的测序数据更有助于准确地进行变异检测、基因表达分析、功能分析等。

需要注意的是,比对率受到多种因素的影响,包括测序数据质量、参考序列的准确性、数据库以及比对算法的选择等。在进行测序数据分析时,需要综合考虑比对率、测序数据质量和其他相关指标,以获得准确可靠的分析结果。

覆盖度(coverage)

由于测序数据的生成过程中存在一些技术和生物学上的随机性,导致不同区域的测序数据的覆盖深度(coverage depth)是不一样的。

覆盖深度是指在某个特定位置的测序数据的读段数目或测序碱基数目。覆盖深度越高,表示该位置的测序数据越丰富,测序结果的准确性和可靠性越高。

需要注意的是,覆盖深度的均匀性和高低受到多种因素的影响,包括测序深度、测序技术、样本质量等。

重复率(duplicationrate)

在二代测序文库的构建过程中,除了无PCR流程(PCR-free approach),其他方法都需要进行PCR扩增。PCR扩增会导致染色体的不同区域放大程度不一致,有部分序列被过度放大。这是一种人为引入的偏差。重复率与文库构建试剂的质量有关,对于人类全基因组测序来说,通常<10%。

捕获率(capturerate)

杂交捕获建库是通过探针杂交捕获来从基因组文库中富集相应序列的,探针杂交捕获存在着捕获效率高低的问题,因此考察、评价这一步骤成败、好坏的参数就是捕获率,越高越好。捕获率与所用的捕获试剂有关,不同的试剂,捕获率不同。

06
结 语

高通量测序操作包括样品准备、文库构建、PCR扩增、测序仪器运行等。只有按照标准SOP规范操作,才能保证实验的准确性和可重复性。新测序仪平台和技术的不断出现和改进,使得高通量测序无论通量、质量、速度和成本都在快速进步,高通量测序的应用范围也大大得到拓展,不久的将来有望以低成本随时随地的开展高通量测序应用。

什么是16S rRNA,rDNA, 菌群研究为什么用16S测序,细菌如何命名分类?

谷禾健康

当谈到肠道菌群研究时,16S测序是一种常用的方法,它在了解微生物组成和多样性方面非常重要且实用。

16S rRNA是细菌和古细菌中的一个高度保守的基因片段,同时具有一定的变异性。通过对16S rRNA基因进行测序,可以确定微生物群落中存在的不同菌属和菌种,并评估它们的相对丰度

针对肠道菌群16s测序概括起来可以了解以下内容:

揭示微生物组成:通过16S rRNA测序,可以获得关于肠道菌群中存在的不同菌属和菌种的信息。这有助于了解菌群的组成,包括有益菌、有害菌和其他微生物的相对丰度。

探索微生物多样性:16S rRNA测序可以评估微生物群落的多样性水平。通过分析不同样本中的菌群组成和多样性指标,可以比较不同个体、不同健康状态或不同治疗干预对微生物多样性的影响。

鉴定潜在病原菌:通过16S rRNA测序,可以鉴定肠道中存在的潜在病原菌。这有助于了解潜在的疾病风险,并为相关疾病的预防和治疗提供指导。

监测治疗效果:在临床研究中,通过定期进行16S rRNA测序,可以监测治疗干预对肠道菌群的影响。这有助于评估治疗效果,并为个体化治疗提供依据。

指导个体化营养干预:通过16S rRNA测序,可以了解个体的肠道菌群状态,进而指导个体化的营养干预。根据菌群组成和功能,可以制定相应的饮食方案,促进肠道健康和营养吸收

以上总结了16s对于了解肠道菌群的重要价值,今天本文主要分享和介绍16s测序相关的定义和术语,以及菌群命名的规则等。

01
什么是16S rRNA 和16S rDNA ?

正确的说法是16S rRNA(不是16s rRNA或16s rDNA)。

16S rRNA 代表16S核糖体核糖核酸 (rRNA),其中S(Svedberg) 是测量单位(沉降率)。该rRNA是原核核糖体小亚基(SSU)以及线粒体叶绿体的重要组成部分。

下图显示了16S rRNA(简称16S)如何参与原核核糖体。

•16S rRNA在原核生物中发挥重要功能

16S rRNA是一种细菌古细菌中常见的核糖体RNA分子。它在细胞中起着重要的功能,包括参与蛋白质合成的核糖体组装识别启动子序列的功能。

由于16S rRNA在细菌和古细菌中具有高度保守的序列区域和变异的序列区域,因此它被广泛用于细菌分类进化研究中。

相比之下,16S rDNA这个术语并不常用。rDNA是指编码核糖体RNA的DNA序列,因此16S rDNA可以理解为指代编码16S rRNA的DNA序列。

•科研中通常使用16S rRNA

在科研文献和学术讨论中,通常更常见地使用16S rRNA测序或16S ribosomal RNA测序。这种测序通常针对编码16S rRNA的DNA序列进行扩增测序,用来研究微生物的多样性和进化关系,特别是细菌和古细菌。

通过对16S rRNA基因进行测序,可以对微生物群落的组成和结构进行分析。这项技术在微生物学、生态学、医学农业等领域有广泛的应用。

02
为什么选择16S rRNA作为分类学和生态学的DNA条形码分子?

要用作DNA条形码,基因应具有以下特征:

•已知的细菌和古细菌都具有16S rRNA

它应该无处不在。否则,我们不能包括所有生物。已知细菌和古细菌的所有成员都具有16S基因

它应该包含足够的系统发育信息。16S大约有1500bp长,不算太短也不算太长。

原核生物中发现的16S基因内的遗传变异足以用于广泛分类范围的系统发育分析。它成功地用于推断门之间的系统发育关系,同时也用于同一属的物种之间的比较。

•容易通过PCR扩增

它应该很容易通过PCR扩增。16S基因有多个保守区域可以作为引发位点。这成为基于NGS的短读长测序的一个显著优势

经过多年的国内外研究和检测积累,我们拥有几乎所有已知细菌和古菌物种的16S序列数据库。通过在这些数据库中搜索16S序列,即使没有严格的分类学知识,也可以识别新分离的菌

03
16S的可变区和该选择什么样的PCR

引物用于扩增

已知细菌16S之间的序列变异分布不均匀。在细菌中鉴定出9个高变区,分别命名为V1至V9。

从长度来看,全长16S长度为1.5kb左右,单菌落的16S全长sanger一代测序仍然是菌种鉴定的主要手段,纳米孔和Pacbio的三代测序可以高通量的获得全长序列,对于希望高分辨率的分析菌种的研究有一定优势。

•三代测序建库成本较高,测序深度较低

三代的测序准确度目前逐渐改进,直接测序准确度可以在90%以上,纠错后可以提高到97~99%以上,已足够提供高精度的分类。三代目前主要问题在于建库成本相对较高,通过使用barcode可以降低部分但仍然偏高,此外普遍测序深度相对于二代测序要低许多

•二代测序由于读长限制需要引物进行扩增

由于二代测序读长限制,无法使用高通量测序技术对16S rRNA整个基因全长进行测序,因此必须针对基因的某一片段设计引物进行扩增测序

注:虽然有大量的文献研究不同片段的优缺点,但由于采用的样本类型区域引物以及分析角度的不同,尚没有针对所有样本的最佳可变区片段的共识。

基于大量项目经验和文献调研, 目前最主要的可变区选择是V4区和V3V4区,V4区长度为256bp左右,加上两侧引物长度为290bp左右,使用双端2x250bp或2x150bp可以测通,此外如454、life、Illumina Hiseq 4000, Illumina Novaseq 6000的测序平台读长也可以主要涵盖该区段读长。

•16S V4 引物通用性是所有可变区中最高的

传统的认知中,普遍认为测序片段越长,测到物种数据就越多,故倾向选择16S V3V4。然而16S V4(515-806)引物通用性相对是所有可变区中最高的。且在大规模菌群调查研究中,如人体菌群研究HMP,地球微生物计划EMP,欧洲的FGFP、美国肠道计划AGP以及全球土壤菌群调查,都采用V4区作为检测区域。16S V4目前仍然是国际研究中使用最广泛和认可的检测区域。

04
细菌名称的控制

细菌的命名法和命名受《国际原核生物命名法典》 (简称《原核生物法典》)的约束 ,但实际物种的分类则不然。例如,大肠杆菌(Escherichia coli)这个名称受《原核生物守则》的规范,但物种本身的特性和分类学分类不受规范。这意味着没有官方分类法,只有名称受到控制

因此,“有效物种”、“正式物种”或“官方物种”等术语没有意义。只能验证名称,因此可以使用 “具有有效发布名称的物种”。

05
物种名称是如何形成的?

物种名称应由二项式系统的两部分组成:

(1)通用名称和(2)特定词缀

如下示例:

该组合代表“物种名称”,并且在命名系统中应该是唯一的。所有分类群的学名必须被视为拉丁文;物种等级以上的属群名称是单个词

•生物分类按照不同等级

名称被组织成一个层次系统。

门(Phylum):门是细菌分类的最高级别之一,代表着细菌的大类别。细菌门包括了多个相关的纲和目。

纲(Class):纲是细菌分类的次级别,比门更具体。同一纲的细菌通常具有一些共同的特征和特性

目(Order):目是细菌分类的更具体级别,比纲更详细。同一目的细菌通常具有更相似的形态、生理特征和生态习性。

科(Family):科是细菌分类的更具体级别,比目更详细。同一科的细菌通常具有更相似的基因组组成和代谢途径。

属(Genus):属是细菌分类的更具体级别,比科更详细。同一属的细菌通常具有相似的形态生理特征和基因组组成。

种(Species):种是细菌分类的基本单位,代表着具有相似形态和生理特征的细菌群体。

亚种(Subspecies):亚种是种的更具体级别,用于进一步划分具有细微差异的细菌

目前,门等级不受原核代码控制。提议将“门”纳入守则,但该提案尚未得到控制原核生物守则的机构国际原核生物系统学委员会(ICSP)的讨论和批准。

在细菌分类中,门、纲、目、科、属、种和亚种的命名规则和方法遵循国际细菌命名法。

以下是一些要注意的事项:

命名规则:细菌的命名应该是拉丁化的,以便在全球范围内使用和理解。通常使用斜体字体或以斜体书写。

门、纲、目、科、属、种和亚种的命名:这些分类级别的名称通常是基于拉丁词根、描述性词语、地名、科学家的名字或其他相关特征来命名的。例如,属名可以以科学家的姓氏命名,种名可以以形容词或名词来描述特定的特征。

•每个细菌分类级别的名称是唯一的

命名的唯一性:为了避免混淆,每个细菌分类级别的名称必须是唯一的。这意味着同一级别下的不同分类单元不能有相同的名称

命名的正式发表:细菌分类的名称需要通过正式的科学出版物发表,以确保其被广泛认可和接受。这有助于维护分类的一致性和准确性。

命名的修订和更新:随着科学研究的进展和新的发现,细菌分类可能需要进行修订和更新。新的分类单元可能会被提出或已有的分类单元可能会被重新归类。这些修订和更新需要经过科学界的讨论和认可

例如下面是假单胞菌菌名称和分类:

这些名称是由提出物种并将其分配给属的科学家给出的。例如, Thermacanus属已被提出,但并未将其归属于已知科。在NCBI分类学中,它属于芽孢杆菌目的暂定科“ Bacillales Family X. Incertae Sedis ” 。

EzBioCloud数据库将每个物种分配在完整的等级系统下,Thermicanus 被分配在暂定创建的家族“ Thermicanus_f ”下(请注意,这是一个无效名称,并且不是斜体)。当然,任何人都可以通过发表提案来提出Thermacanaceae家族的建议。

06
如何验证名称(有效发布)?

如前所述,名称由原核代码控制。要验证名称,该名称应包含在下述列表之一中。

▸ 批准的细菌名称列表

该论文由Skerman、McGowan 和 Sneath于1980年发表 ,标志着原核生物命名法的新开始。

此列表中的任何后续更改均由《国际系统与进化微生物学杂志》(IJSEM)(前身为《国际系统细菌学杂志》(IJSB))发布。

IJSEM中发布了两种类型的更新列表,即“通知列表”和“验证列表”。

▸ 通知列表

IJSEM国际原核生物系统学委员会(ICSP)和国际微生物学会联盟(IUMS)细菌学和应用微生物学部的官方期刊。这意味着IJSEM是原核生物命名法的官方期刊。但是注意,没有官方的细菌分类法

任何包含在IJSEM中发布的名称更改(新分类群或名称更改)的分类提案都将自动由IJSEM的列表编辑进行审核。如果论文符合《原核生物守则》的要求,则拟议的更改将被列入“通知列表”并被正式“验证”。

▸ 验证列表

原核代码还允许科学家有效验证在IJSEM以外的期刊上发表的名称。一旦名称被公布,就被称为“有效公布”。

任何关心科学的人都应该确保任何有效发布的名称都得到验证,方法是将出版物PDF发送给 IJSEM,并证明(对于物种和亚种)指定的类型菌株可以不受限制地从位于不同地区的至少两个公共培养物种保藏中心获得。

这可以由包括作者在内的任何人来完成。不这样做的带来的后果可能是有害的,因为该名称“有效发布”但从未“验证”。如果满足原核生物守则的所有要求(对于新物种和亚种,特别是规则27和30),IJSEM 的列表编辑将在验证列表中添加名称。

▸ 无效名称

不幸的是,在某些情况下名称无法验证。例如:

•一个名称在1980年之前被广泛使用,但在1980年没有被列入批准的细菌名称列表。

•一个名字在IJSEM之外发布,但从未被验证。

•没有人将PDF和进一步所需的文档发送给 IJSEM 进行验证。

•该出版物不符合准则的最低要求。

注:未有效公布的名称要用引号括起来,例如“Selenomonas Massiliensis”以区别于有效公布的名称。

•验证新物种的最低且唯一要求

根据原核生物守则, 验证新物种和亚种名称的最低且唯一的要求是:

必须指定类型菌株。有时,描述新物种的论文不会提及哪个菌株是模式菌株。在这种情况下,名称无法验证。

•模式菌株应保藏于两个不同国家的两个培养物保藏中心。这确保了典型菌株仍然可用,例如当培养物保藏中心停止其活动或丢失菌株时。

•模式菌株必须通过培养物保藏中心可供任何人使用。专利菌株不能作为模式菌株。如果您想为某个菌株申请专利并限制其分布,则它不能作为物种或亚种的命名类型。

小结

以上总结起来如下:

确认命名规范:首先,确保您了解国际微生物学命名规范,如IJSEM国际原核生物系统学委员会。这些规范包括命名原则、命名要求和规则,以确保新细菌名称的准确性和一致性

检查已有命名:在确定您的新细菌名称之前,进行一次详细的文献调研,以确保该名称没有被其他研究人员使用或已经被正式命名。搜索相关数据库和文献,如国际细菌命名索引(International Journal of Systematic and Evolutionary Microbiology)和PubMed,以避免重复命名

提交命名申请:一旦您确认您的新细菌名称符合命名规范并且尚未被使用,您可以准备提交命名申请。通常情况下,命名申请需要包括详细的描述、分类学特征、基因序列数据等相关信息。您可以向国际微生物学协会或相关的命名委员会(前面说的IJSEM)提交命名申请。

合作与审查:在提交命名申请之前,建议与其他研究人员、领域专家或命名委员会进行合作和讨论。这样确保命名申请符合规范。

审核和正式发布:一旦命名申请被提交,相关的命名委员会将对其进行审查。如果您的命名申请符合规范,经过审核后,新细菌名称将被正式发布,并被纳入相应的细菌命名索引和数据库中。

07
为什么使用正确的名称和庞大菌群

数据很重要?

细菌名称的设计或命名是为了科学地组织,以提供基于系统发育的生物学见解;使用分层分类系统可以实现这一点。

•正确的名称对于解释微生物与其他数据的关联非常重要

例如,我们认为大肠杆菌与其他大肠杆菌物种比与芽孢杆菌物种有更多的表型特征。因此,使用正确的名称对于解释微生物组和其他类型的数据至关重要。

不幸的是,在当前的命名法中仍然有许多名称位于错误的位置。例如,Clostridium scindens因其在人类肠道菌群胆汁酸代谢中的重要作用而闻名,并且仍然保留着Clostridium的名称。然而,它甚至与梭状芽胞杆菌属并不接近 ,应归类为毛螺菌科的一个新属

真正的梭菌属(Clostridium)属于梭菌科(Clostridiaceae)。例如Ruminococcus Sp(梭状芽胞杆菌

梭状芽胞杆菌簇XIVa和IV 是已知在人类微生物组发挥主要作用的细菌群。这些细菌簇在1994年才进入16S rRNA系统发育。

然而梭菌簇XIVa和IV 不代表正式命名法,也不表示单个分类群,例如属或科。自1994年以来,许多最初指定的属于梭状芽胞杆菌簇XIVa和IV的物种已被重新分类为新属

•一些细菌存在错误的命名和分类

然而,这些簇中仍然存在错误分类的梭菌属物种,从而保留了旧名称。比如:Faecalibacterium prausnitzii(普拉梭菌),革兰氏阴性,对氧极度敏感,属于梭菌科,厚壁菌门。

该物种就是属于Clostridium clusterIV分组的Clostridium leptum group柔嫩梭菌类群,是该类群的最优势菌种。一般中文翻译柔嫩梭菌指的就是这个类群,其代表物种就是普氏栖粪杆菌,又名普拉梭菌。

以下是当前EzBioCloud数据库中对应于梭状芽胞杆菌簇XIVa和IV的分类群。

Candidatus“是一个拉丁语词汇,通常用于微生物学中。它表示对一种微生物的命名,表示该微生物是一个新发现的候选物种,尚未被正式分类或命名。在中文中,”Candidatus“通常被翻译为”候选物种”或”候选菌种”。这个术语用于描述那些已经被发现但尚未被完全分类的微生物,通常是由于它们的特殊性质或难以培养。

总结来说,使用正确的细菌名称可以确保科学研究准确性和一致性。细菌命名规范旨在为每个细菌物种提供唯一的、明确的名称,以避免混淆和误解。通过使用正确的名称,研究人员可以准确地标识和描述细菌物种,使得研究结果具有可比性,并促进科学交流和合作。

使用庞大的菌群的数据库,便于数据整合和共享。通过将新细菌与已知的细菌物种进行比对,可以确定其在分类学上的位置和相关信息。这有助于构建细菌分类树、建立物种间的关系,并为进一步的研究提供基础数据。

此外,正确的细菌命名和细菌样本数据库的比对可以促进研究进展和新的发现。通过对新细菌进行分类和命名,研究人员可以更好地理解细菌的多样性、生态学角色和潜在的应用价值

人体肠道菌群健康检测需要依托本地化人群菌群样本检测的大数据库,区分菌群的组成和功能个体间存在差异,并且与本地人体的生理状态、生化代谢、免疫炎症以及疾病风险等建立关联。通过建立大数据库,可以收集大量的菌群样本和相关数据,进行统计学分析和模式识别,从而揭示不同菌群组成与人体健康之间的关联。

总之,使用正确的细菌名称和拥有庞大的细菌样本数据库进行比对是确保科学研究准确性、促进数据整合和共享、推动研究进展和发现的关键步骤。

08
候选物种

在某些情况下,即使一个物种是真实的并且具有科学重要性,也无法满足原核生物守则的基本要求

根据正式命名法,这些物种的名字永远不会得到有效的公布。因此,分类学家创造了“Candidatus”一词来支持暂定命名。

对于Candidatus名称,没有纯培养物或分离株,因此没有典型菌株。由于Candidatus不属于正式命名法,因此不受原核法典管辖。

一个典型的例子是Candidatus Pelagibacter ubique该物种含有来自海洋的未培养或培养的细菌,可能是地球上最丰富的物种,因此它一定非常重要。

它从未得到验证的原因是该物种可以培养,但不能以培养物保藏所可用于长期储存的方式或规模进行培养。因此,无法满足该准则的最低要求。此外,特定的加词(ubique)格式错误。

并非所有Candidatus类群都得到了很好的表征,因为Candidatus的等级不受原核生物守则的规定

•一般Candidatus的最低标准:

•提供全长高质量16S 序列,因为该基因是细菌和古细菌分类学的框架。

未受污染且相当完整的基因组序列的可用性(通过域级核心基因的存在进行检查)。

•应提供最低限度的生态和代谢特征

09
如何命名一个新的分类单元?

名称最好能代表该物种的典型特征。例如, Plasticicumulans这个名字的意思是“积累的塑料”。该属因积累生物塑料聚羟基脂肪酸酯而得名。

命名新分类单元的另一种流行方式是以人的名字命名。这个人应该有对科学做出贡献,尤其在微生物方面。著名的埃希氏菌(Escherich)和沙门氏菌(Salmon是以微生物学家埃舍里奇(Theodor Escherich)和萨蒙(Salmon, D.E.)的名字命名的。

此外,以地理位置命名也很流行,但一般不鼓励。

客服