谷禾健康
随着全球人口老龄化加速,老年人多病共存与多重用药已成为常态,这给药物疗效和安全性带来了巨大挑战。
多药联用本身在控制多重危险因素、降低心脑血管事件方面具有明确获益;很多研究指出,多种药同时使用,住院、药物不良反应与全因死亡等风险往往显著上升。更棘手的是,在老年多病共存背景下,传统以单药证据为核心的处方逻辑,在面对真实世界的系统扰动时发现,同样方案,有人获益明显,有人疗效不足,甚至在疗效不佳的同时不良反应频发。
过去我们多从肝肾功能衰退、体成分变化、血浆蛋白结合率下降、受体敏感性改变,以及药物—药物相互作用来解释这种不确定性。但近十年的研究逐渐揭示一个被低估的关键变量:肠道菌群。
肠道菌群不仅能直接参与药物的转化、活化或灭活,还可通过代谢物谱改变、炎性衰老与屏障变化,沿着“代谢—免疫—屏障”三轴形成相互强化的级联反应,从而在药代动力学与药效学层面共同放大疗效波动与毒性风险。
基于此,本文围绕肠道菌群失调这一关键因素,阐述其通过”代谢—免疫—屏障“三轴相互作用,在老年多病共存与多重用药的临床背景下,对药物吸收、代谢和疗效的影响机制,并从代表性药物和治疗场景出发,阐明临床防治要点,为后续高质量试验设计与标准化评价体系的建立提供一些思考。
我们正处在一个不可逆转的全球老龄化时代。根据联合国的预测,到2050年,全球65岁以上的人口将占总人口的16.3%。
老年人普遍多病共存
世界卫生组织(WHO)将多病共存定义为”同一人体内存在两种或两种以上慢性疾病“。这听起来像是一个简单的数学叠加,实则是复杂的生物学重构。
流行病学数据显示,老年人群多病共存的患病率从15%-43%不等,且呈指数级增长。在我们国内,随着疾病谱从传染性疾病向慢性非传染性疾病转型,”高血压+糖尿病+冠心病+脑卒中“的组合已成为老年内科门诊的标准配置。
多药联用的益处和风险
为了管理多种慢性病,患者往往需要服用多种处方药。多药联用本身并非坏事。对于控制多重危险因素、预防心脑血管事件具有明确获益。但当药物数量超过5种时,风险陡然上升,例如住院率增加、药物不良反应增加、全因死亡风险上升。
在老年多病背景下,传统以单药证据为核心的处方逻辑,面对真实世界的系统扰动时,疗效与安全性的方差显著增大。
当多病共存遇上多重用药,药物的疗效和安全性变得极不确定。药物之间可能相互作用,而复杂的生理状况也让药物反应变得难以预测。这正是当前老年医学面临的核心难题之一。
传统观点认为,老年药代动力学改变主要源于肝肾功能衰退、脂肪/肌肉比例变化、血浆蛋白结合率下降。但近十年的研究揭示,肠道菌群构成了药物代谢的第三维度,在多药联用的老年人群中,这一维度的变异可能是疗效不确定性的最大来源。
肠道菌群:老年患者用药难题的关键一环
近年来的研究逐渐明确,肠道菌群不仅与消化相关,还深度参与免疫调控、代谢稳态与屏障维护。在老年人群中,其临床意义被进一步放大,原因主要有三点:
-个体差异更大
老年人因咀嚼/吞咽能力、胃肠动力、饮食结构与营养摄入能力变化,微生物群组成在个体间波动更明显。
-易受药物与疾病共同扰动
多病共存导致慢性炎症与器官轴(如肠-肝、肠-心、肠-肺)改变;多重用药(尤其抗生素、PPI、免疫抑制/抗肿瘤药物等)可改变群落结构与代谢功能。
特定药物和药物类别对肠道菌群影响的总结
编辑
doi: 10.1080/19490976.2025.2604867
-对药物治疗的影响:机制叠加而非单点效应
既往研究常把菌群影响分为三类来讨论。
问题在于:对老年多病共存患者而言,上述三类效应往往不是并列发生,而是形成相互强化的级联反应。也就是说,微生态失衡并非仅改变某一个药物的代谢,而是通过“代谢—免疫—屏障”三系统的协同失代偿,塑造一个对药物治疗不利的内环境:疗效更易不足,毒性更易放大,且波动更难预测。
下一章节,我们来详细了解代谢—免疫—屏障,它如何形成自我维持的恶性循环,并如何在药代/药效层面制造难以预测的真实世界差异。
在老年多重慢病与多重用药背景下,肠道微生态的紊乱正成为影响药物反应变异的新兴决定因素。菌群的异常不再局限于单一微生物水平的失衡,而会通过代谢-免疫-屏障三大系统的协同失代偿,引发药物动力学(PK)和药效学(PD)的广泛扰动。理清这种多轴联动机制,是实现精准干预的前提。
编辑
doi.org/10.1016/j.arr.2026.103023
代谢轴:药物转化的失控开关
很多口服药的结局,不只由肝肾功能决定——肠道菌群也在参与转化、激活、灭活与清除。
菌群主要从两条路影响用药
1) 直接改造药物分子
部分细菌能还原/脱羧/去甲基等,把药改形态,导致疗效或毒性变化。
2) 间接改造宿主代谢能力
健康菌群产生的短链脂肪酸、胆汁酸等代谢物,可影响肝脏药物代谢酶(如CYP、UGT等)的表达与活性;当菌群紊乱时,这类代谢物谱改变,可能让药物暴露升高或波动更大。
编辑
doi: 10.1080/19490976.2025.2604867
临床例子
注:老年人/多病共存/多药并用时,即使肝肾化验正常,也可能出现半衰期延长、血药浓度异常或ADR风险上升。
当遇到解释不清的疗效波动/不良反应,除了依从性、相互作用、肝肾功能,也可以把菌群状态纳入评估。
免疫轴:慢性低度炎症,正悄悄改写药物反应
老年人常见的菌群失调会提高机体对微生物相关分子(如LPS等PAMPs)的系统性暴露(其中一种来源是肠道通透性改变,下一个轴会详细了解),从而持续激活TLR4/NF-κB等通路,形成炎性衰老背景。
这会怎样影响用药?
1) 改变药代
慢性炎症可下调或扰动肝脏/肠道的药物处置系统(如部分CYP酶、转运体P-gp等),导致同样剂量出现血药浓度更高、波动更大,不良反应风险上升。
2) 改变药效
炎症会重塑靶器官微环境与免疫状态,使药物作用靶点是否可用、反应是否到位发生变化;在免疫相关治疗(如肿瘤免疫治疗、免疫抑制治疗、部分抗炎/免疫调节药)中尤其明显。
临床上你可能看到的矛盾现象
屏障轴:肠道屏障变薄,用药为什么不稳定?
在衰老、慢病与长期用药的叠加下,肠上皮修复能力下降,紧密连接与黏液层保护减弱,“肠漏”更常见——这不只是消化问题,也会直接影响药物反应。
两个核心后果
1) 吸收变得不确定
屏障受损与局部炎症会让肠道的通透性/转运发生改变:有的药吸收偏多,血药浓度升高;有的药吸收不稳,导致同剂量下疗效忽高忽低。
2) 全身稳态被扰动(并放大前两个轴)
屏障一旦松动,细菌成分与代谢产物更容易进入循环,促进低度炎症,进而影响肝药酶/转运体与靶器官微环境,从而形成肠漏 → 炎症 → 用药更波动的恶性循环。
临床上常见的表现
三轴不是并列问题,而是一个协同加剧的闭环
代谢-免疫-屏障三轴协同恶化的最终结果,是老年多病患者体内药物的药代动力学(PK,身体对药物的作用)和药效学(PD,药物对身体的作用)发生不可预测的改变。
PK改变
肠道屏障受损影响药物吸收;菌群代谢和肝脏酶活性改变影响药物的代谢和清除。这导致血药浓度要么过高(增加毒性风险),要么过低(导致治疗失败)。
PD改变
衰老本身就可能改变药物靶点(如受体)的敏感性。菌群失调引发的慢性炎症环境可以进一步改变靶组织的反应性,使得药物效果增强或减弱,或产生非预期的不良反应。
因此,理解这个三轴互作的复杂网络,对于在老年多病患者中实现安全有效的药物治疗至关重要。
老年多病状态下肠道菌群调节药物疗效的核心机制
编辑
doi.org/10.1016/j.arr.2026.103023
在处理患有多种疾病且服用多种不同药物的老年人时,肠道细菌与药物之间的关系变得至关重要。
老年多病患者的菌群失调与药物相互作用
编辑
doi.org/10.1016/j.arr.2026.103023
氯吡格雷 Clopidogrel
氯吡格雷是动脉粥样硬化性心血管疾病(ASCVD)二级预防中最常用的抗血小板药之一。但它有一个关键前提:需要在肝脏经CYP450酶系(尤其CYP2C、CYP3A相关通路)生物活化,才能产生真正抑制血小板的活性代谢物。
在多病共存的老年人群里,我们常看到“同样用药、抑制不够、血栓风险仍高”的情况。越来越多证据提示:肠道菌群失调及其引发的代谢—免疫—屏障轴紊乱,可能系统性地削弱氯吡格雷的有效反应。
下面我们来看这到底是怎么从肠道一路影响到血小板和肝脏的。
先决定药能不能起效——肝脏活化是门槛
氯吡格雷是典型前药(它最怕的是活化环节被压住):
老年人常合并慢性炎症、代谢异常、肝脏基础疾病、肠屏障受损与菌群失调——这些因素并不是彼此独立,而是会相互放大。
再看药效端:TMAO抬高血小板反应性,出现P2Y12旁路
肠道菌群可把膳食中的左旋肉碱、胆碱代谢成TMA,再由肝脏转化为TMAO进入循环。
TMAO升高不仅是风险相关指标,也可能参与机制:它可诱导TLR4介导的信号通路,机制研究提示可能促炎/促血栓,但尚需临床因果验证。
更关键的一点是“旁路效应”:即便P2Y12被抑制,血小板仍可能通过不依赖P2Y12的激活通路被推起来,于是临床上就表现为抗血小板效果不够/耐受倾向。
是谁在调CYP开关:T细胞与炎症信号如何改写药物活化?
CYP不是单纯的代谢酶,它受免疫—炎症信号调控。T细胞参与调控肝脏CYP2C与CYP3A表达,因此不同免疫状态下,氯吡格雷活化可能走向不同方向:
肠屏障受损经肠-肝轴放大炎症,压低CYP活化
多病共存老年人常伴慢性炎症、慢性肝病与心血管疾病,这些因素可破坏肠道紧密连接,增加通透性(也就是肠漏),促使炎症信号升级。系统性炎症常见TNF-α、IL-6升高,而这类促炎因子可能下调肝脏CYP酶,让氯吡格雷更难被充分活化。
菌群失调还可能伴随FXR–FGF15信号下降,扰动胆汁酸代谢,进一步削弱屏障与代谢稳态,让炎症-屏障受损-代谢紊乱更难刹车。
另一个值得关注的线索是黏膜免疫:肠黏膜免疫受损与致病共生菌(如AIEC)定植相关,提示IL-22信号受损;这会加重菌群失调与屏障障碍,经肠-肝轴放大代谢紊乱,并间接压低氯吡格雷的生物活化能力。
小 结
衰老肠道中的菌群失调触发代谢—免疫—屏障恶性循环,削弱氯吡格雷效应。
编辑
doi.org/10.1016/j.arr.2026.103023
三轴相互放大,最终削弱氯吡格雷的抗血小板作用。
地高辛Digoxin
地高辛是经典强心苷类药物,治疗窗很窄:剂量稍低可能无效,稍高就可能出现毒性与心律失常。因此,它对任何能改变肠道吸收、菌群代谢、炎症背景与转运蛋白(P-gp)的因素都格外敏感。
在多病共存的老年人群中,我们更容易看到“同样用药,却出现疗效不足或毒性增高、波动难控”的情况。由于其药代动力学特性较为敏感,容易受到患者肠道细菌影响。
菌群代谢:Eggerthella lenta如何把药变钝?
肠道共生菌 Eggerthella lenta 可通过其相关还原酶系统(如 强心苷还原酶)将地高辛转化为药理活性更弱/无活性的代谢物(二氢地高辛,dihydrodigoxin)。微生物失调导致该菌富集,从而使血清地高辛浓度降低至治疗阈值以下,最终因对心肌的正性肌力作用不足而导致心力衰竭治疗失败。
为什么炎症状态会把“窄治疗窗”变得更危险?
菌群失调不仅影响代谢,还可能通过免疫耐受破坏(如树突状细胞相关的免疫耐受下降)推动系统性炎症。与此同时,肠道屏障受损会促进LPS移位入血,激活TLR4通路,诱导TNF-α、IL-6等促炎因子升高。
对地高辛而言,这种炎症背景的风险在于:地高辛本就与心律失常风险相关,且其毒性更容易在电解质紊乱(如低钾)等情况下被放大。炎症信号进入心脏微环境后,可能增加心肌细胞的电不稳定性,从而提高地高辛相关心律失常的风险。
P-gp 如何决定地高辛的口服吸收上限?
地高辛是经典的 P-glycoprotein(P-gp)底物。P-gp 在肠上皮细胞腔面表达丰富,可把已吸收进入细胞的地高辛外排回肠腔,从而显著限制其通过肠壁进入血液的量,影响口服生物利用度。
动物证据也支持这一点:在保留人源 P-gp、缺失小鼠 P-gp 的模型中,口服后地高辛血浆浓度显著升高,提示P-gp外排是限制暴露的重要因素。因此从理论上说,抑制肠道P-gp活性,可能改善地高辛吸收。
老年多病共存为什么使地高辛疗效更不可预测?
多种因素叠加,使多因素健康问题老年人群中的药物相互作用更具变异性与不可预测性。
小 结
微生物可通过代谢—免疫—屏障三联机制调控地高辛的药代动力学与毒性。肠道菌群失调通过三条轴影响地高辛反应。
编辑
doi.org/10.1016/j.arr.2026.103023
二甲双胍Metformin
二甲双胍(metformin)作为2型糖尿病一线用药,其疗效部分依赖健康的肠道微生态环境;相反,菌群失调可能抑制二甲双胍的治疗效果。
代谢干扰:信号通路抑制与药物代谢加速
菌群失调(特别是拟杆菌属的丰度变化)可通过特定的酶学途径干扰二甲双胍的药代动力学和药效学。
免疫调节失衡:老龄化背景下的炎症干扰
在老龄化人群中,菌群失调与免疫系统的相互作用更为复杂。
屏障功能受损:系统性代谢紊乱的恶性循环
菌群失调导致的紧密连接蛋白降解和肠道通透性增加(即肠漏),不仅影响肠道局部环境,更具有全身性影响。
临床:多病共存老年患者适应不良
在多病共存老年人群中,肠道菌群失调会驱动一种不适应性的循环,形成代谢、炎症与免疫调控异常相互交织的三联网络。
肠道菌群在该循环三条轴中的作用,对于影响二甲双胍疗效至关重要。二甲双胍可作用于肠道微生物群以帮助调节代谢过程、调控免疫反应并维持肠屏障功能;然而,老年人中由衰老与多种慢性病共同导致的重度菌群失调也被证明会对上述结局产生负面影响。
在重度菌群失调状态下,二甲双胍对各轴的有益作用被削弱,最终导致其在多病共存老年患者治疗中的有效性出现极大异质性,甚至可能治疗失败。
小 结
肠道微生物群的代谢-免疫-屏障轴相互作用调控二甲双胍反应的变异性。在老年多病共存中,菌群失调通过相互关联的机制损害二甲双胍疗效。
编辑
doi.org/10.1016/j.arr.2026.103023
免疫检查点抑制剂ICIs
免疫检查点抑制剂(如抗PD-1/PD-L1抗体)的疗效高度依赖于机体的免疫基调(Immune Tone),而肠道菌群是这一基调的关键调节者。菌群失调通过干扰代谢重编程、加剧免疫衰老及破坏屏障功能,削弱T细胞的抗肿瘤应答。
代谢:短链脂肪酸匮乏,阻碍T细胞代谢重编程
在菌群失调期间,代谢轴的异常直接抑制了免疫细胞的抗肿瘤活性。
免疫衰老与分化失衡
老龄化背景下的菌群失调会加速免疫系统的无能化和肿瘤的免疫逃逸。
屏障破坏:系统性炎症干扰
菌群失调导致的物理屏障破坏是系统性干扰的源头。
总而言之,在老年多病患者中,一个失调的肠道菌群会从能量供应、免疫细胞平衡和全身炎症状态等多个维度,全面削弱ICIs的抗肿瘤效果。
小 结
肠道微生物群紊乱会破坏肿瘤微环境中的代谢—免疫—屏障网络,从而降低免疫检查点抑制剂(ICI)的疗效。菌群失调通过三轴失衡削弱ICI效应。
编辑
doi.org/10.1016/j.arr.2026.103023
全球人口老龄化与老年人多种慢性病患病人数增加并存。当前研究持续关注肠道微生物组失调与药物疗效之间的相互作用。
为有效应对这一问题,需要对更广泛且更具效能的治疗策略开展系统性研究与实施设计,并在三个层面的相互作用中统筹考量:代谢、免疫稳态与肠道屏障完整性。采用这一多维模型,可建立全面的调控框架,使研究者能够在系统层面借助网络药理学,精准靶向微生物组与药物治疗之间的相互作用。
益生菌
益生菌是调控肠道微生物组的多种方式之一,也是最常用的干预手段之一;其通常包含多种菌株,不同菌株因独特的代谢特征而产生不同治疗效应。
某些益生菌代谢产生的常见代谢物为短链脂肪酸(SCFAs)。研究表明,SCFAs可与CYP450酶(药物代谢酶家族的重要组成部分)直接相互作用;同时,SCFAs还可通过激活TLR/NF-κB通路增强机体免疫反应,并促进肠上皮细胞中紧密连接相关蛋白的生成。
与代谢类药物联用
多项研究提示,与不同种类的乳酸杆菌属和双歧杆菌属益生菌联用,可显著增强胰岛素、二甲双胍等降糖治疗的获益,其核心可归结为两条菌群介导的代谢调节路径:
不过总体来说仍然缺乏足够的预临床/小规模临床研究,高质量 RCT仍然不足。
-临床证据
胰岛素 + 乳酸杆菌
在1型糖尿病以及未使用其他降糖药的2型糖尿病人群中,联用可降低HbA1c;且这种改善与有益菌群上升(如 Bifidobacterium animalis、Akkermansia muciniphila)相关联。
二甲双胍 + 复合益生菌
例如以 L. rhamnosus Probio-M9、L. casei、L. plantarum P-8、以及 B. animalis subsp. lactis V9/M8(Probio-M8)等组成的组合,在与二甲双胍联用时可提升SCFAs水平,并通过改善胰岛素敏感性增强血糖调控。
抗感染与抗菌生态位竞争
乳杆菌补充剂具有一定的抗微生物效应,可在感染的预防与辅助治疗中发挥作用。其可能机制包括产生多种代谢物并改变局部理化环境,例如:
-代表性联合策略
Lacticaseibacillus paracasei LC11 + 蔓越莓 + D-甘露糖
可降低泌尿道感染复发(特定人群研究)。
乳酸杆菌/双歧杆菌 + 幽门螺杆菌三联疗法
提高根除率、并有望改善疗程耐受性。
肿瘤治疗支持
化疗与放疗常诱发显著的肠道菌群紊乱与黏膜损伤,进而表现为腹泻、黏膜炎、营养不良、炎症升高等一系列问题;在老年肿瘤患者中,这些问题更可能放大为剂量下降、延迟治疗甚至停药。
益生菌在这一场景下的价值更多体现为支持治疗。其有效性可归因于其能够稳定受损的肠道屏障并调节炎症和代谢。
鼠李糖乳杆菌GG+长双歧杆菌+嗜酸乳杆菌+粪肠球菌的组合
该组合已被证明能抵消这些影响。它们通过重建肠道紧密连接和减轻炎症来实现这一目标。
临床证据支持这一屏障恢复的重要性,它已与宫颈癌患者放疗引起的腹泻减少28%相关,从而减少了抗腹泻药洛哌丁胺的使用。
Bifidobacterium BB-536
可通过增加CD8⁺ T细胞向肿瘤浸润,增强抗PD-1免疫检查点抑制剂的疗效。
此外,益生菌通过减少体重增加、低密度脂蛋白(LDL)水平和与多西他赛治疗相关的菌群失调,有助于稳定代谢紊乱。
这些干预措施提高了患者的功能评分并改善了整体生活质量。总之,将益生菌纳入癌症治疗方案中可作为一项重要的支持性措施,有效减少肿瘤治疗相关的附带损伤,并提高患者对治疗方案的耐受性和依从性。
益生菌来源BEVs的跨器官信号:增强抗PD‑1免疫治疗的潜力
发表在《Nature Communications》的一项研究显示,肠道共生益生菌——双歧杆菌(Bifidobacterium)可释放细菌来源的细胞外囊泡(BEVs),这些BEVs能穿越肠屏障被机体吸收,并远程富集于肺癌肿瘤组织。
研究发现,BEVs可被肿瘤细胞摄取,通过TLR4–NF-κB信号上调肿瘤细胞PD-L1,并增强肿瘤微环境中免疫细胞的功能。
编辑
doi.org/10.1038/s41467-025-58553-4
动物实验中,联合给予BEVs和抗PD-1抗体可显著抑制肿瘤生长,较单用抗PD-1效果更佳。
编辑
doi.org/10.1038/s41467-025-58553-4
该机制提示,益生菌可能通过囊泡信号跨器官调节作用,帮助提升免疫治疗(如PD-1抑制剂)疗效。这为老年群体通过益生菌进行辅助抗肿瘤免疫调节提供了全新理论依据。
益生元
益生元(如菊粉与抗性淀粉)可作为有益菌群(如Faecalibacterium、Roseburia)的选择性底物,通过对有益菌的间接作用优化代谢—免疫串扰。
相较活菌制剂,益生元通常具有制剂稳定性更好、质量一致性更高、免疫安全性风险更低等优势,因此在体弱老年人或多病共存人群中,更适合作为低风险的长期辅助干预。
益生元的价值不止于改善菌,还可以作为饮食-微生物-药物三者之间的桥梁。通过改变菌群结构与代谢谱,进而影响宿主对药物的反应与耐受。
茯苓多糖 + 5-FU
动物研究提示其具有一定降毒/增效潜力——例如茯苓多糖可减轻5-FU相关体重下降与肠道损伤,可能与降低促炎因子、增强屏障功能及纠正菌群失调有关。
低聚果糖 + 二甲双胍
在饮食诱导肥胖动物中,低聚果糖与二甲双胍联用较单用进一步改善血糖与体重,并降低内毒素及炎症标志物水平,同时改善菌群。
多酚类既可被菌群转化为生物活性代谢物,也可反向塑造菌群组成,因此非常适合与药物形成代谢协同的联合策略。
多酚类+药物联合治疗非酒精性脂肪性肝病
编辑
doi.org/10.1016/j.jare.2024.03.004
粪菌移植(FMT)
粪菌移植(FMT)是一种独特疗法,通过递送健康供体的功能性菌群联合体来重建肠道微生态平衡。
FMT可调节胆汁酸代谢网络,并恢复产丁酸菌(如Faecalibacterium prausnitzii)的活性,以纠正菌群失调状态。
传统FMT给药方式包括结肠镜或灌肠;而口服胶囊递送与经内镜肠内管递送等新方式显著改善了患者耐受性与依从性。
与药物联用的证据示例
肿瘤免疫治疗(PD‑1/PD‑L1)
FMT可通过免疫重塑提高ICI疗效。
炎症性肠病(克罗恩病)
一项随机试点研究提示,FMT可能提高泼尼松龙治疗患者的临床缓解率,可能与屏障修复与SCFAs恢复相关。
高血压/心血管药物反应
在动物研究中,将“氨氯地平治疗后自发性高血压大鼠”的菌群移植给未治疗大鼠,可降低血压并改善血管舒张、氧化应激与Th17浸润等系统指标;而来自氢氯噻嗪处理动物的FMT未显示类似获益,提示FMT可能转移一种“代谢编程后的微生物表型”,但关键菌种与分子通路仍待明确。
目前FMT临床研究尚未形成标准化给药方案,因此需基于个体患者及其具体健康状态制定标准化剂量策略。迄今FMT研究主要聚焦于单次或短期治疗方案,尤其是在复发性艰难梭菌感染患者中;但对与衰老相关的虚弱等慢性状态的管理,可能需要重复和/或维持剂量方案。当前研究所收集的数据表明,老龄小鼠模型可产生与人类衰老相关的参考数据。
噬菌体疗法
噬菌体治疗是一种新型策略,利用噬菌体(感染细菌的病毒)对抗耐药菌感染,具有改变抗生素耐药性感染治疗范式的潜力。
通过靶向特定微生物,噬菌体可清除耐药病原体及相关菌群(如产生β-葡萄糖醛酸苷酶的E. coli),从而降低因抗生素相关毒素导致的药物再活化和/或代谢紊乱。例如,噬菌体能够从接受伊立替康治疗患者的肠道中清除产生β-葡萄糖醛酸苷酶的E. coli,从而阻止SN-38再活化所致的肠黏膜炎。
此外,这些噬菌体还可通过IL-22依赖的再生促进杯状细胞恢复,为黏膜屏障重建提供机制基础。病原清除与黏膜屏障重建的结合,对治疗多重耐药感染具有重要临床意义,尤其适用于老年人或免疫功能受损人群。
小鼠研究显示,经饮水口服给药(每日4×10⁸ PFU,连续31天)具有安全性证据;但目前尚未报道明确的人体剂量。
通过饮水口服噬菌体以改变肠道微生物组(并具良好安全性)具有前景,但仍需进一步研究以明确长期安全性与有效性,目前也缺乏既定的临床应用时间尺度。
饮食营养干预
营养饮食策略同样是调控肠道微生物群的主要手段之一,且具有多靶点特征。通过改变饮食结构(如增加高纤维食物摄入),可提升肠道微生物多样性并改善其功能,从而构建综合防御体系。
例如,摄入抗性淀粉或富含多酚的食物可改变肠道微生物对营养物质的代谢方式,并特异性触发有利于ICI发挥作用的不同通路。
锌与N-乙酰氨基葡萄糖可通过促进紧密连接相关蛋白(如ZO-2)生成以维持肠细胞间的致密连接,同时促进MUC2产生以利于损伤后修复,从而增强肠道保护层。
对于症状多样、且常合并多重用药的老年患者,单一疗法不足以应对复杂挑战。因此,有必要建立分层、整合的管理策略,以协调上述干预之间的相互作用。
例如,将益生元与工程化噬菌体联用,可在稳定代谢、可控调节细菌群落、以及具有抗炎特点的饮食干预之间形成协同,并与免疫功能与屏障功能改善相结合。
此外,可在全面评估个体肠型、用药史及动态微生物组特征的基础上,为患者制定个体化干预方案。通过组合这些治疗策略,或可提高特定药物或药物组合的治疗效应,降低多药并用导致不良事件的风险,并提升老年人健康管理的整体照护质量。
在老龄化与多病共存叠加的现实中,肠道微生物群已从背景因素走到台前:它通过代谢、免疫与屏障三条主轴,重塑药物疗效与不良反应的边界。现有从益生菌/益生元到FMT、噬菌体与饮食等多种工具,更多是可用的起点。
面向未来,关键在于把经验性调菌推进为可计算、可验证、可迭代的精准体系。
编辑
doi.org/10.1016/j.arr.2026.103023
一方面,以单细胞测序、空间转录组与代谢通量等多组学,在老年多病模型中绘制“宿主—微生物群—药物”互作图谱,解析微生物代谢物对CYP3A4、PD-1、Claudin-18等关键节点的时空调控;
另一方面,建立多中心、纵向随访队列,将标准化菌群检测纳入常规流程(基线分型与重复采样监测),持续记录菌群谱、用药史与结局,捕捉疗效波动及耐受/耐药的演化轨迹。
与之配套的是统一标准的微生物组—药物数据库与临床级算法:让AI/机器学习在临床试验中被严格验证,把高维数据转化为可预测的反应评估和可执行的干预建议。
这些数据的验证将推动针对多病老年人的个性化“菌群-药物”管理策略,提升多重用药安全性并促进健康老龄化。
更进一步,合成生物学有望带来可递送/可响应的智能工程菌、工程化噬菌体—纳米颗粒偶联体,并以连续菌群监测提供反馈,形成“检测—建模—干预—再检测”的闭环,使干预与个体衰老轨迹同频;同时也需以长期人群研究审慎评估气候与生态变化对微生物群及健康老龄化的潜在影响。
当然,前路仍有挑战,个体差异带来的可重复性问题、长期安全性与质控标准、以及高质量随机对照证据的缺口,决定了转化必须稳扎稳打——慢即是快。但方向已清晰:在多病共存与多重用药的时代,微生物群正在成为决定疗效与风险的重要变量。
主要参考文献
Yang D, Ren D, Zhang Y, Hao Y, Yue Y, Li Q, Fan Q, Sun C, Cui M, Zhang M. The gut microbiota dysbiosis in geriatric multimorbidity: Pharmacotherapeutic implications, pathophysiological mechanisms, and precision modulation strategies. Ageing Res Rev. 2026 Jan 13;115:103023.
Preet, R., Islam, M.A., Shim, J. et al. Gut commensal Bifidobacterium-derived extracellular vesicles modulate the therapeutic effects of anti-PD-1 in lung cancer. Nat Commun 16, 3500 (2025).
Li H, Liang J, Han M, Gao Z. Polyphenols synergistic drugs to ameliorate non-alcoholic fatty liver disease via signal pathway and gut microbiota: A review. J Adv Res. 2025 Feb;68:43-62.
Al-Btoosh S, Donnelly RF, Kelly SA. Microbes and medicines: interrelationships between pharmaceuticals and the gut microbiome. Gut Microbes. 2026 Dec 31;18(1):2604867.
de Ciutiis I, Djakovic S, Cagigas ML, Masedunskas A, Smith L, Franceschi C, Fontana L. Long-term fasting and its influence on inflammatory biomarkers: A comprehensive scoping review. Ageing Res Rev. 2025 Aug;110:102797.
Herisson FM, Cluzel GL, Llopis-Grimalt MA, O’Donovan AN, Koc F, Karnik K, Laurie I, Canene-Adams K, Ross RP, Stanton C, Caplice NM. Targeting the Gut-Heart Axis Improves Cardiac Remodeling in a Clinical Scale Model of Cardiometabolic Syndrome. JACC Basic Transl Sci. 2024 Nov 20;10(1):1-15..
谷禾健康
如果你正为宏基因组数据的组装和注释而忙于“拼工具、调环境、转格式”,那么annoSnake或许能让你从繁琐中解放。
它是一个基于Snakemake的自动化工作流程,从clean reads组装到物种分类、功能注释,再到MAGs的装配和注释。
作为开源工具,annoSnake具备良好的可重复性、可扩展性和可移植性,非常适合HPC集群环境。
本文将带你了解它的工作流程、在白蚁肠道宏基因组数据上的验证结果,以及它的优势与局限,帮助你快速判断是否值得上手。

annoSnake以“自动化+模块化”为核心:输入clean reads → 组装 → 注释 → 分箱 → 结果汇总与可视化。
每个标准化步骤里,annoSnake使用的都是主流工具,如果你事先没有任何准备,也无需担心,它会自动创建独立的虚拟环境,并安装所需的分析工具和注释用的数据库。
分析前的准备
1. Mac OS或linux系统设备,磁盘空间推荐>100GB。如果运行单个宏基因组样本,只要有32 GB 内存和 8 核 CPU 基本就能跑完。
若要在集群上批量运行十几个样本或进行MAG分析,最好准备 ≥128 GB 内存和多核服务器。annoSnake 可批量化处理。
2. 安装mamba或conda用于管理环境,然后安装snakemake。
3.克隆Github仓库到本地(git clone https://github.com/bheimbu/annoSnake.git)。
4. 清洗后的测序数据,可以是双端,也可以是交错合并的fastq.gz文件,注意要是gzip格式。
5.编辑./profile/params.yaml和./profile/config.yaml文件。config.yaml 决定“要做什么”与“怎么做”,config.yaml 决定“在哪跑、分配多少资源”。
首次分析,annotSnake会自动下载并设置GTDB、dbCAN、Pfam、KEGG等数据库,总量约100GB。

开始分析
1. 组装
MEGAHIT v1.2.9工具进行宏基因组组装,默认–presets meta-sensitive模式组装,保留≥1500 bp的contigs,并以metaQuast评估组装质量。
2. 物种分类注释
Prokka v1.14.6工具识别CDS、rRNA、tRNA;fetchMG v1.2提取40个单拷贝标记基因;结合GTDB(v202, (Parks et al.2022)数据库进行blastp和blastx注释;自定义R脚本gtdb_diamondlca.R进行LCA分类整合。
3. 功能注释
对细菌/古菌的contig执行注释,可以选择的功能数据库有:CAZy(dbCAN version 11)、Pfam(version 35)和KEGG。
针对Pfam搜索结果,可以自行借助在线工具HydDB进一步分类。针对KEGG结果,借助KofamScan工具重建以KEGG为基础的代谢通路。E-values阈值在params.yaml中设定。
4. 基因丰度量化与归一化
Salmon v1.10.2对CDS进行TPM定量,对于TPM>1的,予以保留,然后对剩余TPM做CLR对数转换(默认,log(TPM+0.65))。
5. 分箱与注释(可选)
同是采用三种分箱算法:MetaBAT v2.10.2、MetaCoAG v1.1.1、MaxBin v2.2.7,最后用metaWRAP v1.3的bin_refinement整合最优集合,CheckM 评估MAGs质量,默认阈值是完整性≥50%且污染≤10%。
对优质的MAGs使用GTDB-Tk v2.3.2进行物种分类(数据库v214),Prokka做基因预测,然后用MicrobeAnnotator进行功能注释,该工具使用DIAMOND和KofamScan,并以通路基因存在/缺失评估完整性。
6. 输出与可视化
输出包括CSV表格和ggplot2/plotly生成的PDF/HTML图表。
!
Tips
annoSnake已经内置了“KEGG条目(KO编号)→基因名称/通路名称”的映射表文件。如果你想重点关注某些特定的KEGG基因或通路(比如只看甲烷生成、乙酸生成或硫酸盐还原等),可以在/workflow/rules/scripts目录下,直接编辑这类映射文件,把你关心的KO编号及其基因名、通路名加入或调整。
管道运行时会按你改过的清单去批量检索与汇总这些目标基因/通路的注释与丰度,并在输出图表中优先呈现,从而实现“按课题定制”的结果视图。
作者用来自澳大利亚Amitermes组(AAG)的白蚁肠道宏基因组作为测试数据,与已知发现进行一致性检验。
▸在测序深度不高时仍能识别主要细菌谱系和代谢通路
31个群体,Illumina NextSeq双端,平均每样本约700万条reads。尽管测序深度不高,但annoSnake仍有效识别了主要的细菌谱系,以及大量与木质纤维素消化相关的代谢通路和基因。

图中是annoSnake识别出的主要菌群,结果显示不同取食类型白蚁肠道的优势类群模式,这与已知发现相符,通常,食草和食木的白蚁其肠道群落以螺旋体为主,而食腐殖质和土壤的白蚁则富含梭菌(clostridia)。
但也有与已知发现不符的结果,D. tamminensis物种的肠道群落以梭菌为主,几乎不见螺旋体或Fibrobacterota,部分D. gayi群体也表现出类似模式,这与“草/木料取食类型的白蚁常以螺旋体占优”的普遍模式不一致,作者解释这是数据特性使然,低覆盖度数据只能恢复高丰度群落成员,而非物种生态学的结论。

▸ 识别出硫酸盐还原等重要通路的基因
在所有样本中,annoSnake识别出硫酸盐还原通路的关键基因,如aprA、aprB和dsrAB,这符合白蚁肠道微生物组中硫酸盐还原过程的常见模式。还有许多与木质纤维素消化相关的KEGG代谢通路基因,这支持白蚁肠道微生物组在碳循环和能量代谢方面的普遍功能特征。
仅检测到少量与甲烷生成相关的基因,如mcrABG。已知甲烷生成主要局限于厌氧甲烷生成古菌,而本次分析中未有样本被检测到古菌,所以甲烷生成基因稀少是符合预期的。这与低覆盖度数据仅恢复高丰度群落成员的特性一致,古菌可能被低估,而不是KEGG注释的偏差。
识别出fdhF和acsABCDE等基因预测还原性乙酸生成的存在,这一点由分箱得到的15个Bacillota和6个螺旋体MAGs所支持,这两类群包含潜在的乙酸生成菌。这与其他白蚁和千足虫研究中已知的乙酸生成潜力一致。

▸ 能够检测到大量碳水化合物活性酶
annoSnake检测到大量CAZymes(碳水化合物活性酶)。D. tamminensis在不同群体间的GHs丰度差异再次暗示饮食灵活性,且部分群体GHs模式与腐殖/土壤取食物种一致;螺旋体主导的D_gayi_BEC329中GHs丰富,符合凋落物取食物种的特性,而在梭菌主导的D. gayi群体中GHs较低。

annoSnake从低覆盖度数据中获得30个MAGs,其中包括15个Bacillota(内含大量梭菌纲)、1个Desulfobacterota、7个Fibrobacterota、1个Pseudomonadota、6个Spirochaetota。
图中展示了MAGs中木质纤维素消化相关代谢途径(甲烷生成、还原性乙酸生成、硫酸盐还原)基因的存在/缺失。左侧给出MAG的完整性和污染分值,颜色越浅表示完整性越高,污染越少。 紫色方块表示基因缺失,黄色方块表示基因存在。
优势
• 覆盖全流程的一站式自动化:从输入reads→组装→物种注释→功能注释→丰度定量→分箱(可选)→可视化,节省操作时间。
• 数据库自动下载和配置。
• 兼具一些灵活性,比如可以自定义数据库,也能调整分析参数。
• 可重复、可扩展、可移植。Snakemake内核+HPC优化,可以在不同HPC环境中高效执行。
劣势
• 资源占用较高,数据库体量约100GB,完整流程在大规模数据上更适合HPC环境;本地轻量设备可能受限于存储、内存与时长。
• 需要有一定代码基础,掌握Snakemake、Conda与YAML配置,能调试环境配置时可能出现的错误。
• 范围聚焦细菌/古菌,真核生物未被纳入默认流程,氢化酶精细亚型分类需借助HydDB等外部工具,未在管道集成。
• 低覆盖度数据的固有限制:对稀有类群的恢复能力受限,更偏向于恢复高丰度成员,需要结合研究设计与深度规划权衡。但作者也没有发表对高覆盖度数据的测试结果,所以工具对高覆盖度数据的表现不明确。
• 工具较新,容易出现环境/兼容性问题或边缘情况未覆盖;第三方依赖更新也可能引入不稳定性。数据库管理灵活性受限,版本固定且无更新管道。虽支持自定义数据库,但需自行调整文件格式。
o 输出的图像不够美观,可视化类型单一。
annoSnake适合具备中级生信技能,需快速产出的微生物组学研究者。如样本量大,需批量分析,则需要配备高性能设备。研究范围在细菌/古菌的宏基因组与MAGs。
下面这个网址可访问 annoSnake 文档:
https://annosnake.readthedocs.io/en/latest/index.html
参考文献:
Bastian Heimburger, Rebecca Clement, Tamara R. Hartke
bioRxiv 2025.11.03.686227; doi: https://doi.org/10.1101/2025.11
谷禾健康
谷禾以往在科研领域深耕十余年,积累了丰富的科研项目经验和数据分析能力,几年前,谷禾成功实现了从科研到大健康应用的技术转化,推出了谷禾宏基因组精准检测。
对于一些特定需要深度检测的应用场景,如健康管理机构的差异化服务需求,或者临床应用需求,宏基因组精准健康检测提供了另一种专业的技术选择。

宏基因组数据库的物种涵盖范围和菌株构成,直接影响着宏基因组物种鉴定分类的准确性和分类精度。
针对宏基因组数据库不完善的问题,谷禾整合了最新的NCBI refseq数据库,涵盖细菌、病毒、真菌和寄生虫,结合自研多元统计模型和机器学习算法,极大提升了物种鉴定和功能注释的准确性。
物种精准鉴定
分辨率更加精细,可达“种”和“菌株”水平,并对复杂的多菌种感染进行精细化解构。
肠道功能评估
肠道基础功能:包括蛋白质发酵能⼒、消化吸收效率、肠道产气情况、肠道屏障完整性、肠道炎症状态等,在菌群整体评估指标中也增加了包括菌群恢复力、革兰氏阴性菌、好氧菌等指标。
功能基因分析
– 全面评估菌群的基因功能潜力
如次生代谢产物合成通路、维生素合成能力、碳水化合物利用能力等,为个性化营养和精准干预提供科学证据。
耐药基因
– 分析耐药基因
不局限于已知靶点,可鉴定出各种已知和新型耐药基因,全面评估耐药基因的种类和数量,例如,在人体肠道宏基因组中发现了大量β-内酰胺酶等耐药基因。
– 追踪耐药基因的传播途径
通过比较不同环境(如土壤、水体、动物和人体)中耐药基因的分布情况,可推测耐药基因的来源和传播途径。
– 辅助指导耐药风险评估和防控策略
宏基因组学评估环境和宿主中耐药基因的分布特点,识别高风险区域和人群,为制定针对性监测和干预措施提供依据。
毒力基因
宏基因组检测技术在病原微生物毒力基因研究中具有独特优势,可在基因组水平系统分析其毒力基因组成及调控网络,加深对致病机理的理解。
免疫炎症分析
肠道菌群通过调控免疫平衡维持健康,⽽炎症标志物则作为评估机体炎症程度的关键指标。
宏基因组测序对测序深度要求较高,当数据量不足时,一些低丰度的真菌、寄生虫等病原体可能覆盖不到;然而,若要获得足够的测序深度来确保全面覆盖,则会显著增加测序成本,同时对分析能力和计算资源提出更高要求。
因此,宏基因组检测看似”简单粗暴”,只要更多数据量,实则真正的挑战在于,如何在成本与深度之间找到最优平衡。
谷禾持续迭代升级自有数据库
整合最新的NCBI refseq数据库
并结合十余年积累的临床样本数据
让相对较小的测序量
也能获得高精度的物种鉴定结果
同时,谷禾致力于深入挖掘
数据背后的生物学意义
通过专业团队的生物信息学分析
从宏基因组数据中构建
炎症状态、消化功能异常等关键健康指标
通过机器学习算法将海量基因信息
转化为实用的健康评估结果
通过这种”数据挖掘+算法迭代“
尽可能为大家控制成本的同时提供
媲美高深度测序的检测精度
极力追求技术创新与商业价值的完美结合

宏基因组报告中的解读更详细,还整理了一些评估指标,检测指标的总结等。
其他谷禾肠道菌群检测专业版的内容,宏基因组报告里面也都涵盖了,包括慢病风险、菌群代谢物及神经递质代谢、个性化营养等板块。
…
…
个性化饮食板块也在谷禾16S版本的基础上进行了迭代升级。
…
宏基因组检测并不常用于常规检测,其高昂的成本和复杂的数据分析决定了它更适用于关键时刻。
特定菌群感染的判别
对于一些复杂的多菌种感染,宏基因组能够更精细化鉴定感染菌群的构成,为临床辅助诊疗提供依据。
真菌与病毒感染的深度判别
相比传统培养,宏基因组学诊断真菌感染的敏感性和特异性更高,适用于一些真菌感染疾病。也可能鉴定出可疑的新病原体,为后续的病原学研究、药物和疫苗开发奠定基础。

<来源:谷禾宏基因组精准检测报告>
缺点:
总的来说,宏基因组测序仍存在技术瓶颈和生物学解释的局限性。然而,针对某些特殊情况研究需要,宏基因组测序也是一种有用的微生物组学研究工具。
特殊应用场景
对于一些复杂的多菌种感染,宏基因组能够更精细化鉴定感染菌群的构成,为临床辅助诊疗提供依据。
与传统方法相比,宏基因组学诊断真菌感染的敏感性和特异性更高,适用于一些真菌感染疾病。也可能鉴定出可疑的新病原体,为后续的病原学研究、药物和疫苗开发奠定基础。
以上是谷禾宏基因组精准检测报告的一些节选,其全面、精准、个性化分析肠道菌群的组成和功能,可帮助评估菌群失衡的风险和预后,为个性化诊疗和健康管理提供科学依据。
注:报告仅用于菌群科学研究和辅助参考,不直接用于临床诊断 。
谷禾健康

许多流行病的爆发都是病毒引起的,面对新的传染性基因组出现的最佳策略是及时识别,以便于在感染开始时立即实施相应措施。
目前可用的诊断测试仅限于检测新的病理因子。适用于同时检测存在的任何病原体的高通量方法可能比使用基于当前方法的大量单独测试更有优势。
宏基因组学测序、全基因组测序和靶向深度测序是目前用于病毒遗传鉴定和表征的最佳工具。通过使用这些技术,可以正确的对病毒进行分类,确定其变异性,识别与毒性相关的病毒遗传标记,并在现有知识的基础上考虑抗原性和对抗病毒药物的易感性。
尽管宏基因组学领域取得了巨大进步,但对于具体数据分析任务应使用各种方法中的哪一种,仍缺乏共识。
本文重点描述了宏基因组生物信息数据处理所需要的工具,以便于改善使用宏基因组学识别动物来源样本中新出现、再出现和未知的新病毒。
什么是宏基因组学?
宏基因组学是下一代测序的一个领域,可以识别微生物群落,以及基因检测、识别和表征致病因子。它已被证明是病毒遗传特征的关键因素,并导致了使用传统培养技术无法完成的发现。
目前的分子检测使用特定的引物或探针针对有限数量的病原体,而宏基因组学可以接近样本中存在的所有 DNA 和 RNA 分子,从而能够分析相应的宿主基因组及其微生物集合。
在宏基因组组装中鉴定病毒有五个主要步骤:
宏基因组分箱是在物种注释之前可选的附加步骤。分箱的目的是根据根据序列的起源对其进行聚类。
根据这些步骤,列举出以下目前使用较多的主流工具。
宏基因组学的第一步将是执行序列QC,因为从分析中消除技术错误是必不可少的。
此步骤的主要目的是识别不需要的接头序列、过短的序列、低质量的序列或核苷酸以及其他可能存在的数据。根据数据类型,在这一步中可以使用以下几种工具:

对于短读,可以使用FastQC执行质检 (https://www.bioinformatics.babraham.ac.uk/projects/fastqc/) ,它可以检查序列的质量并生成总结报告。
其他QC程序也可以提供相同类型的报告,如MultiQC,它具有与FastQC相同的功能,但有一个主要区别,它可以同时合并多个fastq的QC报告,生成一个总的报告。
对于长读,可以使用longQC或MinionQC来检查序列质量,这两个工具已经应用于从纳米孔的MinION或其他长读取测序仪中获得的数据。
—— 低质量序列修剪工具
序列质检后,就需要修剪工具,删除低质量序列和接头序列。可供使用的工具如下图。

对于短读,常用的是Trimmomatic,其次是Cutadapt和Fastp。
对于长读,NanoPack可用于处理长读数据并可视化QC结果。与Nanopack功能相同的是SequelTools。
——删除测序数据中非靶向或污染序列的工具
删除不感兴趣的序列,这些序列可以从各种来源获得。在对病毒序列的分析中,必须删除宿主序列和被污染序列,它可以减少假阳性,并可以防止嵌合病毒-宿主序列的组装。
如下图,通常使用序列比对的工具:

对于短读,可以使用BWA、bowtie2和BBMap等。
其它工具如FastQ-Screen,可以以fastq格式比对自定义参考序列。
(https://www.bioinformatics.babraham.ac.uk/projects/fastq_screen/)
对于长读,可以使用BWA和BBMap,也可以选择特定的minimap2。
也有专门用于识别和修剪特定微生物类群序列的工具,这类工具通常已包含参考基因组序列,一旦比对上,将通过内置的过滤程序丢弃掉。比如VirusHunter(https://bio.tools/virushunter),用于识别NGS数据中的病毒序列。
某些情况下,可能需要从宏基因组数据中删除非靶向分类群的其他RNA序列类型,如核糖体(rRNA),线粒体(mtRNA),或mRNA类型。这时可以用RiboDetector (https://github.com/hzi-bifo/RiboDetector),因为它专门识别rRNA,从而可以过滤掉rRNA以改进后续分析。
另一种方法是在组装前对序列进行物种注释。使用这种策略,可以过滤掉病毒以外的序列,保留病毒序列以供进一步分析。可以使用kraken2和kaiju。
为了更好的进行物种注释和识别存在的病毒,对序列进行组装,生成contigs,以提供更长的连续序列。宏基因组学中使用的组装类型主要为de novo,即从头基因组组装。
可使用的工具如下图:

对于短读,推荐MEGAHIT,这是一个针对宏基因组优化的生物信息学组装工具,或者metaSPADES和IDBA-UD,它们也针对宏基因组进行了优化。
除了de novo,还有一种基于参考的组装,也可以用于宏基因组学。只是,并不是在所有情况下都可以获得合适的参考基因组,而且这种方法不能识别新的病毒或以前没有测序的病毒。
对于长读,推荐metaFlye、Canu和NECAT,这些工具可以用于各种技术下产生的数据格式,从纳米孔测序到PacBio,甚至在高保真序列。
对于混合组装,也就是将短读和长读的两个特性结合起来的组装,推荐OPERA-MS和HybridSPADES工具,它们都是用De Bruijn图算法实现的。
宏基因组组装完成,就应该确定组装的质量。用于此目的的工具可以分为两大类:
一类是需要参考基因组的工具,例如MetaQUAST,它使用参考来计算组装的统计信息。一般而言,在宏基因组学研究中,可能很难使用参考基因组,因为通常没有可用的参考基因组或参考基因组的质量很差。
不需要参考基因组的方法,例如DeepMAsED,它使用机器学习来识别错误装配,或者REAPR,是一种使用映射的配对端读长来评估基因组组装准确性的工具。常用的还有BUSCO和CheckM。
最后,VALET(https://github.com/marbl/VALET)可以用于检测宏基因组数据中的误组装,因为它可以根据覆盖范围对contigs进行分类,并避免由于覆盖深度不均匀而导致的假阳性和假阴性。

在宏基因组分析中识别病毒的一个重要步骤是进行物种注释。实现这一步骤的主要方法有两种:
两种方法各有优缺点:
在使用contig(即使用组装序列)进行的物种注释中,分类的对象是较长的序列,它存在一些contigs可能是嵌合的风险。
而直接对reads进行物种注释的统计学意义较小,虽然分析了大量的序列,但序列较短,这种方法可以提供更多样化的结果,只是计算成本会更高。
对于已知病毒的识别,一种是基于k-mer,直接使用参考数据库与reads/contigs进行比对,如kraken2、bracken、CLARK和Centrifuge,
另一种是先翻译序列,然后与参考蛋白质数据库进行比对,如kaiju、DIAMOND和MMseqs2。
还有基于算法的,如BLAST或DUDes,它们使用DUD(Deepest Uncommon Descent)算法。
使用基因标记的,如MetaPhlAn4、IGGsearch和GOTTCHA。
也有专门用来研究病毒组的工具,如VirusTaxo、Metavir2和DeepVirFinder,其主要算法是卷积神经网络(CNN)。
其中如MetaPhlAn4和MCP (Microbiota Community Profiler),包含未知的宏基因组组装基因组的序列,而MCP只能用于识别微生物区研究中的细菌、古菌、真核生物和病毒序列。
由于每个用于物种注释的工具的性能都不同,且都使用了各种算法和参考数据库,所以这种多样性也会导致不一样的结果、耗时和计算成本。
▪ 基于k-mer的物种注释工具似乎是计算效率最高的,虽然它们需要很大的内存。
▪ 基于标记的,对内存的要求较低,但它们只能对来自特定区域的reads/contigs进行注释分类。
▪ 基于比对的工具要比其他的计算成本更高。

对于新型病毒的识别,现在也有不需要任何参考就能识别病毒序列的工具,即:
• VirSorter(https://github.com/simroux/VirSorter)
• VirFinder(https://github.com/jessieren/VirFinder)
VirFinder是一个基于k-mer的R包,可以以较好的预测识别病毒的contigs;
而VirSorter可以在不同的微生物数据集中识别新的病毒序列。
宏基因组分箱
在物种注释之前可以选择是否执行分箱(binning)。
分箱的主要目的是根据物种对contig进行聚类。根据数据类型,可使用的工具如下图:

CONCOT,它可以根据核苷酸组成和覆盖率数据对宏基因组contigs进行聚类。
GraphBin,它使用组装的连通性信息对contig进行集群化。
但宏基因组分箱并不局限于contigs,对于长读,可使用MEGAN-LR、BusyBee或LRBinner。
近年来,宏基因组学领域取得了许多进展,新技术可以帮助研究人员发现新的病毒,预测疫情,诊断某些疾病等。
长读测序平台也在快速发展,以得出更可靠的结果助力宏基因组分析。虽然已有许多工具和流程被开发出来以便更快更简单地进行数据分析,但还需要进一步发展,例如在数据处理分析中的通用指南的建立,因为虽然出于同一种目的而开发的工具,但由于计算过程不一样,它们在不同任务中的性能缺乏共识。此外,重要的是保持相关数据库的更新与维护。
宏基因组学检测人类样本中任何基因组(包括细菌、病毒、寄生虫和真菌)的能力,对于传染病的诊断具有重要意义。宏基因组学方法也已应用于其他几个研究领域:环境研究(如海洋样本、土壤、污水、农场灰尘) ;7000 年前青铜时代人类样本中的病毒感染;健康、疾病和法医调查中人体肠道微生物组的特征;临床研究 ; 以及新病毒病原体的发现,例如 SARS-CoV-2等。
Ibañez-Lligoña M, Colomer-Castell S, González-Sánchez A, Gregori J, Campos C, Garcia-Cehic D, Andrés C, Piñana M, Pumarola T, Rodríguez-Frias F, Antón A, Quer J. Bioinformatic Tools for NGS-Based Metagenomics to Improve the Clinical Diagnosis of Emerging, Re-Emerging and New Viruses. Viruses. 2023 Feb 20;15(2):587. doi: 10.3390/v15020587. PMID: 36851800; PMCID: PMC9965957.
谷禾健康

癌症是一种复杂的疾病,归因于多因素变化,导致治疗策略困难。
90%的癌症患者死于复发或转移。癌症转移是恶性肿瘤进展的关键步骤,由癌细胞内在特性和外在环境因素决定。
一些微生物组通过诱导癌性上皮细胞和慢性炎症促进癌发生、癌症进展和调节癌症治疗。
关于微生物群在肿瘤发生和临床效率中的作用的大部分认知都与肠道微生物群有关。
然而,研究也证实了肿瘤内微生物群在癌症中的作用。近年来,肿瘤内微生物群已被确定为肿瘤的一个组成部分,并可能在功能上调节转移的各个方面。
肿瘤内微生物群与区分正常组织与癌组织、药物反应者与无反应者癌症、良好与不良预后、转移性与非转移性癌症有关。
肿瘤内微生物群的调节可以减少癌症转移,阻止癌症进展,并重新编程免疫反应。
本文主要集中于肿瘤内微生物群的发现和表征及其在肿瘤转移过程中的独特功能,并讨论了癌症治疗的挑战和意义。
癌症转移通常被定义为:
肿瘤从原始肿瘤部位转移到远端器官的多步骤过程。
这一过程涉及几个步骤,包括入侵、传播、血管内、外渗、定植。
转移的一个关键特征是其极低效率,这是由于癌细胞在成功到达并定居目的地之前,需要应对许多物理、化学和生物挑战。
转移级联期间的应激源包括:
• 细胞外基质(ECM)僵硬
注:肿瘤细胞外基质的硬度约为周围正常组织的1.5倍
• 失巢凋亡
注:失巢凋亡是由于细胞与细胞外基质和其他细胞失去接触而诱导的一种特殊的程序化细胞死亡形式,在机体发育、组织自身平衡、疾病发生和肿瘤转移等方面起重要作用。
• 流体剪切应力
注:压缩、拉伸、剪切力导致的组织变形导致组织液在细胞周围运动。
• 化疗
注:使用化学治疗药物杀灭癌细胞达到治疗目的。
• 免疫监视
注:免疫系统具有识别、杀伤并及时清除体内突变细胞,防止肿瘤发生的功能,称为免疫监视。
确定转移效率的关键是:
了解早期转移细胞如何能够抵抗这些挑战并增强其对不同环境的适应性,以及每种类型的压力对最终转移效率的影响程度。
转移是一个低效的多步骤易位过程

doi.org/10.1016/j.tcb.2022.11.007
新的研究扩大了我们对转移的认知。例如,研究表明转移开始发生在肿瘤进展的非常早期。
集体侵入相邻组织
在这些转移细胞到达远端器官之前,癌细胞甚至可以通过分泌成分远程准备转移前生态位(PMN)。当转移细胞开始迁移时,它们通常会集体侵入相邻组织,并作为寡克隆细胞簇在血流中传播,以增强其定植新生态位的能力。

doi.org/10.1016/j.canlet.2021.09.009
改变代谢程序,逃避免疫监视
这些先驱转移起始细胞改变它们的代谢程序以增强它们的转移潜能,并且可以逃避免疫监视并长时间保持休眠状态,直到开始分裂。
转移能力高度依赖于癌细胞内部细胞特性
这些研究使我们对转移细胞生存策略的理解更进一步,并证实了癌细胞转移能力高度依赖于癌细胞内部细胞特性的观点,例如 EMT 状态、干细胞可塑性、遗传学、表观遗传学、染色体不稳定性和代谢适应,以及环境因素,如机械压力、免疫反应、ECM、PMN 和肠道微生物组。
那么,癌细胞获得这些转移性状的驱动力是什么?

在实验上,肿瘤内微生物群已被确定为组织的一个组成部分。这些肿瘤内细菌是癌症进展不同阶段的新参与者,可以从外部相互作用和细胞内部影响癌细胞。
下面一个章节,我们来看肿瘤内微生物群是什么,有什么作用?
我们知道,已经有越来越多的文章阐述肠道微生物组在癌症进展中的作用,这方面我们的理解在迅速增长,然而我们对肿瘤内微生物群的理解仍处于初级阶段。
近期与转移相关的肿瘤内微生物群的研究

doi.org/10.1016/j.tcb.2022.11.007
人类组织,包括癌组织,通常被认为是无菌的,除了结肠、皮肤和口腔。
▸ 肿瘤内微生物群
癌症生物学的最新概念进展是,鉴定出癌症组织中存在微生物群。这些肿瘤组织驻留细菌被归类为“肿瘤内微生物群”。
我们知道,肠道微生物群可以通过代谢产物或通过与免疫细胞的相互作用,远距离影响肿瘤组织。
而肿瘤内微生物群与癌细胞密切接触,因此可能与肠道微生物群有不同的功能模式。
我们其他文章有对肠道微生物组在癌症诊断、预后和治疗反应中的作用进行详细介绍:
肠道微生物群与五种癌症的相互作用:致癌 -> 治疗 -> 预后
因此,本文主要集中于肿瘤内微生物群的发现和表征及其在肿瘤转移过程中的独特功能。
▸ 肿瘤内微生物群发现的证据:
-早前提出假设
一百多年前,威廉·科利发明了科利毒素(化脓性链球菌和粘质沙雷菌的混合物)来治疗一位癌症患者,并观察到肿瘤消退。
他假设“每一种恶性肿瘤都可能有外源性或微生物来源”。然而,在这个假设之后的几十年里,没有直接证据表明肿瘤内细菌的存在。
瘤内微生物群研究的重大突破包括发现、机制等成果

doi.org/10.1002/advs.202200470
-攻克瘤内微生物的检测技术挑战
到现在,下一代测序技术 (NGS) 能够使用 16S rDNA 测序将细菌 DNA 与肿瘤组织区分开来,然而,由于瘤内细菌丰度低和宿主基因组污染严重,从组织处理或试剂中引入的环境噪声信号使数据收集变得复杂,因为它们会掩盖组织的真实微生物概况并削弱结论的稳健性。
这些技术挑战在过去几年已被攻克,多个研究小组报告了大量数据,进一步支持瘤内微生物群的存在。此外,生物信息学微生物特征能够区分健康个体和癌症患者。

doi.org/10.1016/j.canlet.2021.09.009
识别肿瘤微生物组为癌症研究领域开辟了新的机遇。更好地表征肿瘤内微生物组可能会导致开发新的治疗方法,从而克服传统的癌症治疗方法。下一代测序方法,包括 16S 扩增子测序,可以在组织提取和石蜡固定后,将肿瘤内细菌精确地聚集在确定的细菌亚群中。
此外,宏基因组学对于肿瘤内微生物的鉴定也很重要。
宏基因组
宏基因组是一种针对样本中所有 DNA 的非靶向测序方法,包括微生物群落的全基因组序列,广泛应用于复杂微生物组的分析。宏基因组的分辨率更高,可以达到物种甚至菌株水平。此外,宏基因组学可以提供功能信息。
此外,宏基因组学可以与转录组分析结合使用,以消除死亡微生物和细胞外DNA造成的干扰。
最近的研究表明,最新的宏基因组数据涵盖了更多类型的癌症,这可能促进肿瘤内微生物群领域的新进展。
在瘤内微生物研究中,宿主DNA和环境微生物DNA的污染是最大的障碍。因此,需要开发从 TCGA 中丢弃不可信数据的方法。
在一项分析多种癌症的研究中,研究人员删除了总序列数据的 92.3%,以确保分析中数据的可靠性。2021 年,Dohlman 等人开发了一种去污染算法,可以去除 TCGA 数据中的污染。
随着这些方法的发展,宏基因组学可以为肿瘤内微生物群的研究提供更有力的支持。
▸ 细菌是各种癌症类型中肿瘤组织不可或缺的组成部分和活的居民
各种癌症类型有不同的微生物群。
肿瘤内微生物群的组成与许多类型的癌症有关。器官和组织包括食道、肺、乳腺、前列腺、膀胱、胃、肾、肝、胰腺等,以前被认为是无菌的。下一代测序显示这些器官含有低生物量微生物群。瘤内微生物组是肿瘤微环境的主要组成部分,影响肿瘤发生、疾病进展、耐药性和预后。
不同癌症类型的肿瘤内微生物群生态位

Liu J, et al., Biomark Res. 2022
在暴露于环境的组织(如肺癌和黑色素瘤)中并未发现微生物群丰度最高,而是在乳腺癌,骨癌,胰腺癌中。这表明肿瘤内微生物群的丰度是肿瘤特异性的。
作为癌症生态系统不可或缺的组成部分的肿瘤内微生物群

doi.org/10.1016/j.tcb.2022.11.007
如果肿瘤内微生物群存在于广泛的癌症类型中,那么它们来自哪里?
很少有研究专门去调查其原始来源。然而,对来自肿瘤组织的分离细菌菌株的分析提供了一些见解。
在小鼠乳腺肿瘤中,在正常组织对应物中检测到肿瘤内细菌菌株,这表明肿瘤组织从周围组织获得某些细菌。这些细菌菌株在体内的主要栖息地是多种多样的,有皮肤上的葡萄球菌、口腔中的链球菌和肠道中的肠球菌。
鉴于细菌具有在组织之间传播的能力,肿瘤内微生物群可能有多个起源。对鼻咽癌的分析表明,瘤内细菌主要来自鼻咽部,一小部分来自口腔和肠道。
* 也需要通过宏基因组比较和基因追踪分析来进一步加强。
肿瘤内微生物群的来源

doi.org/10.1002/advs.202200470
A) 通过粘膜屏障从粘膜部位产生的肿瘤内微生物
B) 从正常邻近组织产生的肿瘤内微生物
C) 肿瘤内微生物是血行传播的结果
瘤内细菌的共同特征
1- 丰度低
它们在癌组织中的丰度远低于肠道中的丰度,根据 qPCR 定量和成像定量,0.1-10% 的癌细胞携带细菌,不同的量化方法和/或细菌 DNA 的提取效率引入了差异。
2- 多样性低
癌组织中微生物群落的多样性通常低于正常组织,这表明肿瘤可能形成一个独特的环境,选择性地扩展某些细菌种类。
3- 活的
这些细菌是活的。主要是主要存在于细胞内空间的共生生物。癌组织中不同的细菌栖息地可能与其在与癌细胞相互作用时的多效性作用模式有关。
细胞内外微生物群功能不一
鉴于细胞内和细胞外空间之间存在巨大的分子、生物化学和生物物理学差异,在肿瘤起始、肿瘤进展过程中,与细胞外肿瘤驻留微生物群 (ExTM) 相比,细胞内肿瘤驻留微生物群 (InTM) 可能具有完全不同的功能和免疫相互作用。
长期以来,细胞内细菌一直被研究为参与病原体-宿主相互作用的致病菌菌株。致病菌通过“触发”或“拉链”模式侵入宿主细胞,并能够迅速破开核内体膜进入细胞质。
肿瘤内共生细菌是遵循相同的原则还是使用不同的机制来侵入癌细胞?这方面仍知之甚少。在特定的癌症类型中,如乳腺癌,肿瘤内微生物群落主要以革兰氏阳性和兼性厌氧细菌为主,这表明肿瘤微环境具有选择效应。
不同的肿瘤类型具有不同的血管生成和氧水平、内吞作用和微胞作用以及周围组织中的微生物来源。这些因素共同决定肿瘤内微生物群的组成,并形成肿瘤类型特异性特征。
肠道菌群刺激特定代谢物的产生,调节免疫系统,并重建远端器官的微环境。相比之下,专门研究肿瘤内微生物群在癌症转移中的作用的研究有限。
这个领域的研究还比较浅,缺乏合适的实验工具来准确和特异性地调节肿瘤内的微生物群,同时又不扰乱身体其他部位的共生细菌。这个问题可以通过使用各种抗生素给药方案、使用无菌小鼠和原位细菌再给药来部分解决。
越来越多的证据证实,瘤内细菌可以调节癌细胞的内在特性及其外部环境,从而增强癌细胞的能力并为癌症转移铺平道路。
为了克服转移过程中的物理、化学和生物学挑战,癌细胞通常会改变其内在程序以应对不利的环境。这些包括干细胞程序/可塑性(用于新位点的肿瘤起始)、EMT 程序(用于癌症侵袭和传播)、粘附程序(防止失巢凋亡诱导的细胞死亡)和机械应激反应程序(抵抗机械力诱导的损伤) 。
研究表明,这些程序也可以通过肿瘤内微生物群进行调节。
肿瘤内微生物群改变癌细胞的内在特性并重塑转移中的肿瘤微环境

doi.org/10.1016/j.tcb.2022.11.007
我们先来看看,EMT程序是什么?
EMT程序赋予癌细胞迁移性间充质特征,具有松散的细胞间粘附特性,可动员癌细胞进行侵袭和扩散。这是由 TGFβ 信号通路的激活和与 Zeb、Twist 和 Snail 相关的协调转录程序驱动的。
微生物群和EMT程序之间有关联吗?
答案是肯定的。多项研究表明微生物群与 EMT 之间存在相关性。
在人类乳腺癌细胞系中,肿瘤驻留脆弱拟杆菌分泌的毒素诱导迁移和侵袭表型,EMT 相关的 Slug 和 Twist 的表达升高。在位于乳腺导管的肿瘤细胞中,脆弱拟杆菌的定植刺激了远端器官转移的增强。
这种功能调节是否仅限于细胞外肿瘤驻留微生物群,还是也适用于细胞内肿瘤驻留微生物群,以及不同的肿瘤驻留细菌对 EMT 的影响有多普遍,仍然是一个悬而未决的问题。
然而,有证据表明,脂多糖能够在依赖于 TLR-NFκB 通路的正常人肝内胆管上皮细胞中诱导 EMT.
在 EMT 驱动的小鼠结肠癌模型中,微生物群的存在对于肿瘤的发展至关重要。
这些研究支持组织驻留微生物群与 EMT 计划之间存在联系。
癌细胞的可塑性和干性是转移启动的另一个重要因素。
研究发现,脆弱拟杆菌毒素可以裂解 E-cadherin,触发下游 β-catenin 核定位,伴随 Notch 效应子 NICD 在乳腺癌中的核聚集。
在小鼠移植肿瘤模型中,Wnt 和 Notch 信号通路的后续激活,导致干性和肿瘤生长以及转移进展。
在自发性 MMTV-PyMT 乳腺肿瘤模型 [具有多瘤病毒中间 T 抗原 (PyMT) 的小鼠乳腺肿瘤模型在小鼠乳腺肿瘤病毒 (MMTV) 长末端重复序列下表达],各种肿瘤驻留细菌物种侵入 PyMT 癌症细胞触发了乳腺干细胞程序的富集。 由于与细菌侵入的癌细胞的体内分离相关的挑战,尚不清楚干细胞程序是否可以在生理细胞环境中被肿瘤内细菌激活。
癌细胞渗入血流引发细胞死亡程序
癌细胞渗入血流伴随着粘附丧失,这通常引发失巢凋亡,或其他形式的细胞凋亡的细胞死亡程序。癌细胞表面粘附分子的表达增强了它们的存活,并防止了转移失败。
在人类结直肠癌细胞系中,结直肠癌中常见的具核梭杆菌通过上调粘附分子 ICAM1 显着增强癌细胞对内皮细胞的粘附。这种增强的粘附力使癌细胞能够在尾静脉注射测定中外渗并引发新的转移灶。ICAM1 的上调部分是通过细菌依赖性激活 Alpk1-NFκB 通路实现的。
循环癌细胞受机械应力的影响导致细胞损伤
除了失巢凋亡依赖性细胞死亡外,循环癌细胞还会受到血液中各种机械应力的影响,从而导致细胞损伤,例如流体剪切应力,并在远端器官中,导致结构限制。
这些应激源部分被粘附分子(如整合素)感知,由 RhoGTPase 信号级联传递,并由 Yap/Taz 转录因子协调。
小鼠肿瘤模型的新发现表明,InTM 在侵入宿主癌细胞时会触发流体剪切应力反应,并且这种反应与细菌物种促进转移的能力相关。
被细菌侵入的癌细胞可以携带细菌,游走至远端器官,促进癌细胞的存活。这种表型是 InTM 特有的,因为通过调节 RhoAGTPase-Rock-actin 细胞骨架重组途径,癌细胞变得更能抵抗机械应力。引发这种反应的细菌机制仍不清楚。
然而,从肉毒梭状芽胞杆菌中分离出来并被多种细菌共享的 ADP-核糖基转移酶 C3 胞外酶是一个潜在的候选者,因为 C3 对细胞是不可渗透的,并且与膜穿透肽融合的 C3 经常被细胞生物学家用来解离肌动蛋白应力纤维并增强细胞扩散。
除了直接调节癌细胞外,瘤内细菌是重要的炎症介质,可以在癌细胞周围形成特定的微环境,从而间接促进癌症转移。
调节 PMN 的关键因素之一是细菌本身
结直肠癌研究表明,肿瘤驻留细菌能够通过毒力因子 VirF 调节肠道血管屏障。PV-1 表达升高的血管屏障受损,促进了细菌从原发性结直肠肿瘤传播到肝脏,并在癌细胞到达之前建立了 PMN.
注:PMN-迁移前生态位
患者体内较高的 PV-1 水平与较高的细菌负荷和较远的转移有关。这种依赖于细菌的 PMN 远程控制是一个新概念,可能对癌症以外的疾病有影响。
肿瘤外泌体可以调节 PMN 并决定转移器官的趋向性
肿瘤外泌体含有多种功能性脂类、蛋白质、RNA和DNA,释放到细胞外环境中调节靶细胞,重塑微环境。
源自具核梭杆菌侵入的人结直肠癌细胞,分离出含有 miR-1246/92b-3p/27a-3p 和 Cxcl16 的外泌体。这些外泌体在调节结直肠癌细胞迁移方面发挥作用,并通过靶向 GSK3β 激活 Wnt-β-catenin 信号通路显著增加肺转移。
这意味着邻近的癌细胞不一定需要被细菌侵入才能转移;相反,它们也可以通过旁分泌外泌体信号来动员以启动转移。
瘤内细菌最显着的特征之一是它们可以被免疫系统识别,从而触发特定的免疫反应
有许多关于肠道菌群失调与异常免疫反应之间关联的报道,但肿瘤内微生物群在调节免疫系统中的作用仍不清楚。
一方面,抗生素治疗和细菌再给药试验显示肿瘤内细菌抑制免疫反应的证据
在乳腺癌中,瘤内具核梭菌以免疫介导的方式加速肿瘤进展和肺转移,瘤内给药具核梭菌减少浸润的 CD4+ 和 CD8+ T 细胞。
在小鼠黑色素瘤癌症模型中,肺组织的抗生素治疗降低了细菌负荷,显示出调节性 T 细胞减少,T 细胞和自然杀伤 (NK) 细胞活化增强,同时肺转移显着减少。
在转基因小鼠肺癌模型中,肺部共生细菌激活了 γδT 细胞,这是一种 T 细胞亚群,通过刺激骨髓来源的 IL1β 和 IL23 并引发肿瘤炎症来促进淋巴和骨髓谱系的炎症反应。
另一方面,肿瘤内细菌可以触发抗肿瘤免疫。
例如,益生菌(鼠李糖乳杆菌)的施用强烈促进了针对小鼠黑色素瘤肺转移的肿瘤免疫。
此外,瘤内注射双歧杆菌可刺激 STING 通路,增加树突状细胞数量,并促进基于抗 Cd47 的免疫治疗。
因此,肿瘤内细菌的免疫调节作用是复杂的,并且依赖于环境,并且可能是细菌物种特异性的和/或受其细胞内/细胞外居住状态的高度影响。
传统癌症疗法的限制
迄今为止,主要的癌症疗法基于手术、放疗和化疗。尽管对大多数确定的肿瘤有效,但它们都有缺点,依赖于冗长、乏味的程序,非特异性地对抗肿瘤,通常无法区分恶性组织和健康组织。
由于缺乏对肿瘤样区域的特异性,某些癌细胞得以存活并定植在附近的组织中,从而导致潜在的癌症复发。靶向健康组织可能会产生意想不到的副作用,从而导致严重的致癌 DNA 损伤。
所有这些缺点,加上对治疗产生耐药性的持续风险,与癌症死亡率和发病率的增加有关。
90%的癌症患者死于复发或转移。
肿瘤内微生物群的作用可以通过具有肿瘤内微生物群信息的癌症患者的生存数据来评估。
在胰腺癌患者中,与短期幸存者相比,长期幸存者往往具有更高的微生物群落多样性。
此外,肿瘤内微生物群特征(假黄单胞菌Pseudoxanthomonas–链霉菌Streptomyces–糖多孢菌Saccharopolyspora –克劳氏芽孢杆菌Bacillus clausii)被确定与生存相关。
在其他癌症类型中,尽管样本量有限,但据报道特定的肿瘤内微生物组特征也与转移有关。
在对 800 多个患者样本进行分析的鼻咽癌临床研究中,肿瘤内细菌载量被确定为一种强有力的预后工具,可以区分恶性进展的风险。这些研究证实了肿瘤内微生物群的预后价值,并支持其在临床肿瘤进展中的作用。
然而,在临床上特异性调节肿瘤内微生物群具有挑战性。
有几项关于抗生素治疗和癌症风险、癌症反应和生存的回顾性研究,但它们很少专门设计用于剖析肿瘤内微生物群的消除和患者预后。
这些广泛的抗生素治疗数据分析报告了癌症发病率的增加和对免疫疗法的一般反应受损。鉴于已经确定肠道微生物组与免疫检查点抑制剂治疗密切相关,目前尚不清楚肠道肿瘤微生物组在调节癌症进展方面是否具有相似或不同的作用。
相比之下,一项胰腺腺瘤研究表明,抗生素治疗与晚期转移性胰腺导管腺癌的更好预后相关。
鉴于抗生素在效力、吸收效率、细胞渗透性以及给药途径和时间窗的可变性方面存在巨大差异,所有这些变量都可能导致肠道微生物组和细胞内/细胞外肿瘤微生物组概况的根本差异。因此,迫切需要精心定义的肿瘤内微生物群调节临床研究集。
肿瘤内微生物群数据在癌症筛查和治疗中的应用

Liu J, et al., Biomark Res. 2022
A) 来自临床样本的数据可能有助于开发新的癌症筛查和预后,包括来自肿瘤部位和易于获取的样本的微生物群模式。
B) 肿瘤内微生物群可用于癌症治疗,包括工程菌、饮食调节、粪便微生物组移植、抗生素和肿瘤内微生物组注射等。
新兴研究揭示了肿瘤内微生物群在癌症转移的各个步骤中的生物学功能。这些肿瘤内微生物群不仅是肿瘤环境的传感器、肿瘤病理类型、药物反应和预后的指标,而且在功能上也参与肿瘤进展。
肠道细菌的宿主内进化会导致共生菌株变成致病。因此,需要进一步的研究来测试肿瘤内细菌促进癌症转移的能力是否源于细菌进化。这或许可以解释不同的细菌种群及其在正常组织和癌组织中的各种功能,以及为什么某些肿瘤类型比其他肿瘤发展得更快。
未来,肿瘤内微生物领域将受到更多关注,该领域有四个方面可能成为未来研究的重点:
肿瘤内微生物群可以作为癌症筛查的生物标志物。
包括肿瘤内微生物组衍生的个性化数据,这些数据可以将食管癌、胰腺癌、肺癌和口腔癌患者与健康人区分开来。分析肿瘤内微生物群特征,可能为患者的预后提供潜在的生物标志物。
此外,肿瘤内微生物群为癌症治疗带来新的机遇。
考虑到肿瘤内微生物群的异质性,个性化治疗策略因其高效和靶向作用而具有吸引力。
肿瘤内细菌的细胞外和细胞内定位使它们成为药物载体的完美候选者,可以在肿瘤细胞内外递送,以倒带细胞间和细胞内信号网络。
与其他抗肿瘤疗法一样,细菌疗法和抗生素也可以与其他疗法结合使用,例如免疫疗法和化学疗法。
使肿瘤内微生物群正常化和移植某些微生物也是提高抗肿瘤治疗效率的潜在策略。
癌症疗法正面临着巨大的转变:传统疗法正逐渐被更精确和复杂的疗法所取代。了解肿瘤内微生物群对癌症发生和发展的不同贡献,将有助于制定癌症预防和治疗策略。
主要参考文献:
Fu A, Yao B, Dong T, Cai S. Emerging roles of intratumor microbiota in cancer metastasis. Trends Cell Biol. 2022 Dec 13:S0962-8924(22)00258-6. doi: 10.1016/j.tcb.2022.11.007. Epub ahead of print. PMID: 36522234.
Liu J, Zhang Y. Intratumor microbiome in cancer progression: current developments, challenges and future trends. Biomark Res. 2022 May 31;10(1):37. doi: 10.1186/s40364-022-00381-5. PMID: 35642013; PMCID: PMC9153132.
An Y, Zhang W, Liu T, Wang B, Cao H. The intratumoural microbiota in cancer: new insights from inside. Biochim Biophys Acta Rev Cancer. 2021 Dec;1876(2):188626. doi: 10.1016/j.bbcan.2021.188626. Epub 2021 Sep 11. PMID: 34520804.
Heymann CJF, Bard JM, Heymann MF, Heymann D, Bobin-Dubigeon C. The intratumoral microbiome: Characterization methods and functional impact. Cancer Lett. 2021 Dec 1;522:63-79. doi: 10.1016/j.canlet.2021.09.009. Epub 2021 Sep 10. PMID: 34517085.
Wang Y, Guo H, Gao X, Wang J. The Intratumor Microbiota Signatures Associate With Subtype, Tumor Stage, and Survival Status of Esophageal Carcinoma. Front Oncol. 2021 Oct 27;11:754788. doi: 10.3389/fonc.2021.754788. PMID: 34778069; PMCID: PMC8578860.
Xie Y, Xie F, Zhou X, Zhang L, Yang B, Huang J, Wang F, Yan H, Zeng L, Zhang L, Zhou F. Microbiota in Tumors: From Understanding to Application. Adv Sci (Weinh). 2022 Jul;9(21):e2200470. doi: 10.1002/advs.202200470. Epub 2022 May 23. PMID: 35603968; PMCID: PMC9313476.
Huang Y, Zhu N, Zheng X, Liu Y, Lu H, Yin X, Hao H, Tan Y, Wang D, Hu H, Liang Y, Li X, Hu Z, Yin Y. Intratumor Microbiome Analysis Identifies Positive Association Between Megasphaera and Survival of Chinese Patients With Pancreatic Ductal Adenocarcinomas. Front Immunol. 2022 Jan 25;13:785422. doi: 10.3389/fimmu.2022.785422. PMID: 35145519; PMCID: PMC8821101.
谷禾健康
宏基因组测序可以使我们深度全面地了解微生物群的构成,对于缺乏深度研究和高质量参考基因组的样本,宏基因组获得的较为完整的基因组不仅可以丰富参考基因组数据库,同时可以提供更加准确的物种分类。
关于宏基因组的介绍可见我们之前的文章:

在宏基因组分析过程中,可能遇到的问题,及问题相关解决思路如下:




























































更多关于宏基因组科研服务详询:
商务经理:13336028502(微信同号)
谷禾健康

尽管地球上微生物类群的繁多,但只有一小部分得到了培养和有效命名。因为大多数菌无法在非常特定的条件下培养分离鉴定。
在过去十年中,宏基因组研究的重要性已经凸显,因为它能够评估细菌基因库并发现当前实验室培养技术无法掌握的新细菌基因组。这些数据对于扩大我们对地球上微生物多样性的理解至关重要。
由于宏基因组测序数据由来自多个物种和菌株的 DNA 序列片段组成,通常有数千个来自不同生命领域,因此此类分析的主要挑战是正确确定每个 DNA 序列片段的真实来源。不幸的是,这些步骤容易出错,因此必须对结果进行严格审查,以避免发布不完整和低质量的基因组。
最近,比利时研究人员新开发MAGISTA,这是一种评估宏基因组基因组组装质量的新方法,基于随机森林的方法估计MAGs的完整性和污染度,解决了当前基于参考基因的方法经常被忽视的一些缺陷。
MAGISTA是基于宏基因组bins内的contig片段之间的无对齐距离分布,而不是一组参考基因。该方法利用了来自整个 bin 的信息。为了正确评估此方法,并说明基于参考的工具的缺点,最近,比利时研究人员构建了一个高度复杂的 DNA 模拟群落,由 227 个细菌菌株组成,并且具有不同程度的相似性。

方 法
训练集来(HC227)自 227 个细菌菌株,测试数据集由五个公开可用的短读(short reads)子集构成,其中四个含有来自复杂度相对较低的基因组 DNA 模拟群落的reads。具体情况如下图所示。
Complexity列指示菌株数;Assembly tool列表示所使用的用于组装的软件;Binning method列表示所使用的用于分箱的工具;Binning parameters列表示所使用的用于评估分箱质量的指标,comp为完整度,cov为覆盖率。

MAGISTA计算步骤:
输入binning后的每个bins
-●-
第 1 步:选择适合的片段大小与距离计算方法
-●-
首先将每个 bin 中的每个 contig 拆分为固定长度的片段,然后使用四种不同的方法(即 PaSiT4、MMZ3、MMZ4 和 Freq4)计算一个 bin 中的片段之间的所有距离。对于每种方法,都选择了特定的片段长度,以便为不同的生物产生不同的特征分布。
每种方法的最终片段长度的选择是通过不同方法分析整合决定的,方法如下图所示。每组的设计中至少两个基因组来自同一个家族,两个基因组来自相同的顺序但来自不同的家族。这些基因组被人为地分成所需长度的片段,并为每个片段计算目标特征。
对于每组五个基因组,混合所有片段并根据它们的特征进行主成分分析(PCA),然后进行二次判别分析,用于生成分类器,旨在区分每组中重叠最多的两个基因组。对该分类器的准确度取平均值,结果用于选择方法和片段长度的最终组合。

-●-
第 2 步:模型中特征变量的选择
-●-
为每种方法选择片段长度后,使用平均值、标准差、偏度、峰度和中位数以及 2.5%、5%、10%、90%、95% 和 97.5% 百分位数计算距离分布。此外,还计算了 1 kb 片段的 GC含量分布。以及每个bin的大小,共计66个特征变量。
-●-
第3步:模型构建
-●-
使用 R (v 4.0.3) 包“RandomForest”中的“RandomForest”函数和默认参数训练随机森林模型。同时使用R包lm再建立一个线性模型执行线性回归,输入经对数转换后的特征变量值,用于交叉验证分析。
主 要 结 果
一个高度复杂的基因组DNA模拟群落
由来自 227 个细菌菌株的基因组 DNA 组成,这些菌株属于8 个门(Actinobacteria, Bacteroidetes,Deinococcus-Thermus, Firmicutes,Fusobacteria,Planctomycetes, Proteobacteria和Verrucomicrobia),18 类,47目,85科,175属,197种。

编辑
上图为模拟群落中的细菌菌株的基因组大小和GC含量(从26.3%到73.4%)散点图;

编辑
图为训练集与测试集中物种之间的关系图。红色线条表示在训练集中存在的菌种,灰色线条表示在训练集中存在的菌属。环状图中的不同颜色代表不同分类水平。图例中存在于训练集中的菌门用*标记,存在于古生菌的菌门用深灰色色带标记。
CheckM中基于单拷贝标记基因(SCMG)来评估 bin 质量的存在的缺陷

图a和b分别为从CheckM中输出的完整性指标和污染度。使用R^2y∼x(解释方差的百分比),RMSE(相对于实际值的均方根误差)两个参数评估结果。结果表示CheckM高估了bin的质量。许多受污染的bins被预测为接近未受污染。
使用MAGISTA分析模拟群落中的bins

首先选择最佳片段大小用于计算距离分布,如上图所示,考虑了 1、5、10、20、30、40、50、75 和 100 kb 的片段,最终选择了粗体所示的片段大小。

图为concont、MetaBAT和MaxBin产生的bins的完整性和污染度信息。
由于通过模拟生成这样的数据集并不能准确地表示真实的结果,所以使用了binning软件的结果,提供了一组不同质量的真实的bins。训练数据集的完整性和未污染度均在90%以上。

最后是模型构建,建立完整性和污染度的预测模型。并进行了模型评估,如图所示。分别对CheckM、MAGISTA 和 MAGISTIC测试了其性能。CheckM是现在主流的一款评估bin质量的工具。MAGISTIC是一款结合了CheckM和MAGISTA 的工具。使用解释方差的分数(R2y∼x)和均方根误差(RMSE)作为评估性能的指标。对于完整性的预测,MAGISTA 优于 CheckM。对于污染度的预测,MAGISTA 的表现优于 CheckM。
结 论
研究人员开发了一种新的用于预测高度复杂的宏基因组组装基因组bin的质量的方法,MAGISTA。是基于 SCMG 的低复杂性宏基因组方法的一个同样好的替代方法。除了MAGISTA之外,还通过结合CheckM的结果,使用MAGISTIC生成了一个更准确的预测。
研究人员在文章中指出MAGISTA 和 CheckM 都没有达到足够的准确度来被认为是可靠的。MAGISTIC 产生了比 MAGISTA 更好的结果。
在附加分析中,将测试集分为了两个子集,从真实和模拟reads中获得的bins,对此再进行分析,结果表示,CheckM 对于“真实”子集表现良好(但相比MAGISTA 和 MAGISTIC还是较差),对于“模拟”子集部分表现较差。而MAGISTIC相比MAGISTA会更准确些。但是文章中并没有详细说明MAGISTIC的工作流程。
查看作者在github上公开的软件说明,地址如下。但是没有说明和给出输出文件的内容。个人认为还不太成熟。
https://github.com/LM-UGent/MAGISTA
参考文献:
Goussarov G, Claesen J, Mysara M, Cleenwerck I, Leys N, Vandamme P, Van Houdt R. Accurate prediction of metagenome-assembled genome completeness by MAGISTA, a random forest model built on alignment-free intra-bin statistics. Environ Microbiome. 2022 Mar 5;17(1):9. doi: 10.1186/s40793-022-00403-7. PMID: 35248155; PMCID: PMC8898458.
谷禾健康

最近的Nature 和 Nature Medicine 连发表了好几篇关于肠道菌群的文章,包括肠道菌群与神经互作,和基于这个原理的针对自闭症的临床治疗方案。心血管疾病的微生物组和代谢特征等。
今天我们主要介绍心血管疾病中冠状动脉疾病的相关重要研究发现和意义。
复杂的疾病,如冠状动脉疾病(CAD),往往是多因素的,由多种潜在的病理机制引起。尽管冠状动脉疾病在预防、诊断和治疗方面取得了巨大进展,但仍然是世界范围内发病率和死亡率的主要原因。目前对冠状动脉疾病的治疗基于传统的和可控制的冠状动脉疾病风险因素,只能取得部分成功。
冠状动脉疾病的发展包括血管壁上动脉粥样硬化斑块的逐渐生长,这通常与代谢状态受损有关。人体接触环境分子的主要部位是胃肠道,其中膳食成分被微生物群转化,利用产生代谢物传播到全身器官。
血液充当体内分子的液体输送器, 特别是数以千计的循环代谢小分子,它们可以帮助我们了解体内生物过程状况,并且是研究冠状动脉疾病多因素性质疾病的宝贵来源。肠道微生物组积极参与血液代谢物的代谢。
几种肠道微生物群衍生的循环代谢物与心血管疾病相关:
三甲胺 N-氧化物
三甲胺 N-氧化物被确定为人类心血管疾病的标志物,进一步的证据表明在小鼠模型中具有促动脉粥样硬化性和促血栓形成。
硫酸吲哚酚
硫酸吲哚酚在细菌色氨酸酶降解色氨酸后在肝脏中产生,并被证明与动脉僵硬和外周血管疾病有关。
对甲酚
对甲酚是苯丙氨酸和酪氨酸的结肠细菌发酵产物,显示与心血管事件增加相关。
近期,以色列科学家招募了下列人群,采集其粪便和血清样本进行了全面的多组学分析,同时调查详细的医疗、生活方式和营养问卷等。
通过对粪便样本宏基因组测序(每个样本1000万 reads,约3G/样本)和对血清样本的进行非靶向质谱LC-MS测量了 961 种代谢物的水平,包括脂质、氨基酸、异生物质、碳水化合物、肽、核苷酸和大约 30% 的未命名化合物。
通过 Nightingale Health 的质子核磁共振 ( 1 H-NMR) 平台测量了另外 228 种血浆代谢物和比率,并使用了一个独立宏基因组数据集MetaCardis进行验证(该数据集样本来自于北欧血统队列,在地里区域上与该研究样本来源不同,这样可以分析遗传,饮食差异变量)。
MetaCardis数据集主要由四个主要群体组成:缺血性心脏病、健康对照组、代谢匹配的对照组和未经治疗的代谢受损对照组(详细数据集描述可以参看原文)
一、ACS的肠道微生物组特征
1. ACS 患者的变形杆菌丰度更高
这与之前的大多数研究结果一致,变形菌增多会导致处于炎症状态,是生态失调的标志。
20个在 ACS 或对照个体中显着富集的细菌,包括产丁酸盐的细菌如:梭菌属(Clostridium)、Anaerostipes hadrus嗜热链球菌(Streptococcus thermophilus)和Blautia菌属,以及Odoribacter splanchnicus 和大肠杆菌。
2. ACS患者队列中一种梭菌科的细菌物种 SGB 4712缺乏
在20 个显着富集的基因组中,鉴定到了一种以前未知的梭菌科细菌物种,索引为 SGB 4712。为了进一步验证该结果稳定和实用性,使用另外一个来自北欧血统地理上分布不同的队列,MetaCardis宏基因组数据集进行验证,与该研究结果一致,该物种的相对丰度随着具有 CAD 传统风险因素的种群逐渐减少。
3. SGB 4712关联15种显著差异的代谢物,其中包括降低心血管疾病风险的独立标志物——麦角硫因(ergothioneine,天然氨基酸)
对照组相比, 鉴定到SGB 4712 菌种与15 种循环代谢物的水平显着相关,在 MetaCardis 研究中,所有 15 种代谢物与 SGB 4712 的相关系数均可以重复,其中 10 种相关性仍然显著。
值得注意的是,SGB 4712与麦角硫因呈正相关,麦角硫因是一种天然存在的氨基酸,在体外显示对细胞应激源具有抗氧化和细胞保护能力,最近被证明是降低心血管疾病和人类死亡率风险的独立标志物。
此外,SGB 4712 与七种化学结构未知的化合物有关。其中包括 X-11315 和 X-24473,预测它们来自饮食,并与 SGB 4712 呈正相关。
图一 ACS 的微生物组和血清代谢组学特征

圆形热图显示 ACS 和非 ACS 对照组之间显着差异的前 200 种代谢物,与年龄、性别、BMI、吸烟状况和 DM 相匹配(方法)。每个切片代表一个代谢物,其名称显示在图表的外层周围。
这些结果突出了SGB 4712菌种在 CAD 发展中具有潜在的保护作用,由一系列循环血液代谢物介导,其中一些以前被证明在元生物途径中发挥核心作用,而另一些则未知。
因此,在实验研究中进一步验证后,这些代谢物可能会形成降低 CAD 风险的新目标。
二、ACS 的代谢特征因人而异
1. ACS 患者的血清代谢物水平个体化差异较大
虽然 CAD 患者具有共同的内表型,但他们通常表现出生物学上不同的疾病特征。为了更好地了解 ACS 的个体水平变异性,作者试图检查与非 ACS 对照的代谢偏差,并询问它们是否是个体特异性的。
计算了他们的个体偏差,并根据之前根据饮食、微生物组、传统风险因素和遗传学估计的 EV 对每个个体的前 100 个偏差代谢物进行加权。最后发现ACS 患者与其匹配对照的代谢偏差是因人而异的。
急性冠脉综合征患者的血清谱在血清代谢物水平上表现出广泛的扰动,包括533种显著改变的代谢物。
ACS的血清代谢组遵循一种主要的消耗模式,因为在对照组参与者中,358种代谢物(67%)的平均测量值较高。然而,这一趋势在主要的生物途径中并不一致。但是,与富含 ACS 的代谢物相比,饮食和微生物组在与 ACS 耗尽代谢物的偏差相关联方面更为显着(双尾 Mann–Whitney U-检验,P-value小于10 -20),这表明微生物组对 CAD 起保护作用。
值得注意的是,超过 90% 的显着扰动的代谢物无法用血糖状态来解释,这表明这种变化背后还有其他机制。所以进一步分析了其他系列综合因素(包括宿主遗传学、微生物组和饮食),得到一个重要发现就是:饮食和微生物组可以更好地解释 ACS 缺乏或含量低的代谢物,而传统的风险因素可以更好地解释 ACS 富集的代谢物。
图2 代谢偏差由潜在决定因素解释,并与临床参数相关

a、b、密度图显示 ACS 参与者的分布(y轴)与代谢物的潜在决定因素(微生物组、饮食、传统风险因素或遗传学)的平均加权R 2 ( x轴);富含 ACS 的代谢物。
2. 相似的临床特征,但其动脉粥样硬化负担的代谢机制却不同
虽然一些患者可能具有相似的临床特征,但他们的潜在生理状态和疾病轨迹可能不同。为了强调这种 CAD 患者的变异性,作者选择了 ACS 患者的常规危险因素的同质亚组。其中包括 17 名 60 至 70 岁的男性患者,低密度脂蛋白 (LDL) 在 0.70–1.30 mg ml -1范围内,糖化血红蛋白 (HbA1C) 低于 6%。尽管具有相似的临床特征,但该 ACS 患者亚组在代谢偏差方面表现出异质性。
三、微生物组在CAD早期阶段发挥作用
动脉粥样硬化是一种经过多年发展的进行性疾病,其中动脉粥样硬化斑块形成的每个阶段的特点是不同的病理过程。在早期阶段,血管壁上的动脉粥样硬化斑块的生长通常与代谢状态的损害有关。
为了解释每个代谢成分在 CAD 发展的时间轴上的参与,作者将个体代谢偏差的分析应用于代谢受损的对照(定义为 T2DM、高血压或血脂异常的诊断,或 BMI > 35),以及到非 ACS 个体的随机子集。
在比较这三组的分数时,我们发现分数分布存在一致的差异。与微生物组和饮食相关的代谢异常呈现出渐进的趋势,与对照组的随机子集相比,代谢受损的对照参与者的代谢物存在显着偏差。
这表明,微生物组和饮食对ACS的贡献可能是通过受损的代谢状态介导的,而不是代谢受损个体中尚未表现出的与传统风险因素和遗传学相关的代谢物异常。

a – d,归因于饮食 ( a )、微生物组 ( b )、传统风险因素 ( c ) 和遗传学 ( d ) 的代谢偏差分数计算三个亚组:(1) ACS 个体 ( n = 135) 与非 ACS 对照与年龄、性别和 BMI 相匹配(橙色);(2) 患有代谢障碍的非 ACS 对照(定义为:诊断为 T2DM、高血压或血脂异常,或 BMI > 35;n = 102)与其他年龄、性别和 BMI 匹配的非 ACS 对照(蓝色);(3) 一组随机的非 ACS 个体 ( n = 132) 与其他匹配年龄、性别和 BMI(灰色)的非 ACS 对照。
四、血清代谢组学预测ACS患者 BMI 更高
肥胖是 CAD 的主要独立危险因素,影响已知的危险因素,如血脂异常、高血压、葡萄糖耐受不良和炎症状态,以及可能尚未认识到的机制。BMI 测量被用作肥胖的标志和代谢健康的指标。
为了研究肥胖作为 CAD 的独立危险因素,该研究设计并彻底验证了基于血清代谢组学的 BMI 模型,并表明较高的预测 ΔBMI 对应于更广泛的动脉粥样硬化疾病。
作者分析了CAD 患者的 BMI-代谢组平衡是否以及如何被破坏。使用了梯度提升决策树 (GBDT) 算法预测 BMI,结果表明在非ACS受试者中发现的代谢组-BMI模式在ACS患者中受到干扰。
为了研究这些扰动,作者测试了对照组和 ACS 测试集中预测和测量 BMI 之间的差异,这里称为 ΔBMI。结果发现,与非 ACS 受试者相比,该研究的模型预测 ACS 的 ΔBMI 更高。
为了验证这些结果的稳健性,作者试图根据其他类型的代谢组学数据和独立队列来复制这些发现。将相同的预测程序应用于基于 NMR 的代谢组学数据,并观察到ACS 和对照之间 ΔBMI 的更大差异,应用于为发表的MetaCardis 队列数据中得出在所有 BMI 范围内,与血糖正常的缺血性心脏病患者相比,患有糖尿病的缺血性心脏病患者的 ΔBMI 显着更高。
进一步分析推断哪些特定代谢物是 ACS 患者高 ΔBMI 的主要驱动因素,发现两种脂质在对照组中与 BMI 呈负相关,后者在患有更广泛疾病的患者中也显着减少,这两种脂质分别是:
1-(1-enyl-palmitoyl)-2-oleoyl-GPC (P-16:0/18:1)
1-(1-enyl-palmitoyl)-2-linoleoyl-GPC (P-16:0/18:2)
最近的研究表明,脂质1-linoleoyl-GPC (18:2) 与肥胖和 T2DM呈负相关,并且脂质水平的增加显着降低了T2DM的风险。该研究发现 1-linoleoyl-GPC (18:2) 和 1-(1-enyl-palmitoyl)-2-linoleoyl-GPC (P-16:0/18:2) 在对照组中与 BMI 呈负相关,并且在患有更广泛 CAD 的患者中显着耗尽,这表明这些代谢物可能作为降低 CAD 风险的潜在靶点。
此外,两种代谢物都含有一条亚油酸链,一种必需脂肪酸,与 T2DM 风险呈负相关。然而,这些假设应在干预性研究中进一步检验。
迄今为止,大多数研究都集中在寻找在 CAD 患者中增加的新代谢物,而该研究对 199 名 ACS 患者进行了全面的多组学分析结果强调, ACS 的代谢组学特征是缺乏多种血清代谢物,其中许多与饮食和微生物组有关。
其中一个重要的发现是以前未知的细菌物种 SGB 4712,它在 ACS 患者和独立验证队列中都显着缺乏或偏低。通过进一步将这种细菌与心脏毒性和心脏保护代谢物的水平联系起来,证明了特定细菌基因组的缺失可能与 CAD 风险增加相对应,并提出在后续干预研究中评估的具体目标。总体而言,这些发现因此为 CAD 患者的预测甚至治疗提供了一种新方法。
迄今为止,大多数研究都对 CAD 患者进行了批量分析,寻找人群水平的风险因素,而不是关注个体水平的生物变异性。在这项研究中,作者使用全面的代谢组学和微生物组分析,呈现了 CAD 内部变异性的深度映射。总之,结果揭示了新的范式和治疗方向。
参考文献:Talmor-Barkan Y, Bar N, Shaul AA, Shahaf N, Godneva A, Bussi Y, Lotan-Pompan M, Weinberger A, Shechter A, Chezar-Azerrad C, Arow Z, Hammer Y, Chechi K, Forslund SK, Fromentin S, Dumas ME, Ehrlich SD, Pedersen O, Kornowski R, Segal E. Metabolomic and microbiome profiling reveals personalized risk factors for coronary artery disease. Nat Med. 2022 Feb;28(2):295-302. doi: 10.1038/s41591-022-01686-6. Epub 2022 Feb 17. PMID: 35177859.
谷禾健康

微生物物种的遗传变异研究通常包括单核苷酸多态性(SNPs)、结构变异(structural variants ,SV)和可移动遗传元件(mobile genetic elements,MGEs)。
在宏基因组中,SNP被用来量化种群结构、追踪菌株和鉴定微生物表型的遗传决定因素。然而,现有的基于比对的宏基因组SNP检测方法需要高性能的计算和足够的覆盖深度来区分SNP和测序错误。
为了解决这些问题,美国加利福尼亚大学研究人员使用高质量基因组,构建了 909 个人类肠道物种中 1.04 亿个 SNPs 的目录,并使用针对该目录的独特 k-mers 表征来自 7,459 个样本的肠道菌群的全球种群结构,开发了GenoTyper for Prokaryotes(GT-Pro),可以对宏基因组的这些 SNPs进行快速基因分型的方法。该研究成果近日公开在《Nature Biotechnology》发表。
该方法与使用读长对齐的方法相比,GT-Pro 更准确,速度快两个数量级,作者构建了一个GT-Pro数据库,基于大约25,000个宏基因组样本,并展示了GT-Pro如何用于数千种菌群的菌株水平探索,可以实现在个人电脑上快速高效地对数百万个SNP进行宏基因组分型。


如图,按箭头方向所示。
首先从全基因组序列中识别高质量基因组的物种(去除<10 个高质量基因组的物种,高质量基因组:≥90% 的完整性和≤5% 的污染),对于每个物种,一个有代表性的基因组是根据平均核苷酸一致性(Average Nucleotide Identity,ANI)和组装质量指标选择的,确定代表性基因组后,对每个物种,通过MUMmer软件将每个同种基因组(conspecific genome )与代表性基因组比对,确定SNP,在这些SNP中选择常见的双等位基因SNP用于分型(site prevalence ≥90% and minor allele frequency >1%)。
接下来提取覆盖SNPs的k-mers(sck-mers),过滤出独有的物种,同时检测LD块,并选择具有物种特异性的sck-mers的SNPs和该块中其它SNP的最高LD。LD块为基于跨基因组的共现模式将 SNP 聚类成linkage disequilibrium block。检测LD块使用R2 阈值 (0.81) 。具有物种特异性的sck-mers即删除了两个或多个物种共有的任何sck-mer。
最右边的方框里简要是GT-Pro的算法和数据结构的优化方法。也是该研究的主要目标之一,正是利用了该方法构建的SNP索引才能实现快速地分型。
首先是k-mers编码,选择了k=31,以便使用64位整数编码,通过这一步骤,GT-Pro 数据库缩小了四倍。
其次是多索引检索和进一步压缩SNP数据结构。
优化后的GT-Pro数据库由两个表组成:
(1)10.6 GB的sck-mers表,包含每个k-mer的4字节条目;
(2)2.4 GB的sc-span表,包含每个等位基因的24字节条目。
所需的总存储空间为13 GB,是原始sck-mer表的bzip2压缩的两倍。也使得GT-Pro可以在个人计算机中高效运行。
1.从模拟宏基因组中准确识别SNP

比较GT-Pro、MIDAS和metaSNV宏基因分型的准确性,使用232个未用于开发这些方法的人类肠道分离株的模拟宏基因组(大约2600万次reads)。
图a为FDR比较,假阳性指不正确的基因型,是由测序错误和读数映射到错误位点导致的。假阴性指缺失的基因型,在没有读数映射时产生。在宏基因组中,FDR最低的是GT-Pro(中位数,0.4%),而 metaSNV 最高(中位数,14.5%)。
图b为对图a的灵敏度调查,用于直接比较不同方法。敏感性是指在GT-Pro数据库中检测到分离株基因组(参考和非参考等位基因)中存在基因型的概率。结果表示,随着覆盖度的加深,GT-Pro的灵敏度损失较小。
图c为比较三个工具在一对同种分离株但不同覆盖率下的FDR,目的是检查宏基因组分型方法对菌株混合物的表现。其中一个菌株始终为15倍的覆盖率,另一个菌株的覆盖率从 0.001 到 15 倍不等。FDR包括纯合位点和杂合位点。
总体而言,GT-Pro的 FDR与 MIDAS 相似但低于 metaSNV。
图d为对图c的灵敏度调查,敏感性是指正确判断reads所模拟的基因组的基因型(纯合位点和杂合位点)的概率。GT-Pro 的灵敏度低于基于比对的方法,基于比对的宏基因分型通常使用覆盖率和等位基因频率过滤来减少错误的杂合性调用。
图e为基于图a中模拟的等位基因,从tag SNPs推算的基因型的FDR。结果表示大多数物种的 FDR 较高但仍低于 5%。
图f和图g,为了探索 GT-Pro 是否能用于定量估计物种丰度,使用从单个分离株和对同种分离株中模拟的宏基因组,比较了sck-mer匹配reads的平均数量和已知的基因组覆盖率。结果表示GT-Pro等位基因的调用和计数可以用一个小的校正因子来估计物种和菌株的相对丰度。
所有的结果表示,在模拟宏基因组的测试中,metaSNV 和 MIDAS 对于丰富的物种(>5×覆盖度)和保守位点表现良好,但 GT-Pro 对典型覆盖率值、非参考和杂合位点更准确和敏感,同时对错配和测序错误更为稳健。只是,与 metaSNV 和 MIDAS 相比,GT-Pro 无法检测其数据库中缺少的新 SNP。
结论是,在保守的基因组区域仔细选择sck-mers能使 GT-Pro 能对来自鸟枪法宏基因组数据的已知 SNPs 进行敏感和特异性的基因分型。
2.从模拟宏基因组中准确识别SNP

使用GT-Pro对肠道微生物组样本进行宏基因组分型,结果与基于比对的MIDAS宏基因组分型比较。
图a和b分别为流行率(prevalence)、平均等位基因频率(Average allele frequency)
图c和d类似图a和b,只是物种不同。
每个点代表一个 SNP,颜色表示两种方法的共有等位基因(即样品中最常见的)是否相同(绿色),两种方法都返回某些样品的基因型,但共有等位基因不同(紫色)或仅GT-Pro 返回基因型(黑色)。
结果表示对于高覆盖率物种,基于比对的方法能检测到GT-Pro数据库中没有的SNP,而GT-Pro 在中低覆盖率物种中检测到更多SNP位点。这部分结果也与模拟宏基因组测试时的结论一致。
1.使用GT-Pro的SNP估算结构变异

研究人员试图使用GT-Pro的SNP推断附近基因或操纵子的存在,从而作为结构变异的生物标志物。
首先对艰难梭菌的毒性控制位点CdtLoc和PaLoc的侧翼区域使用GT-Pro检索SNP。
接着用艰难梭菌的参考基因组训练了一个随机森林分类器,用于预测来自混合群组(n = 7,459)的人类肠道宏基因组中存在/不存在艰难梭菌毒素基因位点。
图e和f分别代表CdtLoc基因和PaLoc基因,对每个样本,最左边的热图,第一列为预测的,第二列为基于比对方法得到的,黑色表示存在,白色表示不存在。
从左到右的条形图分别指艰难梭菌的相对丰度、全基因组序列覆盖率,从毒素位点检测到的基因数目,所有这些都是通过比对到艰难梭菌的代表性基因组来估计的。结果表示预测到艰难梭菌毒素位点的概率>0.6。
对CdtLoc的几个预测与宿主的表型相关(P < 0.001),包括5名艰难梭菌阳性和CdtLoc(+)的克罗恩病患者,这与该人群对艰难梭菌病理的高易感性相一致。与此相反,CdtLoc基因座在大多数可检测到艰难梭菌的健康婴儿中没有被预测,这与婴儿期艰难梭菌常见的无症状定殖一致。这些结果表明,GT-Pro可以预测具有临床相关性的linked structural variants。
2. 使用 GT-Pro 捕获新的种内遗传结构


GT-Pro 可以对从参考基因组中鉴定的已知 SNP 进行宏基因组分型分析。但研究人员认为GT-Pro还有更广阔的发展,假设GT-Pro可以基于 SNP 等位基因的不同组合检测新的菌株变异。
为了验证该假设,研究人员使用GT-Pro 对最近发表的北美炎症性肠病 (IBD) 队列 的 220 个粪便宏基因组中发现的物种进行基因分型。使用UMAP降维分析,每个图都是将UMAP应用于一个物种GT-Pro SNPs基因型矩阵的结果。每个点代表该物种的一个菌株(杂合宏基因组的主等位基因)。紫色为队列样本,绿色为GT-Pro基因组。
结果表明 GT-Pro 的数据库代表了这些个体的常见菌株多样性,对于大多数物种,如图一的a和b,粪便样本组与参考基因组聚集在一起,相比之下,对于少数物种。
如图二的c和d,分别是新的亚种,观察到基因型与数据库中任何参考基因组不同的粪便样本群,包括一些富含IBD患者的样本。这说明可以使用 GT-Pro 常见 SNP 发现新的亚种遗传结构。
3. GT-Pro 探索全球人类肠道微生物组遗传变异


来自六大洲 31 个地点的 7,459 个肠道样本中发现的 881 个物种的 5180 万个 SNP的多个物种的种内遗传变异荟萃分析。
图e来自不同国家的宏基因组间的等位基因平均共享分数的热图。打叉单元格表示由于样本对不足(<5,000)而导致分数缺失。
图f为78 个常见物种的洲际种群分化分析(大陆内部与大陆之间的遗传相似性,用 F 统计检验测量亚种群 (FST) 中捕获的总遗传变异的比例)。
每个箱线图代表一个物种的洲际 FST 分布,按中位数排序。图g为通过直肠Agathobacter rectalis(物种ID 102492)的GT-Pro宏基因组基因型中的种内遗传变异捕获的地理模式的示例。
图h为为基于图g中相同样本的物种相对丰度的UMAP 分析。每个点都是一个宏基因组样本。颜色与图e示意一致。
结果表示,等位基因共享与工业化程度以及宿主关系明显关联;洲际种群间的分化程度有巨大差异,具有高FST的物种显示出明显的宿主集群,但不是所有宿主集群都与地理相关。
这与菌株在宿主中殖民的生活方式和环境的作用相一致。相比之下,在基于物种相对丰度的UMAP分析中,宿主间并没有明显集群,这表明宏基因组基因型可能揭示了在丰度分析中缺失的微生物生态学和微生物群落-宿主关系。

图a评估GT-Pro在笔记本电脑(左)和服务器环境(右)中的计算性能,以bits为单位。颜色表示处理速度,圆圈大小为RAM使用峰值。黑色方框表示最优状况。
图b-c为GT-Pro与metaSNV、MIDAS、StrainPhlAn、 Kraken2之间的速度比较,分别在服务器环境和笔记本电脑下比较。
图d-e为RAM使用峰值的比较,分别在服务器环境和笔记本电脑下比较。* 由于超出可用 RAM,Kraken2 无法在笔记本电脑中运行。
这些分析表明,与其他方法相比,GT-Pro 在服务器上大约快 8.5-570 倍,在笔记本电脑上快 8.3-163.6 倍。平均而言,处理每个宏基因组只需要在服务器上不到 4 秒,在笔记本电脑上大约需要 13 秒(平均为 497 万次读取)。虽然 GT-Pro 比其他方法更快,但它在服务器上需要 1.1-53.7 倍的 RAM和笔记本电脑上的 2.9-29.2 倍的 RAM(不包括内存不足的 Kraken2)。因此,只要计算机具有足够的 RAM,GT-Pro 数据结构和算法就可以极大地加速宏基因组分型。
研究人员在该文章中使用GT-Pro大约分析了2.5万个宏基因组,展示了GT-Pro是如何快速准确的识别SNP以及探索结构变异、种内遗传变异等。GT-Pro不使用基于比对的方法,而是类似于Kraken2,通过编码k-mers来快速检索,并适用于个人计算机或服务器环境。
但是它也不是完美的,目前GT-Pro存在的不足和如何应对:
第一,GT-Pro 数据库并未捕获所有人类肠道微生物多样性:但是通过基因组测序,会持续扩大SNPs的数量和涵盖的物种。
第二,GT-Pro 类似于基因分型阵列,因此不能识别新的 SNP,这需要其他方法,例如基于比对的宏基因组分型或单细胞基因组测序。
第三,由于基因组集合中存在高度相关的物种,少数物种缺乏物种特异性的 sck-mers。替代策略,例如使用更长的 k-mer 或不太常见的 SNP,可以对这些物种使用 GT-Pro 。
第四,尽管非常严格的挑选了用于构建GT-Pro的基因组和SNPs,但不可能完全排除错误(例如,不完整、污染和物种错误分类)。
最后,GT-Pro 不直接对结构变异进行基因分型。
“
考虑几个GT-Pro的未来发展方向,比如:
将GT-Pro与下游算法结合起来,以识别代表新微生物菌株的SNPs簇,或准确标记参考数据库中已知菌株的SNPs;
将GT-Pro的计算框架扩展到其他微生物环境中;为短插入缺失和结构变异开发无比对宏基因组分型;
将微生物组应用于精准医学,综合识别与疾病或其他特征(如致病性、抗菌耐药性、药物降解)相关的SNPs;
将GT-Pro用于检测污染、重组和跟踪变化,比如变异或菌株随时间、宿主生活方式和地理位置的变化。
主要参考文献
Shi ZJ, Dimitrov B, Zhao C, Nayfach S, Pollard KS. Fast and accurate metagenotyping of the human gut microbiome with GT-Pro. Nat Biotechnol. 2021 Dec 23. doi: 10.1038/s41587-021-01102-3. Epub ahead of print. PMID: 34949778.
谷禾健康
随着科学技术的巨大进步,产生了大量的“组学”数据。理解生物系统各个层次产生的大量序列和结构数据是关键,由此产生了“生物信息学”。
“生物信息学”是一个跨学科领域,主要是用计算算法来组装、评估、理解、可视化和归档与生物分子相关的数据。

从基因组测序、基因及其功能预测到蛋白质分析,如蛋白质结构和功能预测、系统发育研究、药物和疫苗设计、生物体鉴定,以及支持和推进生物技术领域的研究,都需要用到生物信息学。
今天给大家推荐一本书《Advances in Bioinformatics》,帮助广大科研工作者更容易进行研究,从而对生物学有新的见解。

该书共23个章节。涵盖了蛋白质组学、代谢组学、DNA测序和NGS技术、基因组分析、生物计算、神经网络分析、大数据分析、软计算、人工智能到进化生物学、疫苗和药物设计、生物合成学和癌症生物学应用等,从这些领域出发,综述了生物信息学在其中的应用、发展、帮助和已经获得的成果,并探讨了未来的发展方向。
1. 生物信息学简介及其应用
生物信息学在DNA测序与分析、基因组测序及其注释分析、进化生物学的计算、比较基因组学、基因和蛋白表达分析、蛋白质和DNA、RNA的结构分析、免疫信息和药物设计的技术应用。
2. 生物信息学工具和软件
重点介绍了Banqit、Spin、WEBIN、Sequin、Sakura等序列提交软件;ADIT、PDB_Extract等分子结构提交软件;SRS、Entrez、Getentry等序列检索工具。此外,还详细讨论了BLAST、CLUSTALW/X等序列比对工具,以及Swiss-Model、Modeller、JPred、3D-Jigsaw和ModBase等结构预测工具。
3. 生物信息学在生物科学中起到的作用
重点介绍了生物信息学在基因组学、转录组学、蛋白质组学和代谢组学等主要“组学”领域的作用,以及在其它领域,营养基因组学、化学信息学、分子系统发生学、系统学和合成生物学的应用。还讨论了生物信息学在这些领域的多样化发展。
4. 蛋白质分析:从序列到结构
介绍与蛋白质序列和结构分析相关的各种数据库和方法。这类研究的主要应用之一是在药物发现和开发方面。
5. 进化生物学
进化是一个物种或种群经历遗传特征变化的动态过程。对进化的研究被称为进化生物学。进化生物学研究的关键是序列变异,这是通过比较DNA或蛋白质序列来检测的。迄今以及开发了不同的计算工具来比对所获得的序列和识别序列变异。进化基因组学的应用正在从研究人类进化到研究各种病毒的进化。许多病毒对人类健康具有严重威胁。本章介绍了PAML、PhyML、MrBayes、RAxML、MSA、MUSCLE 、MAFFT 等用于系统发育分析的计算工具。并详细讨论了进化的计算原理。
6. 基于web页面的调控序列分析的生物信息学方法
本章主要概述了在线分析哺乳动物基因组中调控序列方法,以及用于调控序列分析的在线生物信息学工具。
7. 用于SNP分析的生物信息学资源综述
基因变异是导致生物物种内多样性的关键。单核苷酸多态性(SNPs)是遗传变异的主要形式。单核苷酸多态性在理解生物表型差异的进化过程中至关重要,而且还被用于各种疾病的诊断和治疗。本章详细介绍了用于人类和其他非人类基因组的SNP分析。此外,还讨论了在生物信息学领域需要解决的挑战和差距,以便在未来有效地研究SNPs。