谷禾健康
今年,国产AI大模型DeepSeek,凭借其强大的技术实力、低成本和开源策略,长居热搜榜,很想知道这位顶流AI对于肠道菌群行业的了解程度,于是就和它聊了聊。
编辑
当我问deepseek…
AI时代,肠道微生物行业相关应用与发展将会如何?
AI技术的快速发展为肠道菌群行业带来多维度革新,从药物研发到健康管理均产生显著利好,肠道微生物行业将迎来技术革新与产业升级的黄金期,其核心应用与发展趋势如下:
微生物组大数据挖掘
AI通过分析海量肠道微生物组数据(宏基因组、代谢组等),快速筛选潜在药物靶点。肠道微生物群落种类繁多、结构复杂,其产生海量数据。AI强大的数据处理能力可挖掘微生物间的相互关系,为新药研发指明方向,为攻克诸多疾病带来希望。
缩短研发周期
传统药物研发需10年以上,AI可将候选菌株筛选时间缩短70%。通过“IT(数据分析)+BT(实验验证)”模式,推进多款微生态药物进入临床,覆盖神经系统、肿瘤和免疫三大领域。
例如,在传统的筛选方法中,可能需要逐一测试大量的菌株,而AI可以通过算法和模型,快速排除那些不具备潜力的菌株,直接聚焦于最有希望的候选菌株,从而节省了大量的时间和精力。这不仅加速了药物研发的进程,还有望降低研发成本,为患者带来更多的治疗选择。
创新药物形态
包括粪菌移植(FMT)、配方菌(如复合益生菌)、代谢产物(如抗癌肽)、基因工程菌等。
FMT:分析不同供体和患者的肠道微生物组成差异,预测FMT的效果和可能出现的不良反应,为个性化治疗方案的制定提供依据,提高治疗的成功率和安全性。
配方菌:例如复合益生菌,是经过精心挑选和组合的多种有益菌群。深入了解不同菌种之间的相互作用和协同效应。通过分析大量的微生物组数据,确定最佳的菌种组合和配比,使其在调节肠道菌群、增强免疫力、改善肠道功能等方面发挥更显著的作用。还能根据不同人群的肠道特点和健康需求,定制个性化的复合益生菌配方。
代谢产物(如抗癌肽):挖掘出肠道菌群中具有抗癌活性的短肽分子,为肿瘤治疗提供新方向。
基因工程菌:通过分析微生物的基因组数据和代谢网络,确定合适的基因编辑靶点和调控策略,使基因工程菌更高效地生产目标产物,或者具备更强的环境适应性和生存能力。
工程化菌群靶向递送抗癌药物至肠道特定区域。还可以为工程化菌群赋予智能反馈机制,使其能够实时感知肠道微环境的变化,并根据需要调节药物的释放量。
菌群分型与疾病预测
AI模型通过关联肠道菌群特征与疾病标志物(如SCFAs、TMAO),可预测心血管疾病、肠癌等风险。
AI模型在疾病预测中准确性的提高是一个多维度且持续探索的重要课题,涉及到数据、算法、模型优化等多个关键方面。
首先,数据质量和数量是基础。高质量的数据是确保AI模型准确性的基石。
一方面,要注重数据的收集过程,确保数据的完整性、一致性和准确性。在收集与疾病相关的肠道菌群数据以及疾病标志物数据时,需要严格遵循标准化的采集、处理和存储流程,避免数据偏差和误差。
同时要尽可能收集大规模的样本,因为丰富的数据可以让AI模型学习到更多的模式和规律。通过整合多个来源的数据,如不同地区、不同年龄段、不同疾病状态人群的数据,可以增加数据多样性,提高模型的泛化能力。
其次,算法的选择和优化至关重要。对于疾病预测,需要选择合适的机器学习和深度学习算法,并根据具体情况进行调整和优化。
例如,深度学习中的卷积神经网络(CNN)在处理图像数据方面具有优势,而循环神经网络(RNN)及其变体(如长短期记忆网络LSTM)则更适合处理序列数据。
再者,特征工程也是提高AI模型准确性的关键环节。在疾病预测中,需要对肠道菌群数据和疾病标志物数据进行深入分析,挖掘出与疾病相关的关键特征。
特征工程是指从原始数据中提取、选择和转换有意义的特征,以提高模型的性能。例如,通过统计分析、相关性分析等方法筛选出与疾病发生发展密切相关的菌群特征和代谢产物指标。还可以采用特征降维技术,如主成分分析(PCA)、线性判别分析(LDA)等,将高维数据转化为低维数据,减少数据复杂性,提高模型的训练效率和准确性。
此外,模型的融合和集成也是一种有效的提高准确性的方法。不同的AI模型在不同的数据集和任务上可能具有各自的优势和局限性。通过将多个不同的模型进行融合和集成,可以综合各个模型的优点,提高整体的预测性能。
动态干预方案
基于AI的宏基因组分析,可为患者提供定制化膳食、益生菌及粪菌移植方案。AI技术则如同一个智能的“导航员”,能够从这些复杂的数据中挖掘出有价值的信息,为患者量身定制个性化的干预方案。
比方说,以高血压患者为例,高血压作为一种常见的慢性疾病,其发病机制复杂,涉及遗传、环境、生活方式等多种因素。针对高血压患者,AI可识别普雷沃菌属丰度异常并推荐靶向菌株。这些靶向菌株可以通过益生菌的形式补充到患者体内,调节肠道菌群的平衡,进而影响血压水平。
除了益生菌方案,定制化膳食也是动态干预方案的重要组成部分。AI可以根据患者的肠道菌群特征和疾病状态,为患者设计个性化的膳食方案。
动态干预方案的实施并非一蹴而就,而是一个持续监测和调整的过程。在治疗过程中,需要定期对患者的肠道菌群健康检测,以评估干预效果,并根据分析结果及时调整干预方案。
合成生物学应用
AI辅助设计基因工程菌(如产丁酸菌株),直接调控宿主代谢功能。
传统的基因工程菌设计主要依赖于科研人员的经验和试错,过程繁琐且效率较低。而AI拥有强大的数据分析和模式识别能力,能够处理海量的生物学数据,包括基因序列、蛋白质结构、代谢通路等信息。通过对这些数据的深入学习,AI可以预测基因的功能、设计优化的基因表达系统,并为基因工程菌的设计提供精准的指导。
产丁酸菌株可调控宿主代谢功能,丁酸作为信号分子能调节宿主代谢,菌株间相互作用也间接影响宿主代谢。AI通过构建模型设计最优菌株和策略,还能优化生产工艺。不过,其面临生物学复杂、数据质量等挑战,但前景广阔。
上游检测技术升级
检测手段日益多样化,16S rRNA测序能快速评估菌群组成多样性,宏基因组测序可揭示更全面信息。技术上不断优化,如多重PCR扩增提高检测覆盖率和分辨率,AI辅助数据分析提升结果准确性。
肠道菌群检测结果将更多地被纳入临床诊断体系。AI可以分析大量的临床病例和肠道菌群数据,找出肠道菌群变化与疾病之间的关联模式,为医生提供诊断参考。
例如,在一些疑难病症(如自闭症、帕金森病等)的早期诊断中,肠道菌群的异常特征可能成为重要的辅助诊断指标。
结直肠癌(CRC):识别肠道菌群中具核梭杆菌(Fusobacterium nucleatum)等促癌菌的异常增殖,结合粪便隐血检测,提升早期筛查灵敏度。
肠道细菌在结直肠癌发生和进展中的影响
Torres-Maravilla, E. et al.,Microorganisms 2021
炎症性肠病(IBD):
促炎菌增殖:肠杆菌科(Enterobacteriaceae)丰度显著升高,其代谢产物(如脂多糖)可激活TLR4通路,加剧肠道炎症反应;
抗炎菌缺失:具有抗炎功能的共生菌——普氏菌(Faecalibacterium prausnitzii)和产丁酸盐的罗斯氏菌(Roseburia)丰度普遍降低或缺失,导致短链脂肪酸合成不足,肠道屏障修复能力下降。
早期筛查:在血清标志物(如CRP)升高但未出现典型症状的人群中,检测到上述菌群失衡模式可提示早期IBD风险,推动结肠镜进一步确诊;
疗效监测:治疗过程中动态监测罗斯氏菌的恢复水平,可评估免疫抑制剂(如抗TNF-α药物)对黏膜修复的促进作用。
糖尿病:结合肠道菌群中产丁酸盐菌的减少与宿主血糖代谢数据,预测胰岛素抵抗风险。
Cunningham A L et al., Gut Pathog, 2021
菌群分型指导治疗:通过16s测序、宏基因组测序和代谢组分析,建立患者肠道菌群特征图谱。例如,补充AKK菌(Akkermansia muciniphila)仅在基线菌群低丰度人群中有效,需结合个体差异制定阈值。
通过连续监测肠道菌群变化(如抗生素使用后菌群恢复情况),辅助医生评估治疗效果。
例如:癌症化疗患者的化疗药物可能破坏肠道菌群平衡,导致免疫力下降。AI实时分析菌群数据,预警感染风险并推荐相关干预方案。
中游标准化建设
AI整合全球微生物组数据,推动菌株库建设、临床试验设计标准化。
硬件上,便携设备基于微流控技术实现高效处理,新型传感器提高敏感度。
软件上,智能数据分析系统实时处理数据并提供个性化建议,机器学习模型助力精准识别。
参与标准制定,获取ISO等认证,确保产品质量和安全。
下游健康管理服务
建立完善的用户教育体系,通过在线课程、健康顾问平台等帮助消费者理解检测结果。通过健康管理服务,将检测结果转化为具体的健康建议, 有利于公众对肠道菌群产品的应用。
肠道菌群健康管理将与营养学、微生物学、医学、心理学等多学科融合。AI作为协调者,根据肠道菌群检测结果,组织多学科专家团队为用户提供综合的健康管理服务。
例如,对于因肠道菌群失调导致情绪问题的患者,营养师调整饮食,心理医生进行心理疏导,微生物学家给出改善肠道菌群的具体措施。
针对高风险人群定制膳食或益生菌组合。
如蒙牛开发的青钱柳提取物组合通过抑制菌源DPP4,在动物实验中显著降低血糖 ,未来或成为糖尿病预防新手段。
结合实时监测技术(如便携式纳米孔测序),AI动态优化益生菌、膳食纤维摄入量或粪菌移植方案。
精准肠道菌群移植门诊通过线上线下结合模式服务患者。
跨界融合
肠道菌群通过代谢物(如5-羟色胺、GABA)影响大脑功能,可开发针对抑郁症、焦虑症的菌群干预产品。
益生菌菌株(如长双歧杆菌NCC3001)在临床试验中显示缓解焦虑效果。未来可能推出“精神健康益生菌+认知行为疗法”联合方案。
潜力:肠道菌群失衡与痤疮、湿疹等皮肤病相关,可探索口服益生菌或局部菌群移植(如皮肤微生物组喷雾)改善皮肤状态。
技术结合:AI分析肠道与皮肤菌群关联,定制内外协同治疗方案。
市场空白:针对宠物(如猫狗)的肠道菌群检测及定制化食品/补充剂,解决腹泻、肥胖等问题。
延伸场景:动物园或濒危动物保护中的菌群干预,提升圈养动物生存率。
特定人群管理
➦ 母婴菌群管理
剖宫产婴儿的母体菌群移植(阴道菌群纱布擦拭),降低过敏和免疫疾病风险。
孕期肠道菌群监测,预防早产或妊娠糖尿病。
产品形态:母婴菌包、菌群健康评估套餐。
智能监测手环:实时监测婴儿肠道气体(如氢气),反馈菌群定植效果。
➦ 肥胖人群管理
菌群特征:厚壁菌门/拟杆菌门比值(F/B比)升高,阿克曼菌(Akkermansia)丰度降低。
干预手段:
补充阿克曼菌改善肠道屏障功能,减少脂质吸收。菌群导向饮食(Microbiome-Directed Foods)抑制促肥胖菌(如阴沟肠杆菌)。
案例:比利时鲁汶大学开发的阿克曼菌口服制剂,可使肥胖者体重平均下降2.3kg(12周试验)。
产品形态设想:
控血糖菌群面包:添加抗性淀粉(促进罗斯氏菌增殖)+ 基因工程酵母菌(分泌GLP-1类似物)。
菌群血糖联动仪:连续血糖仪数据同步至菌群检测APP,动态调整。
肥胖菌群管理手环:根据肠道菌群数据(如厚壁菌/拟杆菌比)释放电信号,刺激迷走神经产生饱腹感。
菌群溶脂贴片:透皮递送Akkermansia muciniphila冻干粉,激活棕色脂肪产热。
➦ 老年人群管理
衰老相关菌群特征:多样性降低,促炎菌(如变形菌门)增加。
干预手段:
地中海饮食+益生元(菊粉)促进良性菌群定植。
个性化益生菌(如长双歧杆菌BB536)改善肌肉流失和认知衰退。
养老院菌群健康管理系统:
群体化菌群管理,降低集体感染风险。
中央监测平台:批量分析老人菌群数据,预警群体性致病菌传播(如艰难梭菌)。
自动配餐机器人:根据每位老人菌群报告,调配个性化餐食(如低FODMAP饮食+益生元添加)。
老年群体的肠道菌群产品需兼顾 “功能刚性”(如疾病预防)与 “体验友好”(如无创检测、语音交互)。通过菌群干预推迟慢性病发生,延长寿命,提高生活质量。
未来趋势可能是 “菌群-衰老-疾病”三联检测体系 与 “居家-社区-机构”三级服务网络的深度融合。
技术创新方向
➦ 菌群冷冻保存与“菌群银行”
概念:年轻时储存健康肠道菌群,年老或疾病时进行自体移植(类似脐带血储存)。
挑战:菌群复苏后的活性维持技术,需低温生物学突破。
➦ 其他形式检测
通过呼吸或血液标志物间接反映肠道菌群状态(如挥发性有机化合物VOCs分析)。
➦ 地域特异性菌群数据库
针对不同地区饮食和文化(如亚洲高纤维饮食 vs. 西方高脂饮食),建立菌群-健康关联模型,开发本地化产品。
比如,日本基于本土菌株开发的“FK-23益生菌”免疫调节产品。通过调节肠道微生态,改善消化健康,增强机体的免疫功能。
➦ 菌群农业与可持续食品
通过调控农作物或牲畜肠道菌群,减少抗生素使用,提升产量(如益生菌饲料添加剂)。
开发菌群发酵技术,生产高蛋白昆虫食品(如蟋蟀蛋白粉),减少碳排放。
数据壁垒
—挑战
个体菌群差异大,菌群构成受饮食、生活方式、年龄、地理位置、基因、种族、性别、药物等多元因素影响,单一数据库难以覆盖人群多样性,解读准确性受限。样本量碎片化,难以挖掘深层规律。
—破局关键:需建立更大规模数据库★
建立大规模数据库不仅是肠道菌群行业的“基础设施”,更是检测解读从“经验驱动”迈向“科学驱动”的核心引擎。其价值可归结为:
◑ 更准:通过人群细分与机制解析,降低个体差异导致的误判。
例如,高纤维饮食者与高脂饮食者的“健康菌群基线”截然不同,若缺乏细分人群数据,可能误判干预方向;东亚人群因乳糖酶基因缺失比例较高,其乳糖代谢相关菌的丰度与功能特征与欧洲人群不同,若仅依赖通用参考标准,可能误判菌群状态。
◑ 更深:揭示菌群与疾病的因果链,推动干预策略从“对症”转向“对因”;海量数据能增强统计效力,挖掘低频但强关联的菌群-疾病机制,推动科研向临床转化。
例如,在药物研发过程中,药物的疗效和安全性可能受到个体微生物群落的影响,某些药物的代谢可能依赖于肠道菌群中的特定酶。了解特定人群的正常微生物参考,可以帮助研发人员预测药物在不同人群中的代谢情况和疗效差异,从而优化药物设计和开发更具针对性的药物。
◑ 更活:动态模型随数据增长持续进化,使解读建议与时俱进。长期追踪数据可构建“菌群变化预测模型”,预警糖尿病、结直肠癌等慢性病风险,真正释放微生物数据在疾病防控、健康管理和药物研发中的潜力。
因果关系的模糊性
—挑战
菌群变化是疾病的“因”还是“果”难以确定(例如,抑郁症患者菌群失调是诱因还是结果?)。
—应对方案
纵向队列研究:开展长期追踪(如10年以上的肠道菌群动态监测),结合干预实验验证因果关系。
动物模型验证:利用无菌小鼠移植特定菌群,观察其对宿主生理的影响(如肥胖、免疫反应)。
数据解读的局限性
—挑战
用户对肠道菌群专业检测报告的理解有进步空间(如菌群丰度、α多样性指数)。
部分消费者可能对肠道菌群检测的认知停留在“保健品”层面,对科学价值的信任度不足。
—应对方案
开发可视化工具(如菌群“健康评分”仪表盘),提供通俗化建议。
通过科普内容(短视频、互动问答)提升公众对菌群健康的认知。
通过学术会议、继续教育课程让更多临床医生了解菌群检测的临床价值。
临床验证不足
—挑战
检测产品缺乏大规模临床验证,医学界对菌群诊断的接受仍然有限。
—应对方案
与医疗机构合作:推动菌群检测纳入临床试验(如辅助癌症免疫治疗疗效预测)。
商业模式单一
—挑战
盈利模式缺乏可持续性。
—应对方案
检测+干预产品(如个性化益生菌定制)。
订阅制服务:如每月菌群监测+营养师咨询;
或者比如每季度检测肠道菌群,生成动态健康报告,推荐阶段性干预措施(如季节性饮食调整预防过敏等)。结合可穿戴设备数据(运动、睡眠)提供综合建议。
与保险机构合作,将菌群健康管理纳入健康险增值服务。
伦理争议
—挑战
菌群移植(FMT)可能引发未知风险(如病原体传播、长期生态影响)。
—应对方案
严格供体筛查:建立菌群库的标准化筛选流程(如供体健康史、病原体检测等)。
知情同意强化:向用户明确告知菌群干预的潜在风险和不确定性。
未来趋势(2025-2030年)
多组学融合:AI整合代谢组、免疫组数据,解析菌群-宿主互作机制 。
例如,卷积神经网络(CNN)将菌群数据转化为图像,精准预测2型糖尿病患者的丁酸弧菌干预靶点。
全球市场扩张:中国微生态药物市场规模预计2030年达500亿元,年复合增长率超30%。
政策支持:国家“精准医学”专项将肠道微生物组列为重点,推动产学研合作。
AI与肠道微生物组的深度融合将重塑医疗健康产业,从药物研发、疾病防治到健康管理均迎来革命性突破。未来十年,具备“AI+”能力的企业将引领行业变革,推动个性化医疗的发展,而构建数据库、临床验证等将是行业持续增长的关键支撑。
总的来说,人们将逐渐理解“人类是超级生物体”(宿主+微生物)的概念,改变“杀菌至上”的传统健康观念。
精准菌群干预将推动医疗模式向预防化、个性化、数字化转型:
疾病管理:从“发病后治疗”转向“风险预测-早期干预”;
临床落地:推动菌群检测进入诊疗指南(如IBD、IBS的辅助诊断)。
治疗方案:从“通用型”升级为“动态定制型”,医疗资源从“中心化”向“分布式+远程化”重构;
最终,肠道菌群行业的目标是构建一个全面的“人体生态系统管理”体系,这一理念超越了单纯的疾病治疗,而是着眼于维护整个生态系统的平衡。未来十年,随着技术成熟和政策完善,肠道微生物组有望成为继基因组之后,精准医疗的第二大核心支柱。
在AI技术与肠道微生物研究的深度融合下,精准健康管理已从概念走向现实。通过此前的分析可以看到,肠道菌群检测正逐步渗透至疾病预防、临床诊断、母婴健康、老年抗衰等多元场景,而数据驱动的个性化干预将成为行业核心。
为赋能临床医疗、健康管理机构、检测机构等合作伙伴,谷禾推出 AI肠道菌群报告解读与咨询助手,就是下面这个小海豚:
AI报告解读助手将有助于合作方和客户更好的理解报告和应用肠道菌群检测。合作方可提升解读效率降低成本,定制精准营销策略,快速扩展菌群管理服务生态,构建差异化竞争力,实现用户健康改善与商业增长的双重目标。
谷禾健康
生物医学领域每天都在产生海量的研究文献,这些文献就像一座巨大的知识宝库,蕴含着推动医学进步的重要信息。传统上,科研人员需要通过人工阅读和整理这些文献,从中提取重要的生物医学信息,并将其汇总到专业数据库中(如KEGG和Reactome等知识库)。这些知识库就像是精心整理的图书馆,为生物学研究和临床医生的决策提供重要参考。
然而,随着科技发展,生物医学研究论文的数量呈现爆炸式增长。仅靠人工来阅读、筛选和整理这些文献已经变得异常困难,不仅耗时耗力,还需要投入大量人力和财力资源。这就像是要用手工方式来整理一个永远不停增长的图书馆,这项工作变得越来越具有挑战性。
值得欣喜的是,人工智能(AI)技术的快速发展为解决这一难题带来了曙光。现代AI技术,特别是自然语言处理和机器学习算法,可以像训练有素的助手一样,自动阅读和理解文献内容,快速识别关键信息,并将这些信息系统地整理归类。这不仅大大提高了文献知识管理的效率,还能帮助研究人员更好地发现和利用已有的研究成果,推动生物医学研究的创新和发展。
本文将分享人工智能,包括ChatGPT在检索生物医学知识,汇总和撰写文章、回答问题和模仿人类对话的能力的一些方法特点,并强调使用自动程序中管理生物医学实体和关系的巨大潜力,同时注意一些局限性。
基因、蛋白质和它们之间的关系在生物医学文献中有报道。基于AI的文本挖掘工具利用自然语言处理(NLP)来促进实体识别和关系提取。
AI技术在生物医学文献挖掘中的应用范围
doi.org/10.1515/mr-2023-0011
该图包括两个面板,展示了人工智能(AI)在文本挖掘(左侧)和图像理解(右侧)中的不同方向和应用。
命名实体识别
命名实体识别(Named Entity Recognition,NER)是自然语言处理的一个典型任务,它是从生物医学文献中标注和识别生物概念的名称,如蛋白质、基因、化合物、药物、疾病等。
◆ NER有助于从科学文章中提取关键的生物学概念,帮助建立生物本体和知识库
例如,给定句子“BRCA 1中的突变与乳腺癌和卵巢癌的风险增加有关”,NER工具可以将单词“BRCA 1”标记为基因,并将单词“乳腺癌”和“卵巢癌”标记为疾病。
◆ NER的一个主要瓶颈是,同一个生物医学实体可能会使用非标准的缩写和术语
例如,转录因子“C/EBP-β”也被称为“NF-IL6”;蛋白质“Arnt”有时被称为“HIF1-β”。
◆ 一些实体还嵌套其他实体
例如,蛋白质实体“丙氨酸氨基转移酶”含有化学实体“丙氨酸”。
为了解决上述挑战,可以使用生物医学实体链接(也称为实体规范化或实体接地)来将模糊实体映射到来自本体(诸如基因本体)的规范化的唯一标识符。
关系抽取
关系提取(RE)是建立在NER基础上的,它涉及识别先前发现的实体之间的关系。
关系提取专注于揭示连接,例如蛋白质-蛋白质相互作用、基因-疾病关联、基因型-表型关系、化学-蛋白质相互作用和药物-药物相互作用。
关系提取是通过在给定的句子中识别实体对和关系类型来制定的。
典型的文本挖掘技术
基于人工智能的NER方法可以:
学习上下文并对单词语义进行建模,以区分具有生物学意义的概念与其余单词
例如,PubTator被设计用于标记六种类型的生物学概念,包括基因/蛋白质,基因变体,疾病,化学物质,物种和其他生物学出版物的摘要或全文。
传统上,标记的生物实体可以通过执行模糊字符串匹配来映射到它们的标准形式。与此同时,最近的研究在神经网络构建的潜在空间(嵌入)中改进了这种映射。
其他一些基于AI的RE技术采用生物医学句子的上下文表示来检测生物医学实体关系。它们从语义和句法方面以及从多个角度提取和聚合句子的特征以识别关系。沿着这条路线,最近的研究将关系挖掘从句子级别移动到文档级别,以进一步丰富知识提取结果。
预训练模型
基于人工智能的文本挖掘通常依赖于通过自监督学习在大规模Web语料库上预训练模型的鲁棒语义表示。预训练的模型可以用相对较小的数据集针对特定任务进行进一步微调。一些著名的NLP模型包括BERT、T5和GPT。
► BioBERT 是一种广泛使用的特定于领域的语言表示模型,从通用BERT模型开始,在大规模生物医学语料库(PubMed摘要和PMC全文文章)上进行预训练。BioBERT能够扩展到生物医学NER,RE和问答(QA)。
●双向编码器表示:
BioBERT采用双向Transformer架构,利用注意力机制学习输入文本的上下文信息,从而生成高质量的语言表示。这种双向表示方式使得BioBERT在处理复杂的生物医学文本时表现优异,能够更好地理解单词在不同上下文中的含义。
●开放源代码:
项目完全开源,允许开发者和研究人员自由使用、修改和分发。
●预训练模型可用:
提供预训练模型,开发者可以直接用于下游任务,无需从头开始训练。
●易于集成:
兼容Hugging Face的transformers库,方便与其他自然语言处理工具包整合。
► PubMedBERT 是使用PubMed的摘要和PubMedCentral的全文文章从头开始进行预训练。
► SciFive 是一个在大型生物医学语料库上预训练的特定领域T5模型,用于文本理解任务(即,NER、RE和QA)和生物医学文本生成。
它在多种生物医学NLP任务上取得了出色的表现,特别是在问答任务上明显优于BERT系列模型。SciFive的预训练语料选择也具有灵活性,可以根据不同任务需求进行调整。
作为一个文本生成模型,SciFive还可以应用于更复杂的任务,如文档摘要和文章生成等,为生物医学领域的知识获取和内容创作提供支持。
► BioGPT 从头开始使用1500万个PubMed摘要预训练GPT-2模型,以生成生物医学术语的流畅描述。
它可以应用在哪些方面?
● 药物发现:
BioGPT击败了所有以前的语言模型,用于实体(药物,疾病和蛋白质)之间的关系提取。BioGPT可以帮助自动分析不断扩大的科学文献,更好地了解疾病机制并识别潜在药物靶点。
● 精准医疗:
它涉及根据个体患者的基因组成、生活方式和环境因素,为他们的特定需求量身定制医疗。BioGPT可以帮助研究人员从大型数据集中识别基因突变、疾病途径和其他相关信息,从而为患者制定个性化的治疗计划。
● 提高药物安全性:
BioGPT在预测药物相互作用方面击败了其他模型,可以帮助临床医生预测药物组合的潜在副作用并提高药物安全性。
● 临床试验设计和分析:
BioGPT可用于提取和分析临床试验数据,帮助研究人员设计更有效的试验,并更准确地分析试验结果。
●竞争对手分析:
BioGPT可用于分析科学文献和专利数据库,以识别潜在竞争对手并评估竞争格局。
● 科学交流:
BioGPT可用于生成科学文献和其他信息来源的摘要,使业务开发专业人员更容易快速理解和交流关键见解。帮助医疗保健专业人员跟上最新的研究和临床发现。
● 疾病诊断和管理:
BioGPT可用于分析患者数据、医疗记录和科学文献,以帮助更有效地诊断和管理疾病。
基于AI的生物医学文献挖掘方法
doi.org/10.1515/mr-2023-0011
除了文本,生物医学文献还以数字的形式包含有价值的知识。研究人员经常使用图表(例如生物学途径)来总结他们在出版物中关于导致生物过程或疾病的分子事件的发现。
基于人工智能的图像理解技术的进步提高了我们从路径图中提取实体和关系的能力,这些能力可用于补充从文本中提取的相同知识。
doi.org/10.1515/mr-2023-0011
从路径图中挖掘生物实体
早期基于AI的方法使用光学字符识别(OCR)技术提取生物医学实体,以从路径图中恢复基因名称。由于非标准缩写和术语的挑战,这种方法需要领域专家手动创建一些实体规范化规则来为基因名称提供基础。一项研究将这种方法应用于过去25年出版物中的通路图,并识别出通路数据库中缺失的数千个基因。
从路径图挖掘生物相互作用
Pathway Curator 旨在从途径图中提取分子实体及其相互作用。
管道集成了图像理解模型和图像处理策略,以捕获图中路径实体的位置,名称和相互作用。
管道可以使用符号识别基因,并使用箭头(用于上调)或T形条(用于抑制)识别基因关系。
技术特点:
输出展示:
实用优势:
Pathway Curator为生物文献挖掘中的文本挖掘提供了一种补充方法,并在多个出版物中全面了解疾病途径。方法可以扩展到其他RE任务的数字,如microRNA基因和化学蛋白质的相互作用。
尽管人工智能技术,特别是深度学习算法,已经显示出在自动程序中管理生物医学实体和关系的巨大能力,但人工智能技术的一些局限性仍然阻碍着人工文献管理的替代:
1)来自生物医学文献的有限注释数据。由于大量的出版物和使用的表达方式的多样性,为人工智能训练注释足够的生物医学概念和关系是具有挑战性的。在生物医学文献挖掘中,标记数据的数量和质量对AI模型的鲁棒性起着至关重要的作用。
2)当前人工智能从已建立的词汇表中发现对象的能力的局限性。目前,大多数人工智能方法都是建立在预定义的语料库或预先标记的数据集上。这种数据依赖性限制了AI技术挖掘词汇表之外对象的能力。
3)当前人工智能在处理文献不一致性方面的能力有限。生物医学文献包含过时或不正确的陈述,这可能会误导人工智能方法。
人工智能技术的快速发展,特别是深度学习方法,为管理生物医学知识创造了新的机会。OpenAI推出的基于人工智能的聊天机器人(ChatGPT)以其撰写文章、回答问题和模仿人类对话的能力给用户留下了深刻印象。
ChatGPT拥有全面的知识库,可根据用户的要求检索生物医学知识,为生物医学领域更高效、更准确的知识挖掘铺平道路。虽然ChatGPT目前经常提供不正确或不可复制的信息,但不断升级和更好的快速学习技术为更准确和可靠的生物医学知识挖掘提供了潜力。
ChatGPT还可以进行更多的训练/调整,以针对生物医学领域,特别是建立假设,寻找新的药物靶点,并生成新的小分子和抗体。它有望改变掌握知识和技能的方式,辅助医生进行临床决策,减少医疗差错。
几种新的人工智能方法具有很大的潜力,可以从文本和图形两种形式推进文献挖掘。主动学习允许使用新标记的数据迭代地训练模型,这为针对有限的注释数据逐步升级AI模型提供了机会。根据人类反馈的强化学习(RLHF)通过将预测与人类价值观和偏好对齐来增强人工智能算法的鲁棒性和通用性。通过整合人类反馈,RLHF可以提高AI预测的准确性和可靠性,超越注释数据的限制。
此外,针对多模态的对比学习(即文本和图像)使得能够学习相应文本和图像之间的公共(联合)语义表示,例如,一个基因名称’AKT’在文本和图像片段包含’AKT’更好的性能。此外,元学习和少量学习策略也有望将大规模通用语料库上的AI技术建模推广到生物医学特定领域。
在临床实践中,各种临床文件,如电子健康记录(EHR)和病理报告(PR),包含重要的生物医学和病理信息,这些信息可以从应用人工智能技术进行大规模管理中受益。一些研究已经为EHR 和PR开发了基于AI的挖掘工具,这些工具利用与文献挖掘中使用的技术类似的技术来识别诊断实体和非结构化文本和生物医学图像的关系。
整合生物医学文献和临床文档的挖掘结果可以促进临床研究和精准医学。这种方法为未来的医学研究和患者护理带来了巨大的希望。
生物医学文献的快速增长为生物医学知识挖掘带来了机遇和挑战。随着前沿人工智能技术在生物医学文献挖掘中的应用,生物医学研究和临床实践的相关注释、预测和知识库建设步伐将加快。
主要参考文献
He F, Liu K, Yang Z, Hannink M, Hammer RD, Popescu M, Xu D. Applications of cutting-edge artificial intelligence technologies in biomedical literature and document mining. Med Rev (2021). 2023 Jun 27;3(3):200-204.
da Silva, R.G.L. The advancement of artificial intelligence in biomedical research and health innovation: challenges and opportunities in emerging economies. Global Health 20, 44 (2024)
Hosseini, M., Hosseini, M. & Javidan, R. Leveraging Large Language Models for Clinical Abbreviation Disambiguation. J Med Syst 48, 27 (2024).
Luo R, Sun L, Xia Y, Qin T, Zhang S, Poon H, Liu TY. BioGPT: generative pre-trained transformer for biomedical text generation and mining. Brief Bioinform. 2022 Nov 19;23(6):bbac409.
谷禾健康
当地时间12月19日,微软联合创始人、亿万富翁比尔·盖茨发布了对来年的年度预测,称 2024 年将是一个“转折点”。
在这封长达 10 页的信中他展示了对人工智能领域的更多创新、婴儿营养不良问题的突破、气候变化谈判的进展等多方面的期待。
人工智能可以让世界变得更加公平。盖茨对人工智能的预测超越了去年的超声波预测,他断言人工智能的进步将广泛改善全球健康,同时促进创新。
人工智能可以帮助世界各地对抗抗生素耐药性疾病,识别高风险妊娠并估计孕龄等,他预计人工智能在开发新药、诊断疾病和增强教育资源方面将发挥至关重要的作用。
盖茨表示,世界在利用肠道微生物补充剂来解决儿童营养不良方面即将取得突破。
本文我们来看看盖茨眼中的儿童营养不良问题及解法,盖茨预计,随着对微生物组的深入研究,人们将能够开发出以微生物为基础的新型营养治疗方案,这将给解决全球儿童营养危机带来重要进展。
期待已久的营养不良问题的突破即将到来
在盖茨基金会,我们愿意下大赌注。我们知道每一次冒险都可能没有回报,但这没关系。我们的目标不仅仅是逐步取得进展。我们的目标是将我们的努力和资源投入到重大项目中,这些项目一旦成功,就能拯救和改善生命。
当你下一个大赌注时,你往往要等待很长时间才能看到它是否有回报。当你终于意识到它会成功时,那种感觉是难以置信的。我最兴奋的一次豪赌就接近了这一时刻:利用我们对肠道微生物群的了解来预防和治疗营养不良。
经常有人问我,如果只能解决一个问题,我会选择什么。我的答案不变:营养不良。这是世界上最严重的健康不平等现象,大约每四个儿童中就有一个受到影响。如果在生命的头两年得不到足够的营养,身体和智力都无法正常发育。通过解决营养不良问题,我们可以减少导致儿童死亡的最大因素之一。
营养不良的原因远比没有得到足够的食物要复杂得多。大约15年前,研究人员注意到脊髓灰质炎等口服儿童疫苗在营养不良率高的地区效果不佳,他们开始怀疑生活在肠道中的微生物群可能在其中发挥了作用。很明显,有什么东西妨碍了它们被正常吸收。
这种怀疑在2013年得到了证实,当时生物学家杰夫·戈登(Jeff Gordon)发表了一项有里程碑意义的研究,关于马拉维一对双胞胎婴儿的微生物群。微生物群不仅是健康的副产物,还是健康的决定因素。这是第一条重要线索,表明我们或许可以通过改变肠道微生物群来减少营养不良问题。
经常有人问我,如果只能解决一个问题,我会选择什么。我的答案不变:营养不良
在过去的十年里,我们对肠道微生物群的了解比之前的1000年还要多。我们发现,生活在肠道中的细菌可能处于功能失调状态,从而导致炎症,使人无法吸收营养。我们发现,如果及早干预,就能最大程度地改善肠道微生物群。
在人类发育过程中最先出现的肠道细菌之一叫做婴儿双歧杆菌。它能帮助将母乳中的糖分分解成人体生长所需的营养物质。反过来,母乳又为婴儿双歧杆菌和整个肠道微生物群提供食物。这是一个良性循环。但是,如果婴儿一开始没有足够的婴儿双歧杆菌,他们就可能无法从母乳中吸收足够的营养来支持其他必要的肠道细菌的生长。
要克服这种缺陷几乎是不可能的。你可以获得世界上所有富含营养的食物,但这并不管用。如果你的肠道生长路径过早被打乱,你可能永远无法吸收到所需的全部营养。
但是,如果我们能给高危婴儿服用婴儿双歧杆菌作为益生菌补充剂呢?我们能否及早干预,让他们正常发育?
这正是基金会合作伙伴多年来一直在研究的问题——我们终于找到了答案。我们正在对一种可添加到母乳中的婴儿双歧杆菌粉末补充剂进行三期临床。来自5个国家的16000名婴儿参与了试验,研究人员正在对每个婴儿进行跟踪,以确保益生菌既安全又有效。
目前的研究结果令人惊叹:通过给婴儿喂食这种益生菌,可以帮助他们的微生物群进入积极状态,从而使他们能够长大并充分发挥潜力。这对预防营养不良大有裨益。
在婴儿出生前就能改善肠道微生物群,这也让我感到兴奋。新的研究发现,婴儿的微生物群与母亲的微生物群息息相关。解决子宫内的炎症问题会给产妇、胎盘和发育中的胎儿带来更多益处。
如果我们能给准妈妈提供一种益生菌补充剂,让她的孩子从出生第一天起肠道就正常发育,那会怎么样呢?目前还不清楚这些活体生物药到底是什么样的,也不清楚如何给药,这还只是非常早期的研究。但研究表明,健康的微生物群可帮助婴儿在妊娠晚期每天增加5克体重。
在过去十年里,儿童健康领域发展速度超出了我一生中的预期。看到微生物群从一个完全看不见的东西变成解决世界上最大健康不平等之一的关键策略,真是令人惊叹。我迫不及待地期待在接下来一年里我们将学到多少新知识,以及我们将如何运用这些知识来拯救生命…
——比尔·盖茨
儿童营养不良问题的现状如何?带来什么问题?
儿童营养不良问题给全球健康带来巨大挑战,据世界卫生组织和联合国儿童基金会的数据统计,到 2020 年,估计有1.49亿 5岁以下儿童生长发育迟缓(年龄身高低),而 4500万儿童出现消瘦(WLZ 低)。
营养不良及其长期后遗症是该年龄段人群发病和死亡的主要原因。后遗症包括线性生长、免疫和代谢功能以及神经发育的持续损害——所有这些都对当前的干预措施有很大的抵抗力。
从比尔·盖茨的年度总结我们也可以看到,他十分重视肠道微生物对健康的影响,总的来说,微生物方面的研究给儿童健康带来了很大希望。
从肠道微生物组的角度入手,对营养不良儿童进行基于微生物群的相关干预措施,比尔及梅琳达·盖茨基金会已支持多项相关研究。我们来看近期得到该基金会支持的两篇研究文献。
在健康儿童中,肠道微生物组在分类和功能多样性方面稳步增长,直到3岁,其中最明显的变化发生在断奶期间。相比之下,营养不良儿童的肠道微生物组是年龄倒退的,即肠道微生物组与年幼儿童相似。
抗生素是严重急性营养不良的标准治疗方法,因为即使儿童没有出现明显的疾病,他们也可能因急性感染而突然恶化。
在马拉维和尼日尔,与安慰剂相比,短期(即7天)阿莫西林给药已被证明在降低全因死亡率、住院率、腹泻病和改善人体测量方面具有益处。
然而,抗生素治疗对严重急性营养不良儿童的潜在后果(如抗生素耐药性的发展和微生物组破坏)仍存在不确定性。
研究设计
研究人员想要确定 7 天的阿莫西林治疗,对接受严重急性营养不良治疗的儿童肠道微生物组和抗生素耐药组的急性和长期变化的影响。该成果发表在《Lancet Microbe》。
研究人员对尼日尔门诊治疗的严重急性营养不良儿童(6-59 个月)的阿莫西林随机、双盲、安慰剂对照试验 (NCT01613547) 进行了二次分析。从2013年9月23日至2014年2月3日从整个队列中随机选择了161名儿童(n = 2399)进行最初12周的随访。
根据人体测量结果从这161名儿童中选择了一个方便样本,2年后(2015年9月28日至10月27日)进行随访。儿童在基线、第 1 周、第 4 周、第 8 周、第 12 周以及 2 年随访队列中的第 104 周提供了粪便样本。研究人员进行了宏基因组测序,然后对粪便样本进行了微生物组和耐药组分析。38 名无严重急性营养不良的儿童和 6 名与原始队列基线年龄相匹配的严重急性营养不良儿童被用作参考对照。
研究结果
结果表明,营养不良的尼日尔儿童在接受抗生素治疗后,虽然发现克雷伯氏菌属、埃希氏菌属等增加,这些菌可能与更严重的感染相关,但是,微生物组和耐药组扰动的负面影响似乎是短暂的,在三周内完全消失。
进一步观察到阿莫西林治疗的一些意想不到的长期益处,包括改善长期微生物组丰富度,多样性和成熟度。
阿莫西林对长期微生物组成熟的影响
doi.org/10.1016/S2666-5247(23)00213-6
生命头三年肠道微生物组急剧成熟的一些关键驱动因素包括婴儿在出生期间和出生后接触母体微生物、加入牛奶、奶粉以及向固体食物的过渡。在营养不良的儿童中,肠道微生物组的成熟过程和生长都受到阻碍。但在治疗计划中加入抗生素改善了他们的身体测量和微生物组发育。
抗生素可能起到重置的作用,使有助于固体食物消化的微生物群在肠道生态系统中繁衍生息。
“
接受抗生素治疗的效果,对严重营养不良儿童来说算是个好消息,对于这一特定人群,抗生素治疗的益处似乎大于风险,但风险确实存在。研究人员警告说,儿童中已知的耐药细菌和耐药基因的增加不应被忽视。
营养干预措施,如即食治疗性食品,已被证明可以暂时改善肠道微生物组的成熟度和人体测量得分;然而,这种改善并不总是持续的。
在过去的5年里,合理设计的以微生物群为导向的治疗性食品在中度和重度急性营养不良儿童的微生物组恢复和人体测量得分方面显示出了希望。
接下来我们来看对于微生物群为导向的治疗性食品研究的最新进展。
生命头两年,肠道微生物群的发育需要与身体其他部分、其他器官系统的发育同步。当这个微生物群不完全形成时,仅仅增加热量是无法修复的。研究人员试图寻找特定的食物成分,以滋养健康的肠道微生物群,希望修复营养不良儿童肠道微生物群的功能失调。
使用传统食疗食品治疗可减少死亡,但并不能实质性改善营养不良的其他长期影响,包括新陈代谢、骨骼生长、免疫功能和大脑发育问题。
近日,来自华盛顿大学医学院的一项研究,已经确定了一种新型治疗食品中天然存在的关键生化成分,以及处理这些成分的重要细菌菌株。
该研究表明,识别这些成分以及作为其治疗靶标的关键促生长肠道细菌菌株,研究强调了了解细菌菌株如何加工特定食物成分的重要性,可以帮助指导当前食品配方的治疗,并可以在未来创造新的、更有效的配方。该研究成果于2023年12月13日发表在《Nature》杂志。
研究人员从试验参与者的粪便微生物群中重建了1000个细菌基因组(宏基因组组装基因组,简称MAG),确定了75个丰度与体重生长(体重长度Z评分变化,简称WLZ)正相关的MAGs。将MAG基因表达的变化表征为治疗类型和WLZ反应的函数,并定量MDCF-2和粪便中的碳水化合物结构。
结果表明,两个与WLZ呈正相关的普雷沃氏菌MAG是MDCF-2诱导的代谢途径表达的主要贡献者,这些代谢途径涉及利用MDCF-2的组分聚糖。
结果强调了微生物组反应的显著菌株特异性,并指出两种普氏菌菌株(MAG Bg0018 和 MAG Bg0019)是 MDCF-2 聚糖代谢和宿主体重生长反应的关键介质。
在生长相关细菌分类群代谢的MDCF中鉴定生物活性聚糖结构,有助于指导关于其在急性营养不良儿童中使用的建议,并有助于开发其他制剂。
在这项工作的基础上,世界卫生组织与比尔及梅琳达·盖茨基金会正在支持一项大型多站点临床试验,研究这种新的治疗性食品——MDCF-2,或微生物组导向的补充食品。
MDCF-2 治疗性食品包括哪些食物成分?
在 2021 年的临床试验中,MDCF-2 治疗性食品作为膳食补充剂提供,以提供儿童每日能量需求的约 20%。
Prevotella copri 两个菌株对MDCF-2干预改善营养不良的关键作用
研究人员发现:普雷沃氏菌Prevotella copri与儿童的生长发育呈正相关。
P. copri是拟杆菌门的成员,该门的成员含有一组叫多糖利用基因座(PUL)的基因,这些基因介导特定聚糖或一组聚糖的检测、导入和代谢。
它们在利用MDCF-2治疗食品中有益的生物活性碳水化合物结构的代谢途径中表现出活性的增加。
与接受传统治疗性食物的儿童相比,接受MDCF-2的儿童血液中支持肌肉骨骼生长和神经发育的某些蛋白质水平较高,与炎症有关的蛋白质水平较低。也表明,微生物群修复的作用远不止于肠道。
研究人员对这些儿童的粪便样本进行了广泛的基因组分析,了解对这些食物成分有反应的细菌,以及这些细菌对治疗的反应所具有和表达的代谢能力。事实证明,许多与儿童生长密切相关的细菌富含碳水化合物代谢的途径。
分析不同食物中的关键有效成分
在该研究中,通过质谱分析MDCF-2和RUSF两类食品,确定其组成成分。
MDCF-2、RUSF 及其食品成分中的多糖
DOI: 10.1038/s41586-023-06838-3
对这些食物详细分析表明,MDCF-2食物中L-阿拉伯糖、D-木糖、L-岩藻糖、D-甘露糖和D-半乳糖醛酸 (GalA) 显著更丰富(P < 0.05)。
也就是说,MDCF-2含有更多的多糖,即半乳聚糖和甘露聚糖。而传统的治疗性食物RUSF含有更多的淀粉和纤维素。
MDCF-2 有效提高营养不良儿童生长
尽管MDCF-2的热量密度比高热量食物低15%,但与接受传统补充食物的儿童相比,接受MDCF-2治疗的儿童表现出更高的生长速度。
与MDCF-2治疗相关的生长增加与儿童微生物群中某些普氏菌菌株中存在的代谢途径的表达增加有关,这些途径与生物体利用MDCF-2中存在的多糖有关。
“来自食物频率问卷的信息表明,对MDCF-2反应最大的儿童也食用了更多的坚果和豆类作为他们日常饮食的一部分” ,研究人员表示,“这些坚果和豆类具有一些与MDCF-2相同的多糖。这表明可能有机会调整MDCF-2的成分和剂量,以进一步增强其治疗效果”。
营养不良儿童“微生物组修复”的一个定义是,重新平衡有益菌的表现和表达功能,使其呈现出更有利于健康微生物组-宿主共同发育的构型。
以这种方式将膳食聚糖和微生物代谢联系起来,为基于培养的计划提供了一个起点,这些计划旨在检索这些“效应”类群的分离物,用作潜在的益生菌制剂,或者如果与他们渴望的关键营养素相结合,修复对单独基于食物的干预反应不足紊乱的微生物群,提供合生元配方。
当然,P.copri菌株和MDCF-2聚糖之间的关系并不排除其他宏量或微量营养素对MDCF-2在增重方面优于RUSF的贡献。
总之,为改善微生物群的营养干预提供了一种新的见解。
这些和其他研究的结果有助于加深我们对微生物如何与人类细胞和器官合作,从而影响发育生物学的理解,帮助相关产业科研人员开发微生物组导向疗法的方法,帮助开发构建儿童营养健康的新策略,以确保在出生后的头几年形成健康的微生物组,尽可能规避儿童营养不良风险。
同时,随着人工智能技术及高通量测序等先进技术的不断发展,整合食物-微生物-人体交互作用研究,通过对婴幼儿的肠道菌群进行定期检测,可以帮助家长更好地监测儿童肠道菌群的变化,及时发现异常,采取相应的纠正措施,有利于促进儿童的身心健康发育。