谷禾健康
传统中医在数千年的疾病预防和治疗中,融合了临床实践经验和理论,视人体为复杂系统,以整体观和辨证施治为特征。目前中医面临的主要挑战包括揭示人体复杂系统的生物学基础,阐明中医术语及其关系,并根据中医理论推动精准医学的发展。
随着生物信息学、系统生物学和计算生物学等跨学科领域的兴起,现代医学的研究范式已从“还原论”转向“整体论”,诊断和治疗策略也从“单病、单靶点和单药物”转为“多靶点和系统调控”,强调系统生物学在分析复杂疾病机制中的重要性。
中医网络药理学(TCM-NP)在这一背景下产生,是传统与现代医学、信息科学和系统科学的跨界创新成果,其特征与中医整体观和辨证施治原则高度一致,已经成为传统医学研究的前沿和热点领域。
近期发表在《Briefings in Bioinformatics》上的一篇文章,详述了中医网络药理学(TCM-NP)的发展及其在人工智能(AI)术下的应用。TCM-NP作为一种新兴的跨学科领域,结合AI方法和多组学数据,提供了理解传统医学的新视角。
文章将涉及的AI方法框架分为三部分:网络关系挖掘(Network relationship mining)、网络靶点定位(Network target positioning)和网络靶点导航(Network target navigating),并介绍了它们在揭示中医寒/热综合征的生物学基础和临床价值方面的应用。
通过网络拓扑分析,研究揭示了不同中草药在寒/热综合征相关网络模块中的分布模式,指导了中医方剂的精准使用。此外,文章强调了开发深度可解释网络关系推理框架的重要性,以提高模型的可解释性和特征学习能力。
方法框架
doi: 10.1093/bib/bbad518.
图中展示了中医网络药理学(TCM-NP)的网络靶点概念及其关键方法框架。中药/复方与中医证候/疾病的关系体现在中药/复方对疾病相关分子网络模块的调控作用上。
从方法论角度看,基于人工智能的潜在网络靶点识别可分为“网络关系挖掘”、“网络靶点定位”和“网络靶点导航”三个方面。
接下来将概述TCM-NP中涉及的基于AI的方法的进展,下表是TCM-NP涉及的代表性AI算法/数据资源。
TCM-NP涉及的代表性AI算法/数据资源
doi: 10.1093/bib/bbad518.
doi: 10.1093/bib/bbad518.
图中展示了网络关系挖掘框架,从已有的知识、文献和组学数据中挖掘表型、细胞、分子和药物之间的网络关系。这些方法可分为单层和多层网络构建,用于揭示不同生物层次间的互联关系。
▷ 从已有的知识挖掘网络关系
从先验知识中挖掘网络关系,这些关系主要涉及疾病/证候层面、生物分子层面和药物/方剂层面。
在药物/方剂层面,主要运用自然语言处理技术从已有知识中挖掘与疾病/证候相关的临床症状关系,通过中医临床诊断治疗理论,不仅可以通过挖掘临床表型条目推断临床症状的相似性,还可以推断证候与表型之间的关系。
药物/方剂层面的成分结构相似性关系主要从PubChem、ChEMBL、CDCDB和DrugCombDB等数据库中挖掘,方剂中草药及其属性关系则从ETCM、HERB和TCMBank等数据库中获取。在分子层面,蛋白质相互作用(PPI)、信号和转录调控关系主要从STRING、KEGG和BioGRID等数据库挖掘。
中医“辨证施治”理论根据患者不同的证候和表型特征提供治疗方案,因此存在证候/表型与草药/方剂疗效之间的关系,如从SymMap数据库或文献共现分析中挖掘。
值得关注的是宏观和微观对象之间的关系,包括从HIT、TCMGeneDIT、DrugCentral和DrugBank等数据库中挖掘的化合物或天然产物与其相关的分子靶点之间的关系。这些从文献或公共数据库中挖掘的网络关系为从系统角度理解中医提供了生物学基础,并为运用AI方法开展深入的方法论分析奠定了数据基础。
▷ 从组学数据中挖掘网络关系
从组学数据中挖掘网络关系,以转录组学为例,挖掘潜在关系的常见方法是使用经典机器学习算法,如统计分析或回归,构建共表达网络。
例如,有研究者应用基于机器学习(ML)的策略,结合基因共表达模式和网络拓扑特征,构建了寒热证候的分子网络,并识别出一系列证候相关的生物标志物。
▷ 网络关系分析与表达
对多层网络关系的分析也推动网络关系的挖掘。在疾病/证候相关的网络关系分析中,不同表型组成的网络模块的相似性被评估,以研究相同疾病下不同证候或相同证候下不同疾病的界限,例如表型层级与疾病/证候层级之间的关系。
临床表型网络(CPN),研究证候的交叉边界和症状的共现。在草药/方剂相关的网络关系分析中,可通过整合草药靶点关系评估相同方剂内不同草药网络模块的相似性,也可以评估方剂和其临床干预证候的网络模块的相似性。
此外,对疾病/证候和草药/方剂的网络分析表明,多层级的网络节点具有模块化特征,且不同层级的网络模块之间存在类似关系。这一规律为“网络靶点”理论提供了重要启示,也是中医网络药理学方法学发展的基础。
doi: 10.1093/bib/bbad518.
该图展示了网络靶点分析框架,主要涉及使用经典的机器学习方法和基于深度学习的方法,对包括表型、细胞、分子和药物在内的多层生物网络进行解剖,以实现网络靶点的定位和导航分析。
▷ 解决疾病/综合征相关基因预测问题
主要解决两个问题。第一个问题是基于AI的网络分析模型解决中医证候的基因预测问题,证候可以视作个性化的临床表型特征,对个性化临床表型相关基因的预测是实现个性化诊断和治疗的重要途径。
基于生物网络的表型/证候相关基因预测算法核心思想是利用“多层模块关系”法则,基于网络拓扑特征进行预测。传统的机器学习方法,如回归和随机游走(RW),最先应用于表型/证候的基因预测。CPHER算法是具有代表性的算法之一,提供了宏观和微观生物网络相关AI算法研究的范例,并成功应用于复杂疾病的机制分析。
以CIPHER算法为灵感,一系列基于网络的证候相关表型或临床相关症状的基因预测算法被提出,例如PTsGene结合中医临床表型与实验结果建立了中医症状-基因数据库,实现了高精度的疾病-证候基因预测。
近年来,随着GNN学习算法的提出,将表型-分子网络视为复杂图结构进行学习和推断已成为热门,并取得了优异表现。例如,CIPHER-SC融合单细胞信息建立多层生物网络,通过图卷积神经网络实现疾病基因预测。
▷ 解决中草药化合物的靶点预测问题
第二个问题是解决中草药化合物的靶点预测问题,提高预测准确性。类似于疾病/证候的基因预测,准确预测草药/方剂及其化合物相关靶点也是揭示中药药理学的前提。
DrugCIPHER药物-靶点预测算法是一个代表性算法,通过基于网络的回归分析实现了化合物相关靶点的高精度预测。与传统机器学习方法相比,深度学习模型能够整合大量异质信息,如药物相似结构、疾病治疗信息和药物活性,从而进行更复杂的药物-靶点预测任务。
中医药有“多成分、多靶点和系统调节”的显著特点。解读中医生物学基础的另一关键挑战是从生物网络的角度理解各种中医术语之间的关系,即网络靶点导航,包括疾病-证候关系、草药/方剂-疾病关系、方剂的配伍及其成分的协同作用。
▷ 疾病-证候关系
关于疾病-证候关系,表型和证候都是对复杂人体的临床描述。从宏观角度,通过分析疾病相关表型与证候相关临床特征的网络拓扑相似性,可以揭示疾病与证候之间的关系。
例如临床表型网络(CPN),为个性化的中医诊断和治疗提供了基础。从微观角度,可以通过基于疾病表型和证候特征进行基因预测或组学数据分析,然后构建相似性度量和相关分析,来实现疾病诊断与证候辨别的整合。
例如,挖掘寒热证候与神经-内分泌-免疫(NEI)生物网络之间的关系,分析脾虚证候的生物学基础及其与消化系统疾病的关系,分析冠心病(CHD)中PBS证候的生物学基础并建立诊断标志物,以实现“同病异治”。
▷ 草药/配方—疾病关系
关于草药/方剂-疾病关系,主要指在特定疾病或证候上下文中,基于网络的草药/方剂精准推荐。通常,基于AI的方剂推荐方法通过先验知识中的宏观信息推断草药/方剂模块与特定症状/证候之间的关系。随着多组学和微观层次网络分析的积累,通过整合草药/方剂-靶点网络与疾病/证候-基因网络,可以作出更精准的推荐。例如智能方剂推荐系统FordNet整合多层信息,是宏观和微观信息结合的代表性工作。
此外,通过草药/方剂-靶点网络与疾病/证候-基因网络的模块间关联分析,还可以发现中药方剂的新适应症。例如,利用基于网络药理学的方法研究能与多个靶点结合良好的中药候选物,并成功找到治疗阿尔茨海默病的最佳中药方剂。
▷ 草药/方剂相关成分的药理作用
通过挖掘草药/方剂中多成分的作用机制,以及应用AI方法挖掘方剂的配伍规律,实现了对草药/方剂模块间草药-草药关系的分析。
中药方剂相关作用机制(MoA)的研究框架包括:识别中药方剂中的活性成分;构建中药方剂所干预的疾病/证候网络;基于疾病/证候相关网络发现中药方剂活性成分的网络靶点。
目前,该框架已广泛应用于多种方剂的作用机制分析。通过识别草药-草药关系进一步建立方剂的关联规则,探索方剂的配伍规律。研究者建立了一个基于距离的互信息模型(DMIM)来测量草药之间的相互作用,构建了草药网络,从而识别出许多方剂中草药之间的有用关系。
doi: 10.1093/bib/bbad518.
图中展示了在中医网络药理学中,寒热证候及其草药的构建、分析和应用,通过收集和解析与寒热证候相关的多组学数据,首次构建了寒热证候相关的分子网络,以促进胃病的精准诊断和治疗。
▷ 通过中医网络药理学揭示寒热证候的生物基础
在寒热证候的模型中,以患者的一系列临床特征为特征,揭示证候相关的生物基础涉及理解与宏观临床特征相关的微观生物分子。
早在2007年,研究人员首次利用文献挖掘和网络拓扑分析方法在NEI系统背景下构建了寒热证候的分子网络。研究表明,寒证相关的子网络主要由激素相关因素组成,而热证相关的子网络则以免疫相关因素为主,这两个网络通过神经递质相连。
该研究开创了运用中医网络药理学方法揭示中医证候生物基础的先例。随后,研究人员通过结合CIPHER网络靶点定位算法和寒热证候相关的转录组学数据,揭示寒热证候涉及代谢-免疫调节的不平衡网络,并识别出证候相关的生物标志物,包括寒证相关的LEP和NOS1以及热证相关的CCL2。这些发现表明,可以通过中医网络药理学方法论来解决寒热证候的生物基础问题。
▷ 指导中药方剂的精准使用
另一方面,通过网络靶点导航分析,即分析寒热证候相关分子网络与寒热草药靶点网络之间的拓扑关系,揭示不同寒热草药的作用机制,指导中药方剂的精准使用。
通过网络拓扑分析发现,寒证相关草药往往富集于热证相关网络模块,而热证相关草药则富集于寒证相关网络模块,这种分布模式与中医“温寒凉热”的原则一致。
此外,将网络分析与实验验证相结合,还可以揭示方剂的药理机制,指导患者的个性化治疗。例如,基于胃炎寒热证候相关生物网络,研究团队揭示了治疗胃炎的两种代表性中药方剂——胃复春(WFC)和墨洛丹(MLD)的不同作用机制,其中WFC侧重于调节炎症路径,而MLD则侧重于抑制脂肪酸代谢,这将有助于临床实践中胃炎的精准治疗。
综上所述,多模态数据与AI技术的整合是网络药理学方法中的重要研究方向和热点。基于AI的网络整合分析主要包括三个方面:多组学数据的整合、组学数据与先验知识的整合以及多源异构生物网络的整合。
第一方面主要涉及使用生物网络数学表示组学数据中的多层次信息,如细胞-细胞、细胞-分子和分子-分子关系。未来,随着多组学数据的积累,预计会出现与中医相关的整合算法。
第二方面,基于网络的先验知识与组学数据整合对于减少噪声和有限样本的影响至关重要,贝叶斯网络是常用的AI模型,将知识派生关系视为先验分布,组学派生关系视为后验分布。近年来,几种深度学习模型,包括迁移学习,被用于整合先验知识和组学数据之间的关系。
第三方面,尽管不同生物网络可能代表异构信息,但它们可以建模为邻接矩阵,从而在统一的AI算法下进行整合,这为从网络药理学角度整合异构生物网络提供了可能性。
参考文献
Zhang P, Zhang D, Zhou W, Wang L, Wang B, Zhang T, Li S. Network pharmacology: towards the artificial intelligence-based precision traditional Chinese medicine. Brief Bioinform. 2023 Nov 22;25(1):bba