南京中医药大学・中医药文献研究院
站内搜索 Search
友情链接 Friend link
当前位置: 首页  成果展示  学术成果
中药功效数据集市的多维分析和数据挖掘研究
作者/来源:曹宜 杭爱武 虞舜     2015-03-05



摘要:为获得中药功效和相关研究文献中的显性和隐性的知识,本文提出建设综合中药功效、植物学分类、化学成分、现代药理作用和临床应用方面相关数据的中药功效数据集市。然后建立同一功效的数据立方体,利用多维数据分析和关联数据挖掘方法,剖析相关数据特征,发掘中药功效与植物学分类、化学成分、药理作用之间的潜在联系,探寻中药功效的实质。

关键词:中药功效;数据集市;多维分析;数据挖掘



中药功效是在中医药理论指导下的药物治疗作用的概括,是临床用药的重要依据。历代临床实践积累了许多中药功效方面的文献资料。随着中医药的不断发展,国内外出现了大量的药用植物基原、中药有效成分、药理作用以及现代临床疗效方面的研究资料。在这些中药传统知识和中药现代研究结果之间存在着千丝万缕的联系,这些联系既包括通过常规检索可得到的显性的联系或知识,也包括那些常规检索得不到的隐性的联系或知识。为了更加有效地获得这些中药相关研究文献中的显性和隐性的联系或知识,本文提出建设中药功效数据集市,分析与提取功效相关数据背后潜在的知识或规律,以便阐释该功效的实质与内涵。

1 研究的理论依据

中药功效与中药化学成分、基原(植物学分类)、药理作用及现代临床疗效之间存在着一定的联系。中药药理作用、现代临床疗效是功效在现代实验条件下和现代医疗实践中的表现;化学成分是中药功效、药理作用和现代临床疗效表达的物质基础。因此,功效相同或相近的中药,所含的化学成分有可能结构相似,现代药理作用和临床疗效也较接近。另一方面,根据药用植物亲缘学说,亲缘相近的植物不仅在形态上相似,生理生化特性亦相似,含有的作为植物次生代谢产物的化学成分也比较相似,从而使亲缘相近的植物的生物活性和疗效相似;同样,具有相似的疗效的植物,其系统学上就有可能具有相近的亲缘关系[1]。中药功效与成分、植物学分类、药理作用和现代临床疗效之间的潜在联系为开展中药功效数据集市的多维分析和数据挖掘研究提供了理论基础。

2 研究思路与方法

本文提出建设基于多维数据模型的中药功效数据集市。该数据集市围绕中药功效,收集了中药化学成分、植物学分类、现代药理作用等相关资料的信息。然后可以获得关于某一功效的数据立方体,在此基础上,利用融合数据库、人工智能、统计学等多学科技术的多维数据分析和数据挖掘方法,研究与某一功效相关的植物学分类、化学成分、药理作用、临床作用的数据的特征,发掘该中药功效与植物学分类、化学成分、药理作用、临床作用等信息单元数据之间隐含的关系。

2.1 建立中药功效数据集市

为满足进行功效相关数据分析、挖掘的需要,首先要把来自不同数据源的中药相关数据转化成统一明确的中药功效信息集合。数据集市是小型的部门或工作组级别的数据仓库。数据集市中的数据具有数据仓库中数据的特点,只不过数据集市中的数据是专为某一部门或某个特定需求所定制的。与中药功效的实质研究相关的数据主要包括中药功效、植物学分类、化学成分、药理和临床作用方面的资料,通常不涉及栽培、采收加工、药材鉴别等方面的信息,同时这样的中药信息集合又专门是为研究中药功效的实质而定制的,因此选择建立中药功效数据集市。中药功效数据集市的建立可采用维度建模方法。维度(Dimension)是观察实体的角度,是一种高层次的类型划分[2]。中药功效数据集市的维度包括中药植物学分类维、化学维、药理维和临床维。这四个维度又分别划分为不同层次,例如如植物学分类维可划分为纲、目、科、属、5个层次。

2.2 中药功效数据集市的多维分析

由于中药功效的数据分析和挖掘研究主要是针对同一功效进行的,因此在进行研究前,需要对中药功效数据集市中的功效术语进行统一和规范,明确某一功效的概念与范畴。另外,由于研究内容主要是功效与植物学分类等的联系,所以研究前也应剔除动物类中药数据。

在中药功效数据集市中,可建立以某一功效为核心的数据立方体,此中药功效立方体包括植物学分类维、化学维、药理维和临床维(见图1)。在数据立方体上,能从功效-植物学分类、功效-化学成分、功效-药理作用、功效-现代临床应用这些不同角度来观察中药数据,分析同一功效的药用植物的分类情况、同一功效植物所含化学成分情况、同一功效植物的药理作用、现代临床应用情况。通过功效数据立方体的钻取、切片(Slice)和切块(Dice)以及旋转(Pivot)等分析动作,可在不同的汇总级别多层次观察中药数据,其中钻取是改变维的层次,变换分析的粒度,包括向下钻取(Drill-down)和向上钻取(Drill-up/上卷(Roll-up)[2]。向下钻取是在某一维上将低层次的细节数据概括到高层次的汇总数据,或者减少维数;而向上钻取则相反,它从汇总数据深入到细节数据进行观察或增加新维。例如利用向下钻取(Drill-down),从了解具有某功效的植物在门、纲、目这样的层次(级别)中的分布情况逐步深入到具有某功效的植物在科、属级别中的分布情况;从了解与某功效相关的中药成分大类的分布情况逐步深入到与某功效相关的化学成分母体结构、药效团、取代基等的分布情况。在中药功效数据集市中,还可以进行旋转(Pivot)分析操作。旋转(Pivot)是变换维的方向。例如从围绕功效改变为围绕植物学分类,寻找植物类群的特征性化学成分、同一科属植物的共同功效或药理作用等。

1   某一功效的数据立方体

              Fig.1 Data cube  about one traditional efficacy

2.3 中药功效数据集市的关联规则挖掘

一味中药常具有多种功效,含有多种类型的化学成分,然后通过多靶点、多环节而发挥作用。因此中药功效与化学成分、药理作用等的联系是互相交织、错综复杂的。多维分析方法无法完全满足找出这种潜在联系的需求,所以有必要进一步采用数据挖掘方法,进行更深层次的分析。

数据挖掘是从大量的,不完全的,有噪声的,模糊的,随机的数据中,提取隐含在其中的,人们事先不知道的,但又是潜在的有用的信息和知识的过程。按照数据挖掘功能,数据挖掘可划分为:概念/类描述、关联分析、分类和预测、聚类、离群数据挖掘、趋势和演化分析等[3]。关联分析是寻找数据库中不同数据项之间存在的关系,即隐藏在数据间的关联或相互关系。中药功效数据集市中,主要采用关联分析方法,发现同一功效下频繁同时出现的两种(或两种以上)的成分、药理作用等。考虑到中药化学、药理与临床应用数据,特别是化学成分变化较大,数据分散性强,不一定能在最细节的层次上发现一些强关联规则。可以采用多层关联挖掘算法,结合多维关联挖掘算法,通过在多维分析中构建的中药功效数据立方体的概念层次,在较高的抽象层上进行关联规则挖掘,这样容易获得感兴趣的规律或联系。例如泻下功效研究中,假如在大黄素、大黄酸、大黄酚、芦荟大黄素与植物纤维素、甲基纤维素这些化学成分之间进行关联规则的挖掘,由于成分种类较多,数据分散而稀少,可能无法获得满足最小置信度(confidence)和最小支持度(support)的规则。这时可以考虑抽象到较高层次上挖掘,大黄素、大黄酸、大黄酚、芦荟大黄素属于蒽醌类,植物纤维素、甲基纤维素属于纤维素类,这样就有可能获得“蒽醌类=>维素类之类的规则,提示泻下功效有可能是蒽醌类与纤维素类成分共同作用的结果。

3结语

早在二十世纪八十年代,肖培根院士曾通过对大黄属7个组27种植物的综合研究,探讨了大黄属的植物亲缘关系、化学成分和疗效间的关系[4]。随着现代信息技术的发展,中科院过程工程研究所陆爱军等开展了在中药化学数据库中的关联规则的挖掘,主要获得若干中药药效一植物科属分类这样的维间关联规则[5]。刘海波等通过对“止痛”、“泻下”和“清热”共有化合物现代药理的分析,在一定程度上证明了共有化合物现代药理活性与所属中药药效类别有很强的联系[6]。刘海波等还通过统计方法得到泻下与导泄、兴奋胃肠平滑肌、止血和利尿的药理活性相关;解表与抗凝血/抗血栓、止痛、解热药理作用相关[7]

在以往中药数据库中的知识发现工作基础上,本文提出建设中药功效数据集市,充分利用传统医疗实践经验,研究在同一功效下,植物学分类、化学成分、药理作用、现代临床应用这些相关数据表现出的特征,发掘相关数据背后潜在的知识、规律或高层信息,从而针对某一功效,多角度、多层次地诠释其内涵。通过本研究,能够探讨中药功效(传统治疗作用)与现代植物分类学之间联系,如具有某功效的植物经常属于哪些科属,这样有利于在近缘类群中扩大和寻找新的药用资源等;还可以揭示与某功效对应的生物活性物质的分布规律、功效与中药化学成分或化学结构的潜在联系,如分析同一功效植物中会经常出现哪些化学成分或哪些母体、取代基等结构,有助于获得有效组分或新的先导化合物,诠释功效对应的活性物质基础;另外,通过本研究也可以发现和验证功效与现代药理作用、临床治疗作用之间的相关性,扩大和充实中药的临床适应证,有助于理解中药功效的现代意义。因此,开展中药功效相关数据的多维分析和数据挖掘研究,能有效促进中医药现代化研究。



参考文献:

[1]陈四保,彭勇,陈士林,.药用植物亲缘学[J].世界科学技术-中医药现代化,2005, 7(6): 97.

[2]孙泳,刘少辉,史忠植.数据仓库中多维分析的数据展现[J].计算机工程与应用,2004,(4),174-177.

[3]()Han J,Kamber M.数据挖掘:概念与技术(M). 范明,孟小峰,.2.北京:机械工业出版社,2007.

[4]肖培根,陈碧珠,王立为,.大黄属的植物亲缘关系、化学成分与疗效间联系性的初步研究[J].药学学报,1980,15(1) :33-39.

[5]陆爱军,刘冰,刘海波,.中药化学数据库关联规则的挖掘[J].计算机与应用化学,2005,22(2):108-112.

[6]刘海波,陆爱军,刘冰,.通过共有化合物建立中药药效和现代药理间的联系[J].中国中药杂志,2005,30(1):75-78.

[7]刘海波,乔颖欣,周家驹.泻下药和解表药的现代药理解释[J].中国药学杂志,2007,42(6):422-426.

(原载:《中草药》2010年第41卷第12)














版权所有:南京中医药大学 中医药文献研究院
地址:南京仙林大学城仙林大道138号 邮编:210023 电话:(025)85811753 传真:(025)85811753
工信部备案号:苏ICP备11032525号