TCMKB - 中医药知识服务平台

 

中医药本体工程

于彤 编写
(yutongoralce@hotmail.com)


中医药学历经数千年的发展,形成了一套完整的知识体系。 中医药信息学的一个核心任务,是实现中医药知识体系的数字化,从而面向中医团体提供准确、详实的知识服务。 中医药知识资源具有鲜明的中国文化特征,包含大量古汉语成分,难于精确描述。 在西医中所使用的知识建模方法并不完全适合于中医药领域。 中医团体迫切需要提出创新的知识建模方法,以支持中医药知识的数字化建设。 本体是一种用于表示领域知识的计算机模型,它被定义为“某一概念化的显性规范”。 本体技术已被引入中医药的诸多领域,在知识建模和获取中发挥了重要作用。 在下文中,介绍中医药本体工程的方法、技术、覆盖范围和应用情况,以供中医药本体开发人员参考。


本体技术及其应用


在全球化的背景下,人们对跨组织、跨地区、跨领域的交流与合作产生了日益强烈的需求。 众所周知,互联网为全球通信提供了基础性的平台,大大促进了知识与信息的跨域共享。 然而,不同的人员、组织和软件系统之间,在语言、工具和技术等方面存在着各种差异,这为有效通信设置了重重障碍。 信息学家认识到,需要建立标准化的知识表示模型,以解决系统之间的互操作问题,提升跨域通信能力。

本体是针对领域概念体系的精确规范,用以指明概念的定义以及概念之间的语义关系[1]。 它能使交互各方对特定领域内共用的概念、词汇以及概念分类达成一致,支持知识的共享和重用,解决系统之间的互操作问题[2]。 近年来,本体已经成为代理计算、分布式信息系统和专家系统中的核心技术,在生物学和医学等领域取得了广泛的应用。

在中医药领域,本体工程也已成为广泛关注的研究热点和重要发展方向[3][4]。 学者们开始尝试基于领域本体,研制符合中医药领域特点的知识表达框架,解决中医学知识的获取、分析和推理等问题[4]。 例如,曹氏等在国家知识基础设施(National Knowledge Infrastructure,NKI)的过程中, 构建了中医领域本体,它包括中医诊断方法、中医术语、中医证候、中医脉象、中医病机等30多个中医本体类, 用于实现中医学知识的获取、分析和推理[5][6][7]。又如,尹氏等针对中医药术语标准化过程中面临的问题, 使用本体工程方法,研制了中医药学语言系统(TCMLS) [8][9]。 此外,本体还被用于阴阳理论[10]、五行理论[11]、中医诊断[12]、证候学[13]、中药学[14]、方剂学[15]、治则治法[16]、针灸学[17]、 中医古籍[18]等领域的知识建模和知识获取。这些工作表明,领域本体为中医药知识体系的形式化表达和系统管理提供了一种有效手段。


什么是“本体”?


本体(亦称本体论,ontology)是哲学、计算机科学和信息科学之间的交叉学科。 在哲学领域,本体是一门关于世界本原的学问,它试图罗列世间万物,并对它们进行准确的定义和完善的分类。 在计算机和信息科学领域,本体是一种用于表示领域知识的计算机模型, 它定义了一组知识表示原语(primitive),如类(class)、属性(property)和关系(relationship)等[1]。 Gruber[2]于1993年发表了一篇颇具影响力的文章,将本体定义为“某一概念化的显性规范”。 其中,“概念化”是指我们所要表达的世界的一个抽象、简化的视图, 它是所有知识库和基于知识的系统的基础。构建本体的目的,则是基于某种共享的概念化,实现程序之间的知识共享和互操作。本体的构建本质上是一个概念清晰化的过程, 旨在深化对某个领域的概念系统的理解[3]。由于本体一般针对特定领域和议题而建,并在领域团体成员中间共享,所以又被称为共享领域本体(Shared Domain Ontology)。


中医药本体工程方法学研究


中医药领域的本体建设仍处于起步和探索阶段,其方法学体系尚未成熟、亟待完善。目前,国内外尚缺乏构建中医药领域本体的成熟流程、方法和标准规范。中医药领域的知识体系独具特色,极为复杂。 中医药本体建设必然是一项复杂的系统工程,涉及到中医团体的广泛参与和密切协作。若没有合适的方法学作为指导,就难以在不同的本体工程中贯彻一致的设计原则,这不利于本体的规模化和互操作。 因此,需要对中医药本体工程方法学进行深入研究。

构建原则

首先,学者们提出了一些构建中医药本体的基本原则。例如,为了避免中医本体建设出现的“各自为战”的局面,包氏[3]提出了本体构建的原则: (1)后建本体必须逐条参照先建的相关本体,并沿用其所有合理的条目;(2)若弃用先建相关本体的条目,必须阐明实质性分歧;(3)此原则也适用于任何本体的自身修改过程。 又如,林氏[15]提出:对中医药概念的表达不必单纯的强求标准化和一致性,而应该在Ontology的启发和应用上,完整、忠实、准确地表达中医药传统理论的语义,并做到机读、通用、可共享,为实现中医药资源数字化奠定基础。 再如,方氏[19]提出,中医药本体的建立必须在深入理解中医药领域知识的基础上进行。 另外,一般认为本体工程需要领域专家的参与,应由知识工程师在中医专家的指导下完成[7]。这些原则对本体工程的实施都具有指导意义。

顶层设计

本体工程方法学中的一项关键任务是顶层本体的设计。中医顶层本体不仅为中医本体的构建提供了框架, 而且有利于实现中医本体同其它领域本体之间的整合,是构建完整中医本体的基础[3]。 高氏等对中医顶层本体的构建做了初步的探索,并指出中医顶层本体必须包括:(1)一般科学的概念接口;(2)一般生物医学的概念接口; (3)中医的最高层的抽象概念[3]。另外,TCMLS的语义网络[9]中包括层次化的语义类型和通用的语义关系,为TCMLS的构建提供了框架,也可被视为一个顶层本体。

中医药学语言系统的研制

在中医药学语言系统(TCMLS)的构建过程中,开展了大量的方法学研究工作。TCMLS是在本体论指导下构建的大型术语系统, 旨在提供一套计算机化的术语系统,支持中医药数字资源的系统整合和深度利用,向中医团体提供开放、智能的知识服务[8][9]。 方氏[19]提出了一套基于本体构建TCMLS的方案,其中涉及本体类及其层次结构、语义系统、概念集合、术语规范、通用编码等诸多方面; 并提出了本体规范存储和查询的方法,以帮助用户管理和获取中医药信息。曾氏[20]论述了TCMLS的构建思路、设计原则、架构与方法, 包括术语及定义的采集范围及标准、定义类(Class)和类的层次结构(Hierarchy)、语义关系等。谢氏[21][22]等人对TCMLS的语义网络进行了深入分析, 并将其与UMLS的语义网络进行了比较研究。汤氏[23]提出了面向中医药本体工程的协作方法,并据此构建了TCMLS的共建平台。 Mao[24]等人提出了基于子本体模型的本体演化方法,并将该方法应用于TCMLS的管理和重用。TCMLS的建立是一种创新性工作,对中医药学数字化、 标准化的实现具有重大意义[19]。在目前国内外缺乏构建领域本体的成熟流程、方法和标准规范的状况下,TCMLS也为中医药本体工程方法学的完善与发展做出了贡献。

本体的自动构建

构建大型领域本体需要耗费大量的人力资源。为降低成本,学者们开始研究领域本体的自动构建方法。 刘氏等[25]利用自然语言处理技术对中医药领域中已有的公认领域知识进行了重构与利用,并利用领域专家知识实现了受限文本的Ontology自学习机制, 从而成功实现了中医药学知识描述体系的自动构建与获取。这项工作初步证明了中医药本体工程自动化的可行性,为解决本体构建的瓶颈问题提供了另一途径。


中医药领域的本体


如上文所述,本体技术已被引入中医药的诸多领域,在知识建模和获取中发挥了重要作用。李氏等[13]分析了证候的语义特点,将证候的组成要素拆分成中医意义下的基本语义单元, 对语义单元如何组合成证候名称的规律进行了探讨,并在此基础上构建了证候本体。

曹氏等[12]在NKI本体的基础上构建了中医舌诊本体,该本体划分为“舌质”和“舌苔”两个子类:在“舌质”类下建立了“舌神”、“舌色”、“舌形”、“舌态”四个子类; 在“舌苔”类下建立了“苔质”和“苔色”两个类。该本体已被用于中医舌诊知识的获取。

在中药方剂学领域,周氏等[14]构建了面向中药学的领域本体,以全面描述中药的本质,揭示中药本身及中药间复杂的功效与物质关系,澄清中药的知识结构,为中药的知识表达提供数据基础; 林氏等[15]在分析中医药领域概念表达的特点和中医药检索的现状的基础上,尝试建立了方剂学本体,其内容包括方剂分类、主治、功效、禁忌、配伍等。

此外,高氏等[10]对气的失常与阴阳失调病机的逻辑联系进行了本体建模;朱氏等[17]基于语义网络技术研发了面向传统针灸知识体系的顶层本体; Wu[11]等人对五行理论及其在中医临床中的应用方法进行了本体建模;于氏等[26]对中医基础理论体系进行了本体建模;纪氏等[27]探讨了基于本体理论的针灸学知识组织方法,初步建立了一个针灸学领域本体框架, 并验证了该本体应用于古籍检索的可行性;李氏等[28]参照中医脑病学的理论体系,复用已有中医学本体和国外生物医学领域本体,构建了包括概念及其概念间相互关系在内的中医脑病学本体。

领域本体在中医药国际化方面也发挥了作用。例如,韩国的Jang[29]等人构建了面向“传统韩国医学”的本体,它描述了药材的名称、用药部位、功效等知识,并刻画了药材、症状、疾病和疗法之间的关系。 该本体中包含60000多条陈述,这些知识是由领域专家从韩国药典、传统医学经典和教材中获取的。这项工作对于加强国际社会对中医的理解和认识、促进中医药国际化进程具有重要意义。


中医药本体的主要应用


近年来,中医药本体被广泛用于从文献等知识资源中获取中医药结构性知识。中医知识获取是计算机自动实现知识管理、知识重组的前提[30],也是知识工程领域的一个难点问题。 郑氏等[31]采用本体技术及数据挖掘分析技术,通过对中医医案与中医经典著作文献进行关联研究分析,实现了名老中医的知识获取和传承。 蒋氏[30]等提出一种基于领域本体的知识获取方法,对医案中蕴含的知识进行形式化表示,构造中医领域的语义网络,对其进行定量分析,抽取中医领域的概念语义场。 刘氏等[32]提出了一种新颖的中医专家临床病案的知识获取方法,这种方法基于中医学本体,通过电子病案获取专家丰富的临床经验和诊疗知识,并将病案蕴涵的知识转化为形式化的知识,存入NKI知识库和NKI病案库。

中医药本体也为中医药古代文献的数字化做出了贡献。朱氏等[18]构建了面向中医古籍的语言系统(包括语义类型和语义关系)。林氏[33]从收集的中医骨伤资源(主要是中医骨伤古籍)中提取骨伤相关的术语, 然后设计本体的框架并构建了中医骨伤古籍小本体。谷氏[34]基于中医古籍文献叙词表,构建了面向中医古籍文献的领域本体。这些本体已被用于从中医古籍中获取结构性知识,从而支持古籍的语义检索和深入分析[18] [33] [34]。

构建中医药本体的另一个重要目的,是解决中医领域知识同其他领域知识的融合,以及中医领域知识内部的融合问题[3]。在中医药领域中,存在着大量富含中医药领域知识的数据库,但它们之间存在严重的异构性, 这增加了中医药知识融合的难度。Chen[35]等人基于领域本体实现了中医药异构数据库的集成,从而将中医各科知识融合为计算机化知识体系,以支持知识的统一访问。 此外,中医药领域本体在知识检索[33]、专家系统[36]、中医百科[37]、智能系统[6]等诸多领域得到了广泛的应用。


总结


本文介绍了本体的概念,以及中医药本体工程的方法、技术、覆盖范围和应用情况,以供中医药本体开发人员参考。 本体是一种新型的知识组织技术,主要源自人工智能(尤其是知识表达与推理)领域,也涉及到哲学,语言学,术语学和认知科学等。 近年来,本体成为中医药领域广泛关注的研究热点和重要发展方向。中医药学是一个复杂而全面的知识体系,具有复杂的概念层次结构和网状的知识结构,并且与其他的自然、人文学科之间存在着交叉融合的关系。传统的知识组织系统结构简单、表达能力有限,无法完全解决中医药知识表达中的复杂问题。本体为解决这些问题提供了强大的知识表达和推理能力,因此在中医药领域具有广阔的应用前景。本文所述工作表明,领域本体能够准确定义中医药领域概念,系统表达它们之间复杂的语义关系,并支持知识展示、决策支持、知识发现等中医药应用。这些工作初步验证了本体技术在中医药领域的适用性,为中医药本体工程的发展积累了宝贵的经验。


参考文献


  1. Tom Gruber (2008), Ontology. Entry in the Encyclopedia of Database Systems, Ling Liu and M. Tamer Özsu (Eds.), Springer-Verlag, to appear in 2008.

  2. Gruber TR. A Translation Approach to Portable Ontology Specifications[J]. Knowledge Acquisition, 1993, 5(2):199-220.

  3. 高成勉,包含飞,周强等.本体构建原则及其在中医顶层本体构建中的应用[J].医学信息,2008,21(5):581-583.

  4. 李兵,裘俭,张华敏等.中医药领域本体研究概述[J].中国中医药信息杂志,2010,17(3):100-101,106.

  5. 曹存根.国家知识基础设施的意义[J].中国科学院院刊,2001,16(4):255-259.

  6. 曹宇峰.病案分析引导下的中医智能教学的研究[D].首都师范大学,2005.

  7. Cungen Cao, Haitao Wang, Yuefei Sui. Knowledge modeling and acquisition of traditional Chinese herbal drugs and formulae from text. Artificial Intelligence in Medicine, 2004, 32(1):3-13.

  8. 尹爱宁,张汝恩.建立<中医药一体化语言系统>[J].中国中医药信息杂志,2003,10(3):90-91.

  9. Zhou X, Wu Z, Yin A, Wu L, Fan W, Zhang R. Ontology development for unified traditional Chinese medical language system[J]. Artif Intell Med, 2004, 32:15–27.

  10. 高博,崔蒙,宓金华等.气的失常与阴阳失调病机的逻辑联系及三维展示模式[J].中国数字医学,2010,05(5):50-53.

  11. Zhaohui Wu, Huajun Chen, Xiaohong Jiang. Modern Computational Approaches to Traditional Chinese Medicine[M]. Elsevier Inc, 2012.

  12. 曹宇峰, 曹存根. 基于本体的中医舌诊知识的获取[J]. 计算机应用研究, 2006, 23(3):31-34.

  13. 李明.证候本体的构建及其应用[D].上海中医药大学,2009.

  14. 周扬,王振国.中药Ontology概念关系体系的构建探析[J].中国中医药信息杂志,2009,16(3):96-97.

  15. 林丹红,钟伶.Ontology在中医药概念表达中的研究[J].医学信息学杂志,2007,28(6):545-549.

  16. 侯玉,张昌林,车立娟等.构建中医治则治法本体的研究[J].数理医药学杂志,2010,23(5):603-606.

  17. 朱玲,崔蒙.传统针灸知识体系语义网络的构建探讨[J].中国数字医学,2010,05(5):47-49.

  18. 朱玲,崔蒙,贾李蓉等.中医古籍语言系统中的语义类型分析研究[J].中国数字医学,2012,7(4):5-7,14.

  19. 方青.基于本体论的中医药一体化语言系统[D].浙江大学,2004.

  20. 曾召.本体论在中医药学语言系统中的应用研究[J].中华医学图书情报杂志,2007,16(1):4-6.

  21. 谢琪,崔蒙,曹存根等.基于领域本体方法构建中医概念信息模型的思考[J].世界科学技术-中医药现代化,2009,11(4):621-625.

  22. 谢琪.基于本体方法构建中医药概念信息模型的方法学示范研究[D].中国中医科学院,2011.

  23. 汤萌芽.中医药本体工程及相关应用[D].杭州:浙江大学,2007.

  24. Mao YX, Wu ZH, Tian WY, Jiang XH, Cheung WK. Dynamic sub-ontology evolution for traditional Chinese medicine web ontology[J]. Journal of Biomedical Informatics, 2008, 41(5): 790-805.

  25. 刘耀,穗志方,周扬等.中医药本体构建研究[J].大学图书馆学报,2008,26(4):58-62.

  26. 于琦,崔蒙.中医基础理论体系知识表示[J].中国数字医学,2010,05(5):25-26,29.

  27. 纪军,徐鸣曙,杨韵华等.针灸学领域本体构建研究[J].医学信息学杂志,2008,29(5):25-28.

  28. 李毅,张梅奎,杜侃等.中医脑病学本体的探讨及其构建[J].世界科学技术-中医药现代化,2007,9(6):96-101.

  29. Hyunchul Jang, Jinhyun Kim, Sang-Kyun Kim, Chul Kim, Soon-Hee Bae, Anna Kim, Dong-Myung Eom, and Mi-Young Song. 2010. Ontology for medicinal materials based on traditional Korean medicine. Bioinformatics 26, 18 (September 2010), 2359-2360.

  30. 蒋宏潮,王大亮,张德政等.基于领域本体的中医知识获取方法[J].计算机工程,2008,34(12):16-18,21.

  31. 郑健,林丹红,李其铿等.基于本体的名老中医医案研究应用系统[J].福建中医学院学报,2008,18(6):48-50.

  32. 刘和洋,曹宇峰,秦丽娜等.基于本体的中医专家临床病案的知识获取方法[J].计算机系统应用,2005,(8):80-83.

  33. 林尔正.基于中医骨伤古籍本体的语义检索研究[D].福州:福建中医学院, 2008.

  34. 谷建军. 基于叙词表的中医古籍文献领域本体建模方法研究[D]. 北京: 中国中医科学院, 2006.

  35. Huajun Chen, Yuxin Mao, Xiaoqing Zheng, Meng Cui, Yi Feng, Shuiguang Deng, Aining Yin, Chunying Zhou, Jingming Tang, Xiaohong Jiang, Zhaohui Wu: Towards Semantic e-Science for Traditional Chinese Medicine. BMC Bioinformatics, 2007, 8(S-3).

  36. 张德政,彭嘉宁,范红霞等.中医专家系统技术综述及新系统实现研究[J].计算机应用研究,2007,24(12):6-9.

  37. 宓金华.中医药知识工程应用[D].浙江大学计算机科学与技术学院,2010.