TCMKB - 中医药知识服务平台

中医药文献元数据(TCMLM)适用于中医药文献资源的存储、处理、记录、维护和交换等。 TCMLM能帮助人们检索和确认所需要的文献、了解文献单元的详细著录信息、 为管理者提供管理方式、保存条件等信息,使收集、整理、分类、检索、管理、利用和长期保存等工作更加简单易行。 TCMLM若得到广泛应用,则可显著提升中医药文献元数据的规范性,改进文献检索的效果。

为推动该规范的推广应用,我们开发了基于Web的“中医药文献检索与知识发现系统”(TCMLM)系统, 用于演示该规范在中医药文献处理方面的应用方法和应用效果。 该系统通过本体技术,将“中医药文献元数据”和其他术语系统进行整合,对文献的元数据和主题进行标注, 建立语义层次上的索引,从而更好地支持文献标注和检索。 该系统实现了中医药文献资源的管理和检索功能,以及文献元数据的增加、删除、修改等功能,验证了TCMLM的实用性。 下面对该系统的架构、技术特点和主要功能进行详细介绍。

系统介绍


近年来,中医药文献的数字化取得了长足发展,出现了许多文献库和文献检索系统,它们在文献的妥善保存和深度利用方面发挥了重要作用(贾李蓉&刘丽红,2012)。 中医界还构建了为数众多的数据库,内容涵盖中医理论、中医疾病、中药方剂、中医病案、中西医结合、新药发现等诸多领域,初步形成了数字化的中医药知识体系,为中医药知识遗产整理与传承提供了有力支持。 然而,各种文献库以及数据库之间彼此异构,各种信息系统之间难以实现信息交互,严重阻碍了中医药文献和知识的传播、共享与利用(于彤等,2013)。

如上文所述,TCMLM将在中医药文献资源的保护和利用中发挥基础性作用。为了TCMLM规范的推广应用,我们开发了一套基于万维网(Web)的中医药文献检索与知识发现系统(以下简称TCMLM), 作为中医药文献元数据的示范应用。

用户可通过该系统向文献库中添加文献资源,上传、下载或删除相关文献,采用“中医药文献元数据规范”对中医药文献进行标注,并对文献库中的文献进行检索。 该系统的核心功能包括:

  • 文献资源管理功能:该系统实现了中医药文献资源的录入、上传、下载和标注等功能,支持用户构建文献库,对中医药文献著录信息与全文进行组织与管理。
  • 文献元数据著录功能:该系统实现了文献元数据的添加、编辑与展示功能,支持用户采用“中医药文献元数据”规范对中医药文献进行标注。
  • 文献资源检索功能:该系统实现了基于文献元数据的文献检索功能,能根据用户输入的检索词从文献库中找出相关文献,展示文献的题名、作者、出版者摘要、主题、来源等元数据,并支持文献下载。

该系统基于“浏览器-服务器(BS)”架构实现,采用PHP、Javascript和MySQL等主流万维网(Web)技术开发,部署于国际主流的Apache HTTP服务器,通过Web向中医药工作者提供文献管理与检索服务。


系统功能模块


该系统包括文献资源管理、文献资源录入、文献元数据著录以及文献资源检索等4个核心模块:

  • 文献资源管理模块:实现了基本的文献库管理功能,支持文献的录入、上传、下载和标注等功能,可管理多个文献库。
  • 文献资源录入模块:支持用户向文献库中录入新的文献资源,支持相关文件的上传和下载功能。
  • 文献元数据著录模块:实现了文献元数据的增加、删除、修改操作,支持用户采用“中医药文献元数据规范”对中医药文献进行标注。
  • 文献资源检索模块:实现了基于文献元数据的文献检索功能,根据用户输入的检索词从文献库中找出相关文献,展示文献元数据,并提供文献下载功能。

下面简要介绍这些模块之间的关系:经由“文献资源录入模块”录入的文献资源,交由“文献资源管理模块”进行管理;用户在“文献资源管理模块”中选择某篇文献后, 可进入“文献元数据著录模块”,采用“中医药文献元数据规范”对中医药文献进行标注;用户处理后的文献被存入中医药文献库,供“文献资源检索模块”使用,从而面向网络用户提供文献检索服务。

文献资源管理模块

“文献资源管理”模块实现了基本的文献资源管理功能,支持用户构建文献库,对中医药文献著录信息与全文进行组织与管理。用户可通过该系统向文献库中添加文献资源,上传、下载或删除相关文献。

“文献资源管理”模块的主界面分任务栏和文献列表两部分。在任务栏上,向用户提供了一个检索框,供用户输入关键词以找出文献库中的相关文献。在任务栏上,还提供了“录入文献”按钮,若用户点击该按钮则系统转入“文献资源录入模块”。 本系统可管理多个文献库,管理人员可点击任务栏上的“文献库切换”按钮,从而在其管理的多个文献库之间进行切换。

系统根据用户输入的检索词,在文献库中找出相关文献,在文献列表中列出。若检出的文献很多,则对它们进行分页显示。在文献列表中,显示文献的创建者、题名、类型、出处和主题等信息。 用户可选择某条文献,从而进入该文献的“文献元数据著录”界面对其元数据进行编辑,或从文献库中删除这条文献。

Generic placeholder image

文献资源录入模块

“文献资源录入模块”支持用户向文献库中录入新的文献题录信息,并上传相关文件。 系统会提示用户输入文献的题名、标识、创建者、类型、出处、出版者、主题以及描述并提交,从而完成文献基本信息的录入工作。 系统还实现了文献相关原文文件的上传功能,支持用户将个人计算机上存储的本地文件上传至服务器。 在文献被录入后,用户还可进入系统的“文献元数据著录模块”对该文献的基本信息进行修改,并对该文献的详细元数据进行进一步的编辑。

文献元数据著录模块

“文献元数据著录”模块实现了文献元数据的增加、删除、修改操作,支持用户采用“中医药文献元数据规范”对中医药文献进行标注。 用户在“文献资源管理”界面中选择某条文献,即可进入该文献的“文献元数据著录”界面。 该系统支持用户对该文献的基本信息进行修改,或重新上传文献相关原文文件。 该界面支持用户对已有的文献元数据进行修改:系统列出“中医药文献元数据规范”中定义的文献元数据元素,用户则可对中医药文献元数据进行更新,并可添加必要的注释。 该界面还支持用户对文献元数据进行补充,从而丰富文献库的内容。

Generic placeholder image

文献资源检索模块

“文献资源检索”模块实现了基于文献元数据的文献检索功能。它根据用户输入的检索词从文献库中找出相关文献,列出文献的简要信息(包括标题、作者、来源、摘要以及文献之间的关系),并提供相关概念实体的知识。 例如,若用户输入检索词“党参”进行检索,系统会首先将与“党参”最为相关的文献推荐给用户,再分页列出所有与用户输入的检索词相匹配的文献。 该系统支持用户检索多个文献库:系统列出所维护的文献库,用户可选择其中的某个库进行检索。

Generic placeholder image

系统会根据用户输入识别出相关实体,并简要列出该实体的核心信息。例如,在“党参”的文献搜索结果右侧,列出了其图片、相关术语和相关知识,包括它的药性、药材基原、炮制方法、药理学等属性,以及“党参”涉及的语义关系。 这些语义关系分为层次关系和相关关系等2大类:层次关系是指概念之间的上下位关系(如“党参”的上位概念为“补气药”); 相关关系则有50多种,它们将中医药领域概念关联起来(如将“党参”与其相关花卉、相关生物和相关药品等等连接起来),构成一个大型的语义网络。 通过语义关系,用户可以在概念之间进行跳转,从而对中医药知识体系进行连贯的浏览。 在界面右侧提供的实体知识源自“中医药知识图谱“,它集成了TCMLS以及一系列相关的中医药数据库,含有丰富的中医药知识。

Generic placeholder image

用户在检索界面中选择某条文献,即可进入该文献的题录信息界面。该界面展示文献的类型(如古籍、期刊、会议论文、标准、规范等)、题名、简介,以及作者、出版者、来源等文献元数据。 系统还列出当前文献的相关文献以及相关主题(点击可进入相关主题的知识页面),并提供文献下载功能。用户还可转入该文献的题录信息编辑界面,对相关信息就行编辑和修改。

文本知识发现模块

该系统初步实现了从中医药文献中自动提取概念实体的功能。该系统基于术语系统(如“中医古籍语言系统” [7]),对《医学纲目》等中医古籍进行了处理,自动识别其中出现的中医概念和实体,生成文本内容的索引。该系统以网页的形式展示古籍全文,以不同的颜色标出文本中出现的中医名称和谓词。它还在文本右侧列出相关概念,用户可点击查看概念定义。

Generic placeholder image

该系统还实现了从文本中自动发现语义关系的功能:该系统搜集中医药文献并从中找出在一起频繁出现的词对,基于术语系统判断语义关系的性质,再将所发现的语义关系交由领域专家进行检验。该系统提供文本语义关系管理界面,对从文献中的语义关系进行集中管理、浏览和加工。这套文本语义关系发现和检阅工具,向术语专家提供从文本中发现新颖语义关系的技术能力。


总结


中医药信息化的实践表明,中医药信息资源不规范是阻碍资源整合,影响知识服务效果的主要因素。因此需要建立中医药信息的标准体系,逐步实现各种中医药信息资源的规范化。近年来,中医药领域的信息标准化工作取得了一系列进展,开发了“中医药学语言系统(TCMLS)”(Jia et al., 2013)、“中医临床术语集”(杨阳等, 2007)以及“中医古籍语言系统”(朱玲等,2010)等一系列标准化术语系统,并于近期编制完成了“中医药文献元数据(TCMLM)”技术规范草案。这些术语系统和数据标准若能得到广泛应用,则可显著提升中医药数据规范性,提高中医药文献处理能力,改进知识检索等各种知识服务的效果。

为了推动TCMLM规范的推广应用,我们研发了与之配合的文献处理技术,并搭建了示范性的“中医药文献检索与知识发现系统”,用于演示TCMLM及相关信息资源的使用方法和应用效果。该系统表明上述规范和信息资源可被用于中医药文献资源管理与检索,中医药知识检索与展示,以及面向中医文献的知识发现等多种应用,提升的中医药信息资源的规范化水平和利用价值。


参考文献


  1. 曹锦丹,李欣欣. 2003. 基于DC的医学信息资源元数据比较分析[J].图书情报工作,2003,(7):24-27.

  2. 贾李蓉, 刘丽红. 2012. 基于中医药学语言系统的文献检索服务平台[J]. 医学信息学杂志, 33(1), 54-56.

  3. 李海燕, 崔蒙, 任冠华, 谢琪, 范为宇, 尹爱宁. 2011. ISO/TC215传统医学信息标准化工作进展 [J]. 国际中医中药杂志, 33(3):193-195.

  4. 李毅等(2006)李毅,蔡刿,尹岭等. 2006. 医学元数据标准制定基本策略和流程[J].情报学报,25(3):312-315.

  5. 吴建中主编. 2000. DC元数据. 上海:上海科学技术出版社.

  6. 徐维, 邱君瑞, 朱妍昕等. 2012. 前瞻性临床研究元数据语义结构体系的建构[J]. 图书情报工作, (16):108-112.

  7. 徐春波. 2006. 中医药古籍元数据规范研究. 中华中医药学会第九届中医医史文献学术研讨会论文集萃.

  8. 杨阳, 李园白, 崔蒙. 2007. 建立中医临床术语集探索性研究[J]. 中国中医药信息杂志, 13(12), 105-105.

  9. 姚伯岳,张丽娟,于义芳等. 2003. 古籍元数据标准的设计及其系统实现[J].大学图书馆学报,21(1):17-21.

  10. 于彤,杨硕,贾李蓉,高博,张竹绿,崔蒙. 2013.中医药文献元数据标准化研究进展. 中国数字医学, 8(7):66-69.

  11. 张晓林. 2001. 元数据开发应用的标准化框架[J].现代图书情报技术,(2):9-11,15.

  12. 朱玲,尹爱宁,崔蒙等. 2010. 中医古籍语言系统构建的关键问题与对策[J].中国中医药信息杂志, 17(4):98-99.

  13. BERNERS-LEE T, HENDLER J, LASSILA O. The Semantic Web [J]. Scientific American, 2001, 284(5), 28-37.

  14. DARMONI S, THIRION B, PLATEL S, et al. 2002. CISMeF-patient: a French counterpart to MEDLINEplus [J]. J Med Libr Assoc, 90(2): 248-253.

  15. GRUBER T. Ontology. Entry in the Encyclopedia of Database Systems, Ling Liu and M. Tamer Özsu (Eds.), Springer-Verlag, to appear in 2008.

  16. MALET G, MUNOZ F, APPLEYARD R, et al. 1999. Model Formulation: A Model for Enhancing Internet Medical Document Retrieval with “Medical Core Metadata”[J]. J Am Med Inform Assoc, 6(2):163-172.

  17. SAKAI Y. 2001. Metadata for Evidence-Based Medicine resources[C]. In Proceedings of the International Conference on Dublin Core and Metadata Applications 2001 (DCMI '01), Keizo Oyama and Hironobu Gotoda (Eds.). National Institute of Informatics, Tokyo, Japan 81-85.

  18. WEIBEL S. 1997. The Dublin Core: A Simple Content Description Model for Electronic Resources[J]. Bul. Am. Soc. Info. Sci. Tech., 24(1):9-11.

  19. YU T, CUI M, LI H, et al. 2013. Traditional Chinese Medicine Literature Metadata: A Draft Technical Specification Developed by the International Organization for Standardization. 2013 International Symposium on IT in Medicine and Education (ITME2013), Xining, China, July 1921, 2013.