TCMKB - 中医药知识服务平台

中医药文献元数据标准的示范应用与评价研究


中国中医科学院中医药信息研究所长期致力于中医文献的保护与利用工作,成功研制了64个的结构性文献数据库(方剂数据库,医案数据库), 并于2012年代表我国向国际标准化组织(ISO)申请了为期两年的“中医文献元数据(简称TCM-LM)”标准项目。这是我国中医药信息标准项目在ISO中首次成功立项,具有突破性意义。 为促进该标准的研制、维护和推广工作,拟针对中医文献的特点,采用国际先进的本体技术,研发与TCM-LM相互配合的本体和方法,构建TCM-LM的示范应用,对TCM-LM进行系统评价和适当改进。 研究内容包括:(1)对TCM-LM与相关元数据标准进行比较分析,阐明TCM-LM的独特性和兼容性;(2)基于描述逻辑,构建符合TCM-LM标准的领域本体,通过机器推理来验证TCM-LM的逻辑严谨性; (3)研发与TCM-LM相配合的语义标注检索方法,验证TCM-LM标准的实用性;(4)基于上述研究结果和专家反馈意见,对TCM-LM标准进行适当改进。


1 引言


“ISO/DTS 17948 Traditional Chinese medicine literature metadata(译为中医药文献元数据,简称TCMLM)”是中国中医科学院中医药信息研究所主持撰写, 参照DC(都柏林核心元数据),通过提取中医文献资源各项特征元素并规定著录细则,指导文献管理者进行元数据著录的一项国际标准(已经通过ISO/TC215投票,形成出版决议), 致力于帮助人们检索和确认所需要的文献、了解文献单元的详细著录信息、为管理者提供管理方式、保存条件等信息,使收集、整理、分类、检索、管理、利用和长期保存等工作更加简单易行。 TCMLM反映了中医药文献的特点,对于中医药文献资源的系统保护和深度利用具有重要意义。

目前, TCMLM的草案刚刚形成,尚待完善;尚未出现与之配合的中医文献处理方法,其示范应用和系统评价研究亦处于空白。为促进TCMLM的研制、维护和推广工作, 本研究针对中医文献的特点,在分析“都柏林核心”等元数据标准的基础上,借鉴医学元数据应用系统的成功之处,采用国际先进的本体和语义技术,研发与TCMLM相互配合的本体和方法, 构建TCMLM的示范应用,论证TCMLM标准的独特性、兼容性、逻辑严谨性、实用性,并根据研究结果提出了针对该标准的改进意见。本研究充实了中医文献元数据的技术规范体系,为TCMLM规范的宣传、 推广和应用起到了积极的推动作用。


2 背景


中医药学历经数千年的传承和发展,形成了异彩纷呈的医学流派,留下了浩如烟海的医学文献。中医药文献作为文化传承的纽带,记载着历代医家的智慧和经验。面对如此庞大、复杂的文献资源, 如何对它们进行有效的分类、整理、评鉴和保存,是中医药传承中的重点和难点问题。中医文献的数字化对于中医药知识遗产的妥善保存和快捷传播具有重大的意义。 近年来,随着信息技术革命的深化,很多信息技术在中医药领域中得到了成功的应用。特别是文献标引和检索技术,在中医药文献的数字化保存和深度利用中发挥了重要作用。

目前,在国际上尚缺乏一部面向中医药领域的文献元数据技术规范,导致各种中医药文献检索系统之间存在着显著的异构性,这不利于中医药文献的标引和检索。 “ISO/DTS 17948 Traditional Chinese medicine literature metadata(译为中医药文献元数据,简称TCMLM)”是国际标准化组织(ISO)于近期完成、正在审核的技术规范草案(于彤等,2013;Yu et al., 2013)。 它是面向中医药领域的文献元数据标准,反映了中医药文献的特点,旨在满足中医药文献标引和检索的特定需求,对于中医药文献资源的系统保护和深度利用具有重要意义。

目前, TCMLM的草案刚刚形成,尚待完善;尚未出现与之配合的中医文献处理方法,其示范应用和系统评价研究亦处于空白。 为促进TCMLM的研制、维护和推广工作,本研究针对中医文献的特点,在分析“都柏林核心”等元数据标准的基础上,借鉴医学元数据应用系统的成功之处,采用国际先进的本体和语义技术, 研发与TCMLM相互配合的本体和方法,构建TCMLM的示范应用,论证TCMLM标准的独特性、兼容性、逻辑严谨性、实用性,并根据研究结果提出了针对该标准的改进意见。本研究充实了中医文献元数据的技术规范体系, 为TCMLM规范的宣传、推广和应用起到了积极的推动作用。


3 研究内容


本项目对TCMLM进行了评价和应用研究,将TCMLM转换为一个面向中医药文献元数据的本体,研发了相应的中医药文献的语义标注方法,为中医药文献元数据标准的推广提供了一种技术手段;开发了一套基于Web的中医药文献元数据标注与检索系统, 作为TCMLM的示范应用。该研究初步验证了TCMLM的适用性和可行性,为其推广应用提供了技术手段。

在TCMLM的发布和推广的过程中,面临的主要问题是:该标准与【ISO/DIS 13119】等相关标准有哪些区别?在医学领域已经存在知识资源元数据标准的前提下,是否有必要提出一项特别面向中医药领域的文献元数据标准? 为回答这些问题,我们对都柏林核心(DC)和【ISO/DIS 13119】进行了分析,指出了我们所提的标准与这些标准之间的区别和差异,在一定程度上证明了建立这一标准的必要性。 我们还对20多本古籍进行实验性标注,以评估TCMLM的适用性。

TCMLM已完成编制即将出版,如何在全球范围内实施该规范,成为接下来需要考虑的问题。 本研究采用国际先进的本体和语义网技术,构建符合TCMLM规范的中医药文献元数据本体,还基于该本体对20多本经典古籍的元信息进行了示范性标注,实现了对相关古籍作者、刊行者、储藏地、版本信息、行款等多种信息的全方位记录, 并实现了基于本体的图形化展示,初步验证了该本体的实用性。

我们采用Web技术,构建了“中医药文献元数据标注与检索”系统,作为“中医药文献元数据”规范的示范性应用。 该系统采用PHP和MySQL等主流万维网技术开发,部署于Apache HTTP服务器,通过网络向中医药工作者提供知识服务。 该系统实现了文献管理、文献检索以及知识发现等功能:基于文献库对文献资源进行管理,支持文献元数据著录,文献内容标引,以及文献上传和下载;在文献库的基础上实现了文献资源检索功能。


4 总结


本研究采用国际先进的本体和语义网技术,构建符合TCMLM规范的中医药文献元数据本体,还基于该本体对20多本经典古籍的元信息进行了示范性标注,初步验证了该本体的实用性。本项目对“中医文献元数据标准”的研究产生的方法经验和理论成果将对中医药信息标准国际化起到指导作用,在中医文献和信息标准化领域都具有重要意义,因此具有广阔的应用前景。

ISO是产生于西方文化影响下的国际组织,具有中华文化特色的标准项目得以立足,需要跨越东、西方文化鸿沟,必将面临许多新问题、新挑战。这些问题不仅局限于规则和技术层面,也涉及到根本性的原理问题,此前一些 专家认为ISO TC215旨在关注健康信息,不是从具体的医学角度出发制定标准的,因此中医药信息标准不具备独特性。此次TCMLM作为中医药信息标准在ISO TC215中首次成功立项,具有突破性意义。

目前,国际上尚未形成被普遍推广的中医文献元数据标准,TCMLM的草案刚刚形成,尚待完善;尚未出现与之配合的中医文献处理方法,其示范应用和系统评价研究亦处于空白。作为国际首个TCMLM的应用和评价研究,本项目研究该标准的示范应用,评估该标准的合理性与实用性,纳入到国际标准的必要性和重要性,及其在中医药文献管理及检索中发挥的作用,为标准提案和答辩工作提供定性、定量的证据。TCMLM的示范应用、专利和研究报告,将充实中医文献元数据的规范体系。若TCMLM得到通过,则将是ISO/TC215中首批中医药信息学领域的项目,使得中医药信息标准在国际医疗信息标准中占据一席之地。


参考文献


  1. 曹锦丹,李欣欣. 2003. 基于DC的医学信息资源元数据比较分析[J].图书情报工作,2003,(7):24-27.
  2. 贾李蓉, 刘丽红. 2012. 基于中医药学语言系统的文献检索服务平台[J]. 医学信息学杂志, 33(1), 54-56.
  3. 李海燕, 崔蒙, 任冠华, 谢琪, 范为宇, 尹爱宁. 2011. ISO/TC215传统医学信息标准化工作进展 [J]. 国际中医中药杂志, 33(3):193-195.
  4. 李毅等(2006)李毅,蔡刿,尹岭等. 2006. 医学元数据标准制定基本策略和流程[J].情报学报,25(3):312-315.
  5. 吴建中主编. 2000. DC元数据. 上海:上海科学技术出版社.
  6. 徐维, 邱君瑞, 朱妍昕等. 2012. 前瞻性临床研究元数据语义结构体系的建构[J]. 图书情报工作, (16):108-112.
  7. 徐春波. 2006. 中医药古籍元数据规范研究. 中华中医药学会第九届中医医史文献学术研讨会论文集萃.
  8. 杨阳, 李园白, 崔蒙. 2007. 建立中医临床术语集探索性研究[J]. 中国中医药信息杂志, 13(12), 105-105.
  9. 姚伯岳,张丽娟,于义芳等. 2003. 古籍元数据标准的设计及其系统实现[J].大学图书馆学报,21(1):17-21.
  10. 于彤,杨硕,贾李蓉,高博,张竹绿,崔蒙. 2013.中医药文献元数据标准化研究进展. 中国数字医学, 8(7):66-69.
  11. 张晓林. 2001. 元数据开发应用的标准化框架[J].现代图书情报技术,(2):9-11,15.
  12. 朱玲,尹爱宁,崔蒙等. 2010. 中医古籍语言系统构建的关键问题与对策[J].中国中医药信息杂志, 17(4):98-99.
  13. BERNERS-LEE T, HENDLER J, LASSILA O. The Semantic Web [J]. Scientific American, 2001, 284(5), 28-37.
  14. DARMONI S, THIRION B, PLATEL S, et al. 2002. CISMeF-patient: a French counterpart to MEDLINEplus [J]. J Med Libr Assoc, 90(2): 248-253.
  15. GRUBER T. Ontology. Entry in the Encyclopedia of Database Systems, Ling Liu and M. Tamer Özsu (Eds.), Springer-Verlag, to appear in 2008.
  16. MALET G, MUNOZ F, APPLEYARD R, et al. 1999. Model Formulation: A Model for Enhancing Internet Medical Document Retrieval with “Medical Core Metadata”[J]. J Am Med Inform Assoc, 6(2):163-172.
  17. SAKAI Y. 2001. Metadata for Evidence-Based Medicine resources[C]. In Proceedings of the International Conference on Dublin Core and Metadata Applications 2001 (DCMI '01), Keizo Oyama and Hironobu Gotoda (Eds.). National Institute of Informatics, Tokyo, Japan 81-85.
  18. WEIBEL S. 1997. The Dublin Core: A Simple Content Description Model for Electronic Resources[J]. Bul. Am. Soc. Info. Sci. Tech., 24(1):9-11.
  19. YU T, CUI M, LI H, et al. 2013. Traditional Chinese Medicine Literature Metadata: A Draft Technical Specification Developed by the International Organization for Standardization. 2013 International Symposium on IT in Medicine and Education (ITME2013), Xining, China, July 1921, 2013.