云南民族医药文献元数据方案设计探讨
2014-12-11保丽娟刘虹
保丽娟+++刘虹
摘要:概述云南民族医药文献数字化建设的现状,根据云南少数民族医药文献的特点,提出云南民族医药文献数字化元数据方案应遵循简洁准确性原则、通用性及针对性原则、共享性与互操作性原则、可扩展性原则、用户需求原则等设计原则。同时,结合调查研究,描述了云南民族医药文献数字化元数据方案的设计思路。
关键词:云南省;民族医药文献;元数据
doi: 10.3969/j.issn.2095-5707.2014.03.008
Discussion on Metadata Schemes for Yunnan Minority Medical Literature
Bao Lijuan, Liu Hong*
(Yunnan University of Traditional Chinese Medicine, Kunming Yunnan 650500, China)
Abstract: The article overviewed the current situation of digitization of minority medical literature in Yunnan, and proposed that the metadata schemes for Yunnan Minority medical literature should follow the principles of simplicity and accuracy, versatility and pertinence, sharing and interoperability, scalability and user needs according to the characteristics of Yunnan Minority medical literature. At the same time, it also described the design ideas of Yunnan Minority medical literature metadata schemes combining investigation and research.
Key words: Yunnan Province; minority medical literature; metadata
云南民族医药文献资源是云南各少数民族在漫长的历史繁衍中总结并流传下来的宝贵医药文化遗产,具有珍贵的史料和实用价值。数字化建设是长期保存和有效利用这些资料的最佳手段。
1云南民族医药文献概述
近几年来,通过政府资助、基金资助、联盟资助、中央财政支持地方高校等项目,我省民族医药文献数字化工作已经起步,并取得了初步的成果,省内多个民族医药科研单位先后开展了云南少数民族医药文献目录的研究整理、少数民族单验方的研究整理,少数民族天然药物的调查研究以及少数民族医药文化等多方位的少数民族医药文献研究课题,如云南省药物研究所主持开发了“云南特色天然药物共享信息系统”,云南中医学院主持开发了“云南民族药物信息系统”、“云南少数民族医药单验方数据库”、“云南民族医药肝病单验方数据库”、“云南地产中草药(民族
基金项目:云南省哲学社会科学规划项目(QN2013057)
第一作者:保丽娟,馆员,研究方向:中医药信息管理。E-mail: daibaoauto@163.com
*通讯作者:刘虹,教授,研究方向:中医药文献信息。E-mail: 13700694229@163.com.
药)数据库”,云南民族大学主持开发了“民族药(傣药)数据库”等信息系统。这些数据库都是在云南省各少数民族民间常用的民族药、单方、验方等民族医药信息资源进行收集整理的基础上,利用现代信息技术进行数字化加工存储。这些数据库提供了方便快捷的检索查询功能,生动直观地反映了云南各少数民族的医药资源状况,为政府、企业、科研单位和医药工作者研究、开发、保护和利用云南省的民族医药提供比较全面、完整的信息资料。同时也为珍贵的民族医药资料提供了存储平台,对于深入研究少数民族医药理论和开发云南特色民族药物都具有重要的意义。
尽管如此,云南民族医药文献数字化工程还处于初期阶段,有不少问题需要解决,例如数据库功能结构单一,各数据库相互独立,有的数据库是基于C/S结构模式开发的,严重限制了民族医药文献资源的传播和共享[1];有些数据库如“云南地产中草药(民族药)数据库”和“云南少数民族医药单验方数据库”,虽然使用的是同一数字化平台,但由于缺乏统一规范的元数据方案指导,导致数据库处于各自独立的状态,数据库结构和元数据元素不尽相同,不能实现资源的整合挖掘,无法发挥数据库的最大效用。如此参差不齐的元数据规范严重限制了民族医药文献资源的传播和共享利用,不利于知识发现和创新。因而制订统一规范的云南民族医药文献数字化元数据方案是云南民族医药文献数字化建设的首要问题。
2元数据及业内研究进展
元数据(Metadata)是“关于数据的数据”[2],元数据为多种不同形态的信息资源提供了统一规范的描述方法,是文献数字化建设中的重要组成部分,民族医药文献元数据就是对民族医药文献资源的内容、属性及特征进行描述,并对民族医药信息资源进行组织、定位和数据管理,以便于信息需求者进行检索和利用的一种结构化的数据。制订统一规范的云南民族医药文献数字化元数据方案,有助于实现云南各民族医药数据库系统的互操作和民族医药信息资源的共享,达到民族医药知识发现和创新以及对民族医药信息资源整合的目的。
目前国内还没有相关的民族医药文献元数据标准,但是关于中医药文献的元数据标准建设已经取得了很大的突破。由中国中医科学院中医药信息研究所于2012年提出的“Traditional Chinese Medicine Literature Metadata(中医文献元数据)”作为一项ISO技术规范(Technical Specification)得到成功立项,编号为ISO/DTS 17948,经过中国、韩国、英国、美国等多国专家的多次会议讨论和反复修改,该标准的草案已于2013年完成[3],目前该标准已进入编辑出版阶段。该标准的颁布,将会对中医药及民族医药文献资源数字化规范建设的发展起到极大的推动作用。
3云南民族医药文献数字化元数据方案设计原则
民族医药文献资源不同于一般的中医药文献资源,有大量不同类型的民族医药文献素材,如古籍文献、论著、民族天然药物图谱等传统文字载体文献以及各民族在从事医疗活动中的口碑经验、民间流传的歌谣和视频、录音等非文字载体文献,并且同时存在民族文字文献和汉字文献等情况[4],因此,民族医药文献元数据方案应该在中医药文献元数据标准的基础上体现出民族医药文献的特征,在设计中应遵循以下原则。
3.1简洁准确性原则
在元数据设计时应考虑各种层次的使用人员,设计的元数据方案应简洁,易于理解和掌握,但要保证描述元数据的准确性,能清楚明了的解释元数据所表示的含义,便于编目人员著录实践。例如Dublin Core(都柏林核心元数据)是国际通用的主要应用于网络信息资源组织的元数据标准,DC结构简单且易于掌握,许多专业领域的元数据框架都是基于DC建立的,但是民族医药文献有其特殊性,这就需要元数据设计的时候综合考量各种因素,参考DC元数据标准模式,在保证元数据简洁易用的基础上进行准确性的描述。
3.2通用性及针对性原则
由于云南民族医药文献资源类型多样,载体形式不尽相同,所以在设计元数据时应保证元数据方案的整体通用性,同时也要对不同类型不同载体的文献元数据有针对性的设计,满足特殊性资源的特征描述要求。例如DC元数据标准是国际通用的元数据标准,但是它所规定的15个元素不能完全包含民族医药文献的一些类型特征,因此有必要借鉴或复用其他类型的元数据标准,对某些元数据做针对性的设计,例如多媒体类的文献资源可以参考多媒体资源描述元数据标准MPEG-7等。
3.3共享性与互操作性原则
元数据的共享性和互操作性主要体现在对异构系统间互操作能力的支持[5],即不仅能支持本元数据标准上建立的各相关应用系统所操作,还应为其他民族医药资源应用系统所操作,便于实现民族医药资源的整合共享。因此,在设计云南民族医药文献元数据方案的时候应保证该元数据能准确表示元素数据的前提下,对其进行其他系统常用元数据的共享和转换,设计时要充分考虑元数据元素的语义定义及元数据结构等方面的内容。目前,基于语义网格技术的元数据本体模型可以很好的解决不同本体之间的互操作,跨语言、跨文化的互操作,实现数字资源的共享及知识发现等[6]。
3.4可扩展性原则
云南民族医药文献资源非常丰富,并且出版物类型和载体类型多样,整体的元数据方案只能提供比较广泛意义上的描述,对于一些具有民族特色的内容不能做到全部描述,但是云南民族医药文献元数据方案要体现出民族医药文献资源的特征,所以需要在标准元数据框架的前提下,根据不同民族医药文献资源的特点,扩展一些必备的元素或元素值,这就要求所设计的元数据方案具有较好的可扩展性。
3.5用户需求原则
民族医药文献元数据方案设计的最终目的是能够最大程度地满足用户对民族医药文献资源的信息需求,因此在制定元数据时还需要重点考虑各种不同层次、不同类型的用户需求。设计时应该从用户的信息需求和应用角度出发,对元数据的结构设计、各字段的设计及元数据语义结构等方面综合考量制订,以保证系统对用户的友好性,提供用户多层次、多途径的信息检索。
4云南民族医药文献数字化元数据方案设计思路
4.1资源对象分析
在设计元数据方案之前,需要对云南民族医药文献资源以及与资源有关的对象进行详细的调查分析,界定云南民族医药文献资源的范围,分析各类型文献资源对象的特点,并调查各层次各类型使用者的需求。
4.2元数据标准规范分析
调查国内外相关领域已经完成的元数据标准,分析元数据内容,考虑可以参考借鉴或者复用的相关标准,避免资源浪费。
4.3建立元数据框架
建立云南民族医药文献元数据的整体框架,确定不同类型元数据方案各部分之间的相互关系和规则。
4.4属性特征提取
集合民族医学、情报学、文献学、计算机信息管理等方面的专家一起讨论,结合调研实际和实证研究,从资源利用的角度提出属性需求以及云南民族医药文献资源的特征需求,明确核心元素,以及需要复用、借鉴、扩展的元素。
4.5制定著录规则
对不同的文献资源类型制定相对应的著录规则以及对元数据元素详细的描述性著录细则,充分体现民族医药文献的特征,指导民族医药文献数字化建设。
4.6确定置标方案
确定云南民族医药文献元数据方案的置标方案。目前比较主流的置标方案是基于XML/RDF形式的,这种形式的置标方案有利于数据的长期保存,并且可以实现系统的语义互操作,有利于资源的整合和共享。
5结语
制订统一规范的云南民族医药文献数字化元数据方案是云南民族医药数字化信息资源的整合、共享的基础性工作,为实现民族医药信息资源的深度挖掘、民族医药知识发现和知识创新提供技术支持,同时也为其他区域民族医药资源的数字化建设和信息资源整合提供参考和交流。
参考文献
[1]保丽娟,李永强,刘虹.云南少数民族医药文献数字化现状及思考[J].云南中医学院学报,2013,36(5):62-64.
[2]Weibel S. The Dublin Core: A Simple Content Description Model for Electronic Resources[J]. Bulletin of the American Society for Information Science and Technology,1997,24(1):9-11.
[3]于彤,崔蒙,李海燕,等.中医药文献元数据标准化研究进展[J].中国数字医学,2013,8(7):66-69.
[4]刘虹,陈柏君,罗艳秋.云南少数民族医药文字文献述 略[J].云南中医学院学报,2013,36(3):43-46,48.
[5]陈海燕.CALIS特色数据库信息资源描述与实践[J].图书情报论坛,2008(3):48-50.
[6]毕强,韩毅.语义网格环境下基于元数据本体的数字图书馆互操作研究[J].图书情报工作,2009,53(15):17-20, 82.
(收稿日期:2014-03-20,编辑:魏民)