国内外科学数据元数据研究进展*
2014-11-14黄如花邱春艳
黄如花 邱春艳
(武汉大学信息管理学院 湖北武汉 430072)
科学数据的元数据(以下简称科学元数据)是以科学数据为描述对象的元数据,是对科学数据开展描述、组织、出版等工作的重要工具。近年来,科学数据成为继科研文献资源之后又一重要的科学研究资源。科学元数据对于数据仓储、数据保存以及数据获取都有至关重要的作用,也成为业界重要的研究和实践内容。英国科学数据管理中心(Digital Curation Center,DCC)的《科学数据管理参考手册》(Curation Reference Manual)对科学元数据进行了专门论述;2012年8月,美国国家信息标准组织(National Information Standard Organization,NISO) 与都柏林核心元数据组织(Dublin Core Metadata Initiative,DCMI)共同召开系列在线研讨会,并以管理科学数据为目标的元数据作为重要议题。科学元数据在科学数据的管理、长期保存、共享和开放存取等备受各界关注的领域中发挥着重要作用。
1 科学元数据的功能需求
1.1 科学元数据的功能需求研究
科学元数据的功能需求是科学数据元数据建设的基础。Jian Qin等认为以现有的一个元数据标准来实现所有科学数据描述的方式存在众多局限,通过调查16个标准9个大类的4400余个元数据元素,发现描述类元素数量较大而且跟都拍林核心元数据(Dublin Core,DC)元素存在重复,而现有元数据元素以及大量的、多样化的标准和广泛而差异的命名实践等都阻碍着元数据基础设施的形成。元数据描述框架相比元数据内容标准,其承担的指导性和框架性作用更强,不局限于特定领域的术语系统限制。对元数据标准功能需求的调查分析和对元数据标准和描述框架的设计与实施都具有重要的指导作用。Hong Huang等针对基因数据管理中的元数据功能需求,对156名基因领域科研人员进行调查,发现科研人员对元数据的功能需求包括简便易用性、可复用性、可操作性、充分性、交互性和模块性等,针对跨平台和跨库的数据对比、集成和复用等工作,基因领域科研人员对元数据持有独立性和非独立性的需求。Craig Willis等认为科学元数据内容标准应当符合两个条件,即:描述对象必须只针对科学数据集而非广义的科学信息;必须运用于科学数据仓储。以此为基础,从现有的50余种科学元数据内容标准中筛选出9种进行科学元数据标准的目标需求调查,发现不受学科领域限制的元数据目标包括可扩展性、弹性、模块化和可移植性等,而指向数据仓储同时不受学科领域限制的包括支持数据的记录、交换、检索和存档等功能需求,在综合性、充分性、简易性和抽象性等方面则具有不同的目标和需求。
1.2 科学数据相关项目的元数据需求分析
特定的科学数据项目和仓储等需在建设前期对元数据功能需求进行调查和分析,以为设定合理的科学元数据方案奠定基础。Dryad数据仓储建设的第一步就是开展功能需求调查,Dryad仓储的功能需求包括了支持资源发现和利用;数据交互;计算机辅助元数据生成、增值和质量控制;出版物与支撑数据之间的关联;数据安全等,反映在高层元数据结构上则表现为简单、交互性和语义网兼容性等三个方面。虚拟开放存取农业与水产仓储(Virtual Open Access Agriculture&Aquaculture Repository,VOA3R)在分析现有元数据标准的基础上,其建设过程以都柏林核心应用文档的新加坡框架(Singapore Framework for Dublin Core Application Profiles)为基础,其元数据标准不仅考虑自身的系统功能需求,有效而可靠的跨库内容的共享与交互以及元数据标准的领域性、良好设计性和一致性也成为VOA3R的元数据功能需求的重要组成部分。
2 科学元数据标准建设
2.1 通用元数据标准在科学数据组织中的应用和拓展
科学数据组织、存储和共享发展对科学元数据的需求不断增强,部分数据仓储和数据管理机构对适用于文献描述和组织的通用型元数据标准进行选择和转换,用于科学数据的组织和管理实践。DCMI于2009年1月建立了DCMI科学与元数据社区(DCMI Science and Metadata Community),致力于科学元数据相关知识的交流,特别是DC元数据对科学数据管理等工作所需元数据的帮助。Wira-Alam A等对DC元数据基本元素进行简单拓展,从而从科学研究的层面上对科学数据进行结构化描述,同时融合DDI元数据的元素、DDI生命周期以及利用RDF的可能性,方便将科学数据在关联开放数据云中发布。
2.2 学科领域元数据标准的丰富发展
从其描述对象的学科领域进行划分,现有的科学元数据标准可分为综合性和学科性科学元数据。近年来,面向科学数据的学科领域元数据标准不断丰富,并向多样化发展。据统计,77%的科学元数据标准为特定学科领域元数据标准或指向统计、行为描述等特定领域的元数据,学科范围覆盖生物、农业、空间、基因、化学、地理等学科领域。而英国中央实验室研究理事会(The Council for the Central Laboratory of the Research Council,CCLRC)为实现试验信息以及“结构性科学”产出数据的组织,研发了核心科学元数据模型(The Core Scientific MetaData Model,CSMD),其组成元素分为主题、研究描述、获取条件、数据描述、数据定位和相关资料等六个方面,从而方便以统一的形式实现科学数据的组织和获取。CSMD是面向科学研究过程而不受学科领域限制的专门用于科学数据描述的框架型元数据标准。
我国在科学数据库以及科学数据共享不断起步和发展的背景下,也在学科领域元数据标准方面做出了努力,如我国国家质量监督检验检疫总局和国家标准化管理委员会先后于2006年9月、2011年5月共同发布《生态科学数据元数据》标准(GB/T 20533-2006)和《机械科学数据 第3部分:元数据》标准(GB/T 26499.3-2011)等,为不同学科领域科学数据组织和共享提供了条件。
2.3 对数据起源的重视
数据起源(data provenance)是元数据的一种,属于科学数据从最初来源派生出来的历史数据,用来指代追踪、记录数据起源以及数据在不同数据仓储之间运动的过程。数据来源被用来支持数据质量评价、数据审计跟踪、提供复用方法、所有权界定、提供数据解释等。为了满足地理科学领域记录科学数据的统一、可用的来源元数据,同时减轻系统服务对象以及整个工作流程和服务面临的修改负担的需求,Yogesh L.Simmhan等针对以数据为中心的科学研究流程在松耦合的出版/订阅结构之上设计了数据来源收集框架。
2.4 科学数据的保存元数据
科学数据作为重要的数字化学术资源,其长期保存成为众多机构和项目的重要目标,而科学数据的保存元数据建设也成为重要的研究和实践内容。美国密歇根大学校际政治及社会研究联盟(Inter-university Consortium for Political and Social Research,ICPSR)在其《维持领域数据仓储白皮书》(SustainingDomain Repositories for Digital Data:A White Paper)中指出,元数据标准如保存元数据执行框架(Preservation Metadata:Implementation Strategies,PREMIS)对于数据仓储的发现、检索、获取和科研群体标准的转变是十分必要的。Arif Shaon 等研究了空间数据基础设施的长期保存中的元数据框架与Geo-portal建设中的执行问题,以INSPIRE为范例探究空间数据基础设施的保存需求,在Geo-Portal形成的过程中将ISO19115元数据标准融入保存文档。地球数据观测网(Data Observation Network for Earth,DataONE) 项目运用PREMIS来详细阐述其技术框架中的保存需求。Steve Hitchcock等实现PREMIS元素与以OAIS为基础的机构库服务提供模型进行映射。英国联合信息委员会JISC的eCrystals联合项目针对结晶学领域的科学数据构建了学科领域科学数据保存元数据。
3 元数据在科学数据管理中的应用
3.1 科学数据管理中的元数据应用研究
近年来,元数据在科学数据管理中的应用也逐渐成为研究的热点问题。Jian Qin等对元数据在支撑科学数据的发现和管理方面的功能与结构需求进行研究,总结了现有科学领域元数据模型、取值系统,提出最少努力、基础设施型服务和便携性等科学元数据模型的三个基本原则以及元数据在科学数据共享与管理中的功能和结构需求以及应用前景;Alison Chilvers认为元数据是普遍意义上科学数据管理的关键,并从数据交换和数据长期保存的角度探讨元数据在数据管理方面的作用。随着科学数据管理的发展,元数据管理也成为重要的研究方向,如Gurmeet Singh等针对科学元数据的存储、获取和查询等问题以元数据目录服务(Metadata Catalog Service,MCS)为例,阐述了元数据管理系统的应用和相关研究;Matthew B.Jones等对科学元数据目录系统 Metacat进行介绍,该系统提供了可扩展的、模型化的元数据管理框架,整合RDF技术和方法,允许科研人员存储、管理和检索XML格式的元数据记录 。
3.2 科学数据管理的元数据方案建设实践
随着科学数据管理实践的开展,从事科学数据管理工作的图书馆或科研机构根据其开展的科学数据管理服务深度以及项目环境,设计并实施了一系列的科学数据管理元数据方案。较为典型的如高校图书馆在科学数据管理平台、系统或者数据仓储的建设中,深入考虑科学数据管理流程以及该机构的环境对元数据的需求,选择或设计了适合本机构科学数据管理发展的元数据方案。如康奈尔大学图书馆构建了集科学数据管理平台与服务于一体的数据阶段型存储库(Data Staging Repository,DataStaR)。DataStaR为实现对尽可能多学科领域科学数据的描述与组织,在其元数据方案中融合了尽可能多的学科领域元数据标准,同时融合RDF和OWL等语义网技术,形成适合跨学科科学数据描述和过渡性存储的元数据方案。普渡大学图书馆以机构知识库为基础,构建了适合开展科学数据管理的系统PURR。PURR在对现有元数据标准进行分析和评价的基础上进行选择,形成以DC元数据为主要描述元数据、以PREMIS为保存元数据规范、以元数据编码与转换标准(Metadata Encoding andTransmissionStandard,METS)为封装标准的元数据方案。
4 元数据在科学数据共享中的应用
4.1 科学数据共享的元数据应用
科学数据的共享一直以来都是科学研究重视的问题,而元数据是数据共享的重要技术手段和实现途径。随着科学数据共享的备受关注以及不同学科领域、地域范围的科学数据共享项目纷纷启动,科学元数据标准建设成为关键性的工作内容。当前科学数据共享的实践和研究多集中在特定的学科领域,因此特定学科领域的元数据标准的研究和实践最为突出。Tschangho John Kim以地理空间数据共享为切入口,认为元数据可以实现科学数据的获取、利用和转化等需求,对现有的地理空间领域的8种元数据内容标准的结构进行比较,以期建立更加简化和适用于数据共享的地理空间领域科学元数据标准。刘海行等开展了基于元数据检索结合动态可视化技术的海洋科学数据共享研究。
4.2 共享平台与仓储建设中的元数据应用
国内外科学数据存储和共享仓储同样重视元数据的建设问题。王国复对元数据在科学数据共享平台的作用、元数据的分类、元数据的管理、元数据系统和元数据的应用模型进行了阐述,王培正认为元数据是实现科学数据共享的四种方式之一,国内学者如诸云强、袁雪梅,李雪山等分别针对地球科学、海洋科学、交通等学科领域的科学数据共享系统或平台建设中的元数据设计与实现问题进行了详细研究和阐述。周宝平在分析太原地区科学数据共享平台设计和开发中融合了元数据汇交、数据发布、元数据检索以及多种方式的数据共享等功能;张英俊则分析了基于元数据的生命周期的科学数据平台实现的可能性。国外数据仓储如Dryad等在开展仓储与流程设计过程中,充分考虑数据存储和共享对元数据的需求,在现有的元数据标准基础之上,设计了合理的元数据方案。美国国际地球科学信息网络中心(Center for International Earth Science Information Network,CIESIN)针对其存储的大量科学数据设计了专门的元数据标准。
4.3 共享元数据标准的研发
在实践方面,众多共享项目、系统和平台在建设过程中纷纷设计并颁布共享相关的元数据标准。我国从2003年开始实施国家科学数据共享工程,2005年制定的《科学数据共享元数据》提供了科学数据共享元数据内容标准框架,定义了科学数据共享核心元数据、公共元数据和参考元数据;科技部于2006年发布《科学数据共享核心元数据标准》试行稿;中国科学院数据应用环境建设和服务项目组先后发布了《科学数据库核心元数据标准》《人地系统主题数据库元数据标准》《土壤科学数据库元数据标准》;国家科技基础条件平台建设基础科学数据共享网项目组2011年发布了《数据集核心元数据标准》。国内众多学者针对特定学科领域、科学数据系统的现状,开展科学元数据内容标准的需求分析和标准设计,以探索适用于科学数据共享的元数据解决方案。
5 其他科学数据相关项目和领域中的元数据应用
英国联合信息系统委员会(Joint Information Systems Committee,JISC)的出版者、仓储与机构元数据交换(Publisher,Repository and Institutional Metadata Exchange,PRIME)项目致力于实现出版者、学科库以及机构库之间的元数据自动交换。欧盟第七科技框架计划(Seventh Framework Programme,FP7)的ESPAS项目将元数据作为基础设施的重要研究和建设对象,力求为集成元数据的发现、挖掘和可视化等提供增值服务;而FP7资助的CESSDA项目针对项目对元数据的功能需求,围绕科学元数据的互操作和元数据保存、评价等一系列元数据管理问题进行研究和实践。此外,元数据成为实现科学数据与其支撑文献的有效途径,如黄筱瑾从文献与数据的元数据元素出发,总结了作者关联、学科分类号关联、关键词关联等关联模式;张宇等则以元数据为基础将异构的数据集整合,实现高度集成的数据查询功能。
科学元数据标准的建设多为学科性元数据且多针对特定的系统和项目进行建设,这主要是缘于现存的元数据标准多围绕特定的项目或数据系统建设,其适用范围受到限制,而DC等较为通用的元数据标准虽然在科学数据的描述和组织方面也有所尝试,但其设计和运用更适用于图书馆领域传统馆藏文献和数字化文献的描述和组织,从而形成了元数据标准建设多方参与且逐渐多元化的现状与趋势。
6 科学元数据的技术发展
6.1 语义网技术的应用
解决元数据在科学数据各项管理的应用中存在的众多技术问题是科学元数据应用的重要环节。DCMI科学与元数据社群(DCMI Science and Metadata Community)针对科学元数据的识别体系、标准、语义结构和模型、可交互的取值系统、元数据链接机制和技术等相关技术问题开展了研究和探讨。国内外学者对科学元数据标准的元素拓展、语义结构体系建设以及科学元数据标准之间的互操作问题等都引起了关注。如,Anneke Zuiderwijk等探讨了元数据在促进关联开放数据出版和使用方面的潜在价值,包括提高数据的关联、可视化以及数据质量的评估等;Bill Howe等将以RDF为基础的数据模型融入科学元数据建设和生成,从而简化数据生产者的工作并提高数据的语义检索功能;Yolanda Gil等将语义技术、Wiki技术、关联数据的理念与科学元数据结合,为科学数据集、科学家、科研项目和存储位置四个主体分别设立独立的识别机制,并建立四者之间的关联;Jian Qin等尝试运用RDF三元组和关联性的URI标识等与生态元数据(Ecological Metadata Language,EML)记录进行关联,从而将生态学领域科学数据以关联性的语义网络形式加以呈现;徐维等以临床医学数据标准为基础,构架了临床研究元数据的宏观框架、中观类组和微观属性等三个层次的元数据语义架构体系。
6.2 本体技术的应用
Sunil Movva提出创新性的集成语法与语义功能的元数据解决方式以实现科学数据的自动利用,其中语义元数据与定义语义的本体关联,同时允许语法元数据读取数据,这个解决方案利用了地球科学标记语言(Earth Science Markup Language,ESML)作为语法元数据读取数据,同时添加一个语义元数据组件链接到适当的本体用以指向数据的内容与含义。Chen Xu等以ISO 19115标准为基础,实现UML与OWL之间规则的相互映射,总结UML和OWL概念之间的相似,同时将图像和网格数据的UML元数据模型转换为OWL本体,包括命名规则、数据类型、限制条件等。Miao Chen等在现有的气象报告数据元数据基础上运用本体进行呈现。在实践方面,康奈尔大学图书馆DataStaR平台在元数据的设计与实施中融合了RDF、OWL等语义网技术,实现多学科领域数据描述与组织的方便性。
元数据在科学数据领域中的研究与应用都取得了较大进展,功能需求的调查为科学元数据标准的建设奠定了基础,科学元数据标准的逐渐丰富和发展为其在科学数据不同领域的应用提供较为充分的工具和标准。科学元数据当前被重点应用于科学数据管理和共享领域。科学元数据的研究和实践为科学数据相关工作和项目的建设提供了条件,其在科学数据更广泛领域的应用有待拓展,而新技术的发展和融合将为科学数据元数据功能的拓展带来新的契机。
[1] Instalment on “Scientific Metadata” [EB/OL]. [2013-12-20].http://www.dcc.ac.uk/sites/default/files/documents/Scientific%20Metadata_2011_Final.pdf.
[2] Metadata for Managing Scientific Research Data [EB/OL].[2013-12-20].http://www.niso.org/news/events/2012/dcmi/scientific_data/.
[3] jian qin,li kal.How Portable Are the Metadata Standards for Scientific Data?A Proposal for a Metadata Infrastructure[EB/OL].[2014-08-09].http://jianqin.meta dataetc.org/wp-content/uploads/2013/08/DC2013-metadatad-portability.pdf.
[4] Sufi S,Matthews B.A metadata model for the discovery and exploitation of scientific studies [M].Knowledge and Data Management in GRIDs.Springer US,2007:135-149.
[5] Hong Huang,Jian Qin.Understanding Metadata Functional Requirements in Genome Curation Work[EB/OL].[2014-06-09].https://asis.org/asist2013/proceedings/sub missions/posters/69poster.pdf.
[6] Willis C,Greenberg J,White H.Analysis and synthesis of metadata goals for scientific data[J].Journal of the American Society for Information Science and Technology,2012,63(8):1505-1520.
[7] Dube,J.,Carrier,S.,&Greenberg,J.(2007).DRIADE:a data repository for evolutionary biology[A].Proceedings of the 2007 conference on Digital libraries[C].Vancouver,BC,Canada,ACM Press,2007:481.
[8] Greenberg J,White H C,Carrier S,et al.A metadata best practice for a scientific data repository[J].Journal of Library Metadata,2009,9(3-4):194-212.
[9] Diamantopoulos N,Sgouropoulou C,Kastrantas K,et al.Developing a metadata application profile for sharing agricultural scientific and scholarly research resources[M].Metadata and Semantic Research.Springer Berlin Heidelberg,2011:453-466.
[10] DCMI Science and MetadataCommunity [EB/OL].[2014-08-06].http://www.dublincore.org/groups/sam/
[11] Wira-Alam A,Dimitrov D,Zenk-Möltgen W.Extending Basic Dublin Core Elements for an Open Research Data Archive[C].DC-2012,Kuching,Sarawak,Malaysia,2012.
[12] List of Metadata Standards[EB/OL]. [2014-01-02].http://www.dcc.ac.uk/resources/metadata-standards/list?page=3.
[13] Matthews B,Sufi S,Flannery D,et al.Using a core scientific metadata model in large-scale facilities[J].International Journal of Digital Curation,2010,5(1):106-118.
[14] Simmhan Y L,Plale B,Gannon D.A survey of data provenance in e-science[J].ACM Sigmod Record,2005,34(3):31-36.
[15] Buneman P,Khanna S,Wang-Chiew T.Why and where:A characterization of data provenance [M].Database Theory—ICDT 2001.Springer Berlin Heidelberg,2001:316-330.
[16] Simmhan Y L,Plale B,Gannon D.A survey of data provenance techniques[D].Computer Science Department,Indiana University,Bloomington IN,2005.
[17] Simmhan Y L,Plale B,Gannon D.A framework for collecting provenance in data-centric scientific workflows[C].Web Services,2006.ICWS'06.International Conference on.IEEE,2006:427-436.
[18] Ember C,Hanisch R.Sustaining Domain Repositories for Digital Data:A White Paper [EB/OL].[2014-09-02].http://datacommunity.icpsr.umich.edu/sites/default/files/WhitePaper_ICPSR_SDRDD_121113.pdf.
[19] Arif Shaon,Andrew Woolf.Long-term Preservation for Spatial Data Infrastructures:a Metadata Framework and Geo-portal Implementation [J].D-Lib Magazine,2011,17(9/10).
[20] Gunia B,Sandusky R J.Designing metadata for long‐term data preservation:DataONE case study [J].Proceedings of the American Society for Information Science and Technology,2010,47(1):1-2.
[21] Hitchcock S,Brody T,Hey J M N,et al.Preservation Metadata for Institutional Repositories[EB/OL].[2014-08-09].http://preserv.eprints.org/papers/presmeta/pm-p aper-draft.html.
[22] Patel M.Preservation Metadata for Crystallography Data[EB/OL].[2014-08-09].http://wiki.ecrystals.chem.soton.ac.uk/images/9/9d/ECrystals-WP4-PM-Final.pdf.
[23] Qin J,Ball A,Greenberg J.Functional and Architectural Requirements for Metadata:Supporting Discovery and Management of Scientific Data [C].Twelfth International Conference on Dublin Core and Metadata Applications.University of Bath,2012.
[24] Alison Chilvers,John Feather.The Management of Digital Data:A Metadata Approach[J].The Electronic Library,1998,16(6):365-372.
[25] Singh G,Bharathi S,Chervenak A,et al.A metadata catalog service for data intensive applications[C].Supercomputing,2003 ACM/IEEE Conference.
[26] Jones M B,Berkley C,Bojilova J,et al.Managing scientific metadata[J].Internet Computing,IEEE,2001,5(5):59-68.
[27] Steinhart G.DataStaR:A Data Sharing and Publication Infrastructure to Support Research[J].Agricultural Information Worldwide,2011,4(1):16-20.
[28] Lowe B.Datastar:Bridging XML and OWL in science metadata management[M].Metadata and Semantic Research.Springer Berlin Heidelberg,2009:141-150.
[29] PURR:A Research Data Curation Service Model Using HUBzero[EB/OL].[2014-08-07].https://hubzero.org/re sources/795.
[30] Kim T J.Metadata for geo-spatial data sharing:A comparative analysis[J].The Annals of Regional Science,1999,33(2):171-181.
[31] 刘海行.基于元数据检索结合动态可视化技术的海洋科学数据共享研究[EB/OL].[2014-09-02].http://222.66.161.186/projectDetail/?id=1695.
[32] 王国复,涂勇,王卷乐,等.科学数据共享中的元数据技术研究[J].中国科技资源导刊,2008,40(1):30-36.
[33] 王培正,张志强,吴一民.科学数据共享方式研究[J].科技管理研究,2010,(17):201-204.
[34] 诸云强,孙九林,廖顺宝,等.地球系统科学数据共享研究与实践[J].地球信息科学学报,2010,12(1):83-90.
[35] 袁雪梅,蒋永国,郭忠文.海洋数据信息共享平台关键技术研究与实现[J].中国海洋大学学报 (自然科学版),2010,40(12):147-153.
[36] 李雪山,熊燕.基于元数据的交通科学数据共享平台的设计与实现[J].铁路计算机应用,2006,16(1):24-26.
[37] 周宝平.论科学数据共享平台的设计与实现[J].山西科技,2010,(2):48-49.
[38] 张英俊.基于元数据技术的科学数据共享平台设计与实现[J].太原科技,2008,(10):9-11.
[39] Advanced Visualization of Scientific Metadata[EB/OL].[2014-08-10].https://www.ciesin.columbia.edu/codata/WT_fullsize.pdf.
[40] 吴丹.近五年国内外元数据研究进展[A].图书馆学研究进展[M].武汉:武汉大学出版社,2010.
[41] 科学数据共享核心元数据标准[EB/OL].[2014-08-10].http://123.127.36.192/UploadFiles/2012/11/201211131151192255.pdf.
[42] 科学数据库核心元数据标准[EB/OL].[2014-08-10].http://www.csdb.cn/upload/101205/1012052006066160.pdf.
[43] 人地系统主题数据库元数据标准[EB/OL].[2014-08-10].http://www.csdb.cn/upload/101205/1012052007131140.pdf.
[44] 土壤科学数据库元数据标准[EB/OL].[2014-08-10].http://www.csdb.cn/upload/101205/1012052007256160.pdf.
[45] 数据集核心元数据标准[EB/OL].[2014-08-10].http://www.nsdc.cn/upload/110526/1105261308547770.pdf.
[46] Publisher,Repository and Institutional Metadata Exchange[EB/OL].[2014-09-03].http://www.jisc.ac.uk/whatwedo/programmes/di_researchmanagement/managingresearchdata/research-data-publication/prime.aspx.
[47] ESPAS[EB/OL].[2014-09-03].http://europa.eu/espas/.
[48] Data and Metadata Extensions of the CESSDA RI(D8.3)[EB/OL].[2014-09-02].http://cessda.org/project/doc/D8.3_Data_metdata_enhancement.pdf.
[49] Data Preservation in the Social Sciences[EB/OL].http://www.cessda.org/project/doc/D10.4_Data_Formats.pdf.
[50] 黄筱瑾.基于元数据的科学数据与科技文献关联研究[J].情报理论与实践,2013,36(7):27-30.
[51] 张宇,蒋东兴,刘启新.基于元数据的异构数据集整合方案 [J].清华大学学报 (自然科学版),2009,49(7):1037-1040.
[52] Research and Best Practices in Linking Scientific Metadata[EB/OL].[2014-01-10].http://tm.durusau.net/?p=9963.
[53] Anneke Zuiderwijk,Keith Jeffery,Marijn Janssen.The Potential of Metadata for Linked Open Data and Its Value for Users and Publishers[J].JeDEM,2012,4(2):222-244.
[54] Howe B,Tanna K,Turner P,et al.Emergent semantics:Towards self-organizing scientific metadata [M].Semantics of a Networked World.Semantics for Grid Databases.Springer Berlin Heidelberg,2004:177-198.
[55] Gil Y,Ratankar V,Hanson P.Organic data publishing:a novel approach to scientific data sharing [C].Proceedings of the 2nd international workshop on linked science,2012:951.
[56] Qin J,Chen M,Liu X,et al.Linking entities in scientific metadata [C].International Conference on Dublin Core and Metadata Applications,2010:128-136.
[57] 徐维,邱君瑞,朱妍昕,等.前瞻性临床研究元数据语义结构体系的建构[J].图书情报工作,2012,56(16):108-112.
[58] Movva S,Ramachandran R,Li X,et al.Syntactic and semantic metadata integration for science data use[J].Computers&geosciences,2005,31(9):1126-1134.
[59] Chen Xu,Zhu Xinya,Du Daosheng.Ontology based semantic metadata for imagery and gridded data[EB/OL].[2014-01-10].http://www.isprs.org/proceedings/XXXVII/congress/2_pdf/6_WG-II-6/11.pdf.
[60] Chen M,Plale B.From metadata to ontology representation:A case of converting severe weather forecast metadata to an ontology[J].Proceedings of the American Society for Information Science and Technology,2012,49(1):1-4.