APP下载

科技服务资源数据规范设计
——以知识产权、科技咨询为例

2022-01-10刘家强郭玉洁张文博周英华丁青艳

中国科技资源导刊 2021年6期
关键词:实体知识产权规范

刘家强 何 钰 郭玉洁 张文博 吴 超 周英华 丁青艳

(1. 中国科学技术大学计算机科学与技术学院,安徽合肥 230026;2. 中国科学技术大学网络信息中心,安徽合肥 230026;3. 山东省计算中心(国家超级计算济南中心),山东济南 250014)

0 引言

随着知识经济时代的到来,科技服务业蓬勃发展,为社会提供了高效的支持。科技服务的有效实施建立在丰富多元的科技资源[1-4]之上,科技资源共享有利于科技服务的普及,促进科技成果转化,带动科技的创新发展,且与经济发展具有强相关性[5-7]。科技服务资源是科技服务过程中的相关资源,是科技资源的重要组成部分[3],为科技服务中的供需双方提供了沟通和合作的桥梁。然而,科技服务信息化平台基础建设还远未达到完善的地步。在信息技术日益发达的形势下,各地的企业和机构缺乏统一的信息系统,这些分散的系统之间没有统一的标准和规范,致使科技服务资源分散,资源集成化不高,用户在寻求科技服务资源时操作成本较高,服务效率较低,甚至很难知晓目标资源的存在与否,难以做到高效的科技服务资源共享。

为了更好地建立科技服务资源共建、共享、共用平台,急需将分散异构的科技服务资源进行抽取存储,形成重点领域和产业集群的科技服务资源池。然而,科技服务资源分散在各个不同的地理位置,数量繁多且格式不统一,给科技服务资源池的构建带来了很大的难度。制订良好的数据规范,不仅可以有效地描述科技服务资源,也可以保障高效集成科技服务资源。鉴于此,本文将选取知识产权和科技咨询两类科技服务资源进行元数据描述方案的设计,分析知识产权服务资源和科技咨询服务资源的实体属性和实体间联系,进而设计元数据核心元素,以更高效地集成区域内的科技服务资源,更好地服务于科技服务共享。

1 科技服务资源集成

科技服务资源对科技活动具有十分广泛的支撑作用,涉及领域广泛,是科技服务业的重要组成部分。根据国务院科技服务业相关出台的文件精神[8],科技服务资源可以分为研发设计、技术转移、检验检测认证、知识产权、产业孵化、科技金融、军民融合、科技咨询服务资源,如图1所示。其中,研发设计资源主要面向科研团队,包含了科研项目申报政策、科研服务团队信息和大型仪器设备信息;技术转移资源集成了科技企业的技术需求和技术成果,旨在帮助用户更好地实现技术成果的转移和技术需求的对接;检验检测认证资源汇集了检验检测机构等信息;知识产权资源主要包含了专利资源、专利申请代理商信息和商标申请代理商信息;产业孵化资源旨在更好地帮助创业项目提供更好的发展环境,能有效地帮助创业者和创业园区之间的对接,促进大众创业;科技金融资源旨在为用户提供科技金融咨询和数据服务,主要包括科技金融机构发布的融资信息,来自企业的带宽需求等;军民融合资源内容主要包括民参军自测服务、民参军可行性分析服务、军地需求对接服务、资质辅导服务、军地专家服务、项目申报咨询等;科技咨询服务资源包含了专家库、专家信息和专家的成果信息等。

图1 科技服务资源分类

我国科技产业众多,科技服务资源类型多样,存在形式复杂,并且学科领域涉及广泛。随着社会和科技的演进,各省市的科技服务产业自成体系,科技服务资源在各地各机构以不同形式不同结构存放,并且各区域的经济和科技发展程度不一,当前我国的科技服务资源松散孤立、缺少有效的互通协作和同步管理、资源集成度不高、利用率较低,致使科技服务开展困难,科技成果转化缓慢。目前,科技服务资源还不能全面满足多样化协同共享的需求,深入研究集成这些分散异构、复杂多样的科技服务资源,是高效科技服务资源共享的必要条件[9]。

设计元数据规范是实现科技服务资源集成的有效手段,在科技服务资源池接入整合科技服务资源中发挥了重要作用。如图2所示,在中原城市群综合科技服务资源池的构建中,元数据规范在资源接入和整合的过程中发挥了重要作用。整体而言,面对多源异构的科技服务资源,元数据规范为数据抽取提供了规范化的标准,有效解决了数据之间描述不一致的问题。此外,根据领域特点和业务需要,选取合理的元数据分类将更加有利于科技服务资源的关联聚合和上游业务开发,如管理元数据、服务元数据及技术元数据。对于抽取到的科技服务资源,资源池对其进一步完成元数据识别、数据清洗等标准化过程,最终以持久化的方式存储于数据库中,为上层的科技资源服务提供有效的支撑。

图2 中原城市群科技服务资源池资源集成框架

从上述中原城市群科技服务资源池的例子可以看出,良好的元数据规范设计是科技服务资源集成的保障。本文将以知识产权及科技咨询科技服务资源为例,对其进行分析并设计元数据规范,为集成科技服务资源提供基础依据,推动实现科技服务资源的协同共享。

2 科技服务资源元数据规范设计

合理准确的元数据规范设计是科技服务资源接入集成的高效保障,也是科技服务平台为用户提供科技服务的有力要素。简而言之,科技服务可以理解为用户与其感兴趣的科技服务资源进行定位匹配的一个过程。然而,现有的科技服务资源数据往往规模庞大,尚未得到较好的分类整理,用户难以快速准确地对目标科技服务资源进行定位和评估,科技服务效率较低。因此,科技服务资源元数据规范的设计原则为:使用简洁易复用的描述抽取科技服务资源的关键信息,在数据集成的过程中消除冗余和解决数据规范不统一的问题,方便用户能够快速地检索到所需科技服务资源。在此原则上,本节以知识产权服务资源和科技咨询服务资源为例,对科技服务资源元数据规范的设计方法、流程及结果进行叙述。

2.1 科技服务资源实体及关系分析

在进行数据规范设计时,了解科技服务资源的有关实体及其属性是十分必要的。本节将对知识产权服务资源和科技咨询服务资源两个领域进行调查分析,识别其中的实体和相关属性及实体之间的关系,以帮助设计准确的科技服务资源元数据规范。

(1)科技服务资源实体概况

和其他服务行业一样,科技服务同样由服务供给方和服务需求方组成。如针对知识产权和科技咨询领域:专利/商标代理商在自己的网站上发布信息,提供如服务类型、服务流程及机构基本信息等;知网等信息平台根据专家信息进行分类整理,为用户提供检索查询入口。服务需求方则根据自己的需求寻求匹配的服务提供方。根据对知识产权和科技咨询服务的现状,将其中的实体归纳为两类:一是组织机构实体,主要包括提供服务的机构或专家所属单位,比如专利代理商、商标代理商、科技咨询平台、专家在职单位等;二是知识产权成果实体,主要包括如专利、商标、专家发表的文献出版物等。

(2)科技服务资源实体详细属性

知识产权服务资源主要包括专利信息、软件著作权信息、商标信息及相关的申请代理商。在知识产权领域方面,国家知识产权局政务服务平台[10]、中国知网[11]专利检索板块、万方数据[12]专利检索板块、中国商标网[13]等信息共享平台覆盖了主要的知识产权服务资源信息。这些信息共享平台的运行模式大致相同:首先由知识产权申请者准备申请材料,材料中包括对该知识产权的详细描述;然后直接提交,或者转交第三方代理,由代理提交给审核方;最后审核通过后将被展示在信息共享平台,信息展示平台将根据资源的类别和内容进行整理,以方便快捷的方式供需求方检索。

根据对知识产权领域相关信息共享平台的分析归纳,相关实体、实体属性及实体间联系如图3所示。

图3 知识产权科技服务资源相关实体属性及实体间联系

在科技咨询领域方面,常见的服务模式为咨询请求方直接或者通过中间平台联系专家,向专家描述其咨询需求,而后专家给出咨询意见。科技咨询领域主要的信息资源为各领域的专家信息,常见的可以检索到专家信息的平台有:万方数据的中国科技专家库[14]、中国知网的CNKI学者库[15]、百度学术[16]的学者主页及各高校教师信息板块中或者专家自建的个人主页等。对于这些平台,主要有两种方式运行:一是专家主动注册,填写个人信息并展示给外界;二是平台通过智能算法提取出数据库中相关成果的相关专家信息,使两者相关联。

在分析学者库及专家主页方面,专家信息主要可以分为4类:①个人基本信息,如姓名、年龄、联系方式等;②工作信息,包括工作单位、职称及其主要从事的领域;③履历信息,如求学经历、项目研发经历;④奖励荣誉经历,指该专家获得过的各种奖项荣誉,表示其在领域内的权威度。经过分析归纳,科技咨询服务资源相关实体属性及实体间联系如图4所示。

图4 科技咨询服务资源相关实体属性及实体间联系

尽管有很多信息共享平台提供了丰富的知识产权服务资源和科技咨询服务资源,但是目前仍存在许多尚未被集成的相关资源。此外,这些信息共享平台往往对资源的描述不尽一致,没有统一的规范,彼此之间容易形成数据孤岛。通过抽取这些信息共享平台之间共同的实体及实体属性和实体间联系,有利于设计统一的数据规范,更好地帮助数据集成,从而实现资源共享。

2.2 科技服务资源元数据规范定义

元数据是关于数据的信息,是具有描述、解释、定位信息资源功能的结构化信息,是说明数据内容、质量、状况及其他有关特征的描述信息[17]。元数据规范了资源数据的使用,为多源异构数据的管理提供了便利。本节将结合上一小节对知识产权服务资源和科技咨询服务资源的实体分析,设计出适用的元数据规范,为科技服务资源集成和共享提供更好的帮助。本文将实体的属性转化为3种元数据,即管理元数据、服务元数据和技术元数据。其中,管理元数据主要用于管理资源池中科技服务资源的基本属性;服务元数据对科技服务资源的类别和概况进行规范描述,使得需求方可以快速匹配需求;技术元数据用于描述其他更为详细的科技服务资源。

基于上一小节对实体信息的归纳和总结,对知识产权元素集和专家基本信息元素集分级整理如图5、图6所示。在设计科技服务资源元数据规范时,已有的元数据标准可以作为参考标准,如都柏林核心元数据标准[18]、FOAF[19]等元数据标准。尽管这些元数据标准简单明了,具有通用性,但是这些通用的元数据标准对科技服务资源领域特性仍缺少完善的考虑。

图5 知识产权元素集

图6 专家基本信息元素集

除了这些通用的元数据标准,也存在一些具有较强领域特性的元数据标准,如FGDC、ISO/TC 211、Darwin Core、CF等,这些元数据标准在诸如地理、生物、气象学等领域得到了广泛应用。针对科技服务资源领域,本文参考已有的元数据标准,设计知识产权和科技咨询服务资源元数据规范,如表1、表2所示。

表1 知识产权服务资源元数据规范

表2 科技咨询服务资源元数据规范

3 数据规范应用示例

元数据规范在科技服务共享平台中发挥着重要的作用。本节以中原城市群综合科技服务平台[21]为例,简要说明元数据规范在其中的应用。

图7展示了中原城市群综合科技服务平台整体的数据交互过程,根据资源特点和业务需求,平台制定相应的元数据规范,并将元数据存放于元数据库,由元数据管理系统对其进行维护和更新,元数据管理系统支持着用户对平台的内容检索。合理的元数据规范对数据的高效集成与维护及对用户检索的快速响应都起到了重要的支撑作用。

图7 中原城市群综合科技服务平台数据交互过程

在科技服务的不同业务阶段中,业务需求和实现的不同,对应着使用不同类别的元数据规范。如图8所示,中原城市群综合科技服务平台的业务流程可以划分为以下4个阶段:一是平台注册。在此阶段,平台进行注册,并对集成的科技服务资源进行分类整理,对资源概况进行数字化和可视化展示。此阶段会产生机构基本信息、科技服务资源数量统计等管理元数据。二是服务发布。在此阶段,平台发布服务信息吸引用户前来使用,包括服务的类型、以往的服务信息等供用户参考。三是服务匹配。用户在平台找到了匹配的需求后,达成服务匹配,产生订单管理信息,包括订单编号、订单状态等服务元数据。四是服务实现。在此阶段,需求方提供其科技服务需求,平台帮助需求方和服务提供方/服务资源完成对接,促进实现后续的具体服务。

图8 中原城市群综合科技服务平台业务流程

4 总结及展望

尽管科技服务资源丰富多样,但是彼此间往往多源异构且松散孤立,不利于科技服务资源协同共享的发展,通过设定良好准确的元数据规范,可以更好地集成科技服务资源,并方便用户高效快捷地检索到需求的资源。本文以知识产权服务资源和科技咨询服务资源两个领域为例,分析已有的信息共享平台,归纳总结出其中的实体、实体属性及实体间联系,而后设计出通用的元数据规范,以促进科技服务资源的集成和共享。本文提出的设计方法充分考虑了科技服务资源在不同平台的存储形式,设计的元数据规范可以有效规范化现有的资源数据,并且本文提出的元数据规范设计方法已在中原城市群科技服务资源池的设计中得到了成功的应用,为科技服务资源的集成接入提供有力的支撑。下一步的工作重点是扩展方法可以同时考虑更多类型的科技服务资源,并开发工具使得整个流程自动化、模块化。

猜你喜欢

实体知识产权规范
来稿规范
来稿规范
PDCA法在除颤仪规范操作中的应用
来稿规范
Mesenchymal stromal cells as potential immunomodulatory players in severe acute respiratory distress syndrome induced by SARS-CoV-2 infection
前海自贸区:金融服务实体
实体的可感部分与实体——兼论亚里士多德分析实体的两种模式
重庆五大举措打造知识产权强市
两会进行时:紧扣实体经济“钉钉子”
振兴实体经济地方如何“钉钉子”