科技资源描述模型和建立方法研究
2020-08-04顾复刘杨圣彦顾新建
顾复刘 杨圣彦 顾新建
摘要:[目的/意义]科技创新是我国发展的关键途径,需要科技资源的共享和协同创新。科技资源共享是一个系统工程,需要建立科技资源的描述模型,在此基础上进行科技资源集成、评价和分享。[方法/过程]提出科技资源描述模型的结构框架,包括:科技资源分类模型、科技资源元数据模型、科技资源本体模型、科技资源知识元模型、科技资源图谱模型等。其中,科技资源包括知识、数据、产品、人才、软件、硬件等资源。本文阐述了科技资源描述模型的特点和作用,并给出科技资源描述模型的建立方法。[结果/结论]本文的主要贡献是:①通过科技资源描述模型的规范化,有助于不同类型的科技资源的集成分享;②通过科技资源的不同类型的描述模型的集成研究,形成科技资源描述模型的体系架构,为进行科技资源的全面系统描述提供整体解决方案,有助于解决科技资源共享难的问题;③提出科技资源描述模型的建立方法,其特点是利用新一代信息技术依靠大众共建模型,依靠科技资源描述过程的大数据智能分析技术,建立和优化科技资源描述模型。
关键词:科技资源;科技资源描述模型;模型建立方法;科技资源共享;知识图谱
分类号:G311
引用格式:顾复, 刘杨圣彦, 顾新建. 科技资源描述模型和建立方法研究 [J/OL]. 知识管理论坛, 2020, 5(2): 69-81[引用日期]. http://www.kmf.ac.cn/p/201/.
1 引言
习近平总书记在中国科学院第十九次院士大会、中国工程院第十四次院士大会上的讲话中指出:科技体制改革还存在一些有待解决的突出问题,主要是国家创新体系整体效能还不强,科技创新资源分散、重复、低效的问题还没有从根本上得到解决。
规范、合理、科学的科技资源描述方法是解决科技资源分散、重复、低效问题的有效方法之一。利用科技资源描述方法可从不同角度对科技资源进行规范化,有效支持科技资源的集成、评价和共享。科技资源包括知识、数据、产品、人才、软件、硬件等不同类型。在这方面已经有不少的研究与应用,但还存在一些不足和进一步的需求:
(1)现有的研究主要集中在对不同类型的科技资源进行各自的描述,但缺乏对不同类型的科技资源进行統一描述,这对不同类型的科技资源的统一搜索和集成不利。例如,对知识图谱的研究较多[1],而科技资源图谱包括数据、产品、人才、软件、硬件等的“图谱”,这种研究还是比较缺乏。在中国知网中利用“科技资源图谱”作为主题词搜索,搜索到的结果为0条,而利用“知识图谱”作为主题词搜索,搜索到10 542条结果。
(2)人们已经对一些科技资源的分类模型、元数据模型、本体模型、知识元模型、知识图谱等进行了分别研究,并且已经有一些国家标准。王志强、杨青海等认为:科技资源开放共享过程中产生了数量庞大、种类繁杂的标准规范,这些标准规范对推动科技资源建设发挥了重要作用,但是也存在着一些问题,如缺乏全局性顶层设计,没有形成统一的标准化建设体系框架[2]。需要进一步对这些模型进行集成统一研究,并用于科技资源的描述。
(3)在现有的研究中,对知识资源的描述已经有比较系统的方法,需要将这些方法扩展到其它类型的科技资源。
笔者将对这些问题进行研究,这有助于科技资源的描述方法的规范化、以及解决科技资源共享难的问题。
2 科技资源描述模型的结构框架
科技资源描述是科技资源的一种“画像”,是对科技资源的分类,是对科技资源的有序化,能够帮助用户快速搜索到所需要的科技资源和了解科技资源的主要内容,促进科技资源相互之间的快速集成,解决数据格式不一致和同一概念描述不一致的问题。图1为科技资源描述模型的结构框架,图2为科技资源描述模型间的关系。
科技资源描述模型中的各子模型定义如下:科技资源分类模型——描述科技资源的分类信息,以便找到所需要的科技资源;科技资源元数据模型——描述科技资源的主要数据格式,以便科技资源的快速集成;科技资源本体模型——对科技资源的规范性描述,以便准确、全面地找到所需要的科技资源;科技资源知识元——对科技资源内容进行简要描述,以便快速了解科技资源的主要内容;科技资源图谱模型——简要描述科技资源概念间的关系,以便科技资源的搜索和推理。
在科技创新和其他科技工作中,往往需要多种不同类型的科技资源的集成使用,如某研究任务,需要能胜任的研发人员(从人才资源中选择)、与研发任务相关的产品资源(参考相似产品,提高研发效率)、知识资源(如产品原理,产品可制造性、可装配性、可维护性等知识)、数据资源(如相似产品的历史使用数据、维护数据等)、软件资源(帮助研发的计算机辅助软件)、硬件资源(如实验设备、测试仪器等)。
3 科技资源分类模型及建立方法
3.1 科技资源分类模型的定义
科技资源分类模型是把具有某种属性或特征的科技资源信息归并起来,通过其属性或特征来区别不同类别的科技资源信息[3]。根据不同的科技资源及需求,科技资源分类模型可以分为以下两种:
(1)树状结构的科技资源分类模型。这是采用数字或字母的形式,按照分类编码的一般原则与方法,对科技资源进行统一分类和编码,具有层次性和系统性的特点,可以确定任一科技资源在科技资源体系中的位置与相互关系。树状结构的科技资源分类模型又被称为科技资源分类编码体系[4]、科技资源分类目录、科技资源标识体系等。与科技资源分类相近的分类编码体系有制造业信息化服务平台服务资源分类编码[5]、网络化制造环境下的制造资源分类编码[6]、企业信息分类编码[7]等。具体的科技资源的分类编码标准已经有工艺分类编码[8]、零件分类编码[9]等。
树状结构的科技资源分类模型首先按照科技资源的性质不同进行基本分类。表1介绍了科技资源现有的一些分类理论,体现了科技资源分类的多样性。
其中:中国科技资源代号为CSTR;科技资源标识注册机构代码为5位码;科技资源类型代码为2位码;内部标识符不定长,由科技资源标识注册机构分配,确保在同一科技资源标识注册机构注册的每个科技资源的内部标识符的唯一性。
该方法的缺点是:对于同一科技资源(如某科技文献),不同科技资源标识注册机构给出的科技资源标识符是不同的。但如果不考虑科技资源标识注册机构,面对如此众多的科技资源,要建立统一的科技资源标识符是很难的。
(2)关键词结构的科技资源分类模型。采用关键词或者标签(tag)等方式进行科技资源的属性或特征的表征和描述。这里的关键词或者标签往往是大众编制,所以又称大众分类法。这类分类体系比较适合互联网中的资源分享[18]。表2为两种科技资源分类模型的比较:
3.2 科技资源分类模型的需求
科技资源分类模型的需求主要包括如下几个方面:
(1)有助于科技资源的统一有效组织管理和共享服务;
(2)通过建立科技资源的分级标准,支持科技资源的开放和共享;
(3)具有规范化和标准化的特性,支持科技资源的供需匹配;
(4)可以快速定位到所需要的科技资源,支持科技资源共享。
3.3 科技资源分类模型的建立方法
(1)树状结构的科技资源分类模型的建立方法。本文主要关注企业、平台的科技资源分类模型。因为国际、国家的科技资源分类模型比较宽泛,难以满足具体企业、平台的具体需求。
本文参考《中国图书馆分类法》《GB/T 32843-2016科技资源标识》、国际专利分类体系(IPC)等分类体系,在此基础上进行扩展建立企业或行业平台的科技资源分类模型。《中国图书馆分类法》(简称《中图法》)是当今国内图书馆使用最广泛的分类法体系。目前国际上主要的专利分类体系有国际专利分类体系(IPC)、日本专利分类体系(FI/F-term)、美国专利分类体系(USPC)、欧洲专利分类体系(ECLA/ICO)以及联合专利分类(CPC)等。在知识资源分类方面可以参考《GB/T 23703.7-2014知识管理 第7部分:知识分类通用要求》。
细分类别的科技资源可以参考一些现有标准,2020年1月29日在国家标准信息查询平台(http://www.gov.cn/fuwu/bzxxcx/bzh.htm)输入“分类”搜索到国家标准620个、行业标准704个、地方标准134个。其中不少具有参考价值。
科技资源的树结构分类体系由本领域专家编制,将科技资源归入对应的子类,检索时可按树状结构一层一层地找到所需要的科技资源。科技资源的树结构分类体系的建立应遵循科学性、系统性、可延性和兼容性的原则,要尽可能请领域专家参与。
科技资源的内容和概念随时间不断变化,科技资源分类模型需要与时俱进,不断维护,或者在编码搜索系统中建立对应表,实现在不同时期的科技资源分类模型的统一搜索,这样可以解决传统的科技资源分类模型修改难、灵活性差等问题。例如,通过构建基于互联网的科技资源分类模型建立、维护和应用平台,来提高传统科技资源分类模型的灵活性和易维护性。
(2)关键词结构的科技资源分类模型的建立方法。主要采用大众分类法,即关键词或标签是由大众自己选择。①关键词的定义:出现在文献的标题、摘要以及正文中,能够表达文献主题内容、可作为检索入口的未经过规范化的自然语言词汇[19]。②标签的定义:不依赖于固定分类,通过用户针对内容添加的简短描述,以方便搜索[20]。
关键词结构的科技资源分类模型最大的问题是随意性较大、规范性较弱,这显著增加了搜索或匹配科技资源的难度。但在互联网环境中,随着关键词或标签用户数的增加,这种随意性将会显著减少,因为如果科技资源发布者所采用的关键词或标签太随意、不规范,就会使其发布的科技资源难以被人搜索和利用,达不到其发布科技资源的目的;同样,如果科技资源搜索者所采用的关键词或标签不规范,就会使其难以搜索到想要的科技资源。最终对于同一科技资源,大家就会趋向于采用同样的关键词或标签。这是一种自组织优化的模式,互联网平台要为促进关键词或标签的自组织优化提供良好的环境。例如,当用户输入关键词或标签时,平台提示该关键词或标签是否是常用的,并根据科技资源的特点智能推荐常用的关键词或标签。
关键词或标签可以采用本体模型进行优化,提高基于关键词或标签的科技资源的搜准率和搜全率,具体见第5节。
4 科技资源元数据模型及建立方法
4.1 科技资源元数据模型的定义
科技资源元数据规范了科技资源描述空间的维度,是描述数据的数据(data about data),用于描述科技资源(包括实物资源和信息资源)的内容、覆盖范围、质量、管理方式、数据的所有者以及提供方式等有关信息的数据[28]。关于元数据有不同的定义:
(1)关于数据的数据[21]。
(2)定义和描述其他数据的数据[22]。
(3)关于数据或数据元素的数据(可能包括其数据描述),以及关于数据拥有权、存取路径、访问权和数据易变性的数据[23]。
(4)描述数据及其环境的数据[24]。
(5)描述物联网数据及其相关信息的数据[25]。
(6)关于数据的数据,主要是描述数据属性(property)的信息[26]。
(7)描述科技报告的一种结构化数据,用于实现检索、管理、使用、保存等功能[27]。
這种元数据定义的多义性说明了建立统一的科技资源元数据的难度。
科技资源的元数据包括:科技资源名称、类型、发布者、发布时间、存放地点、关键词等[28]。对不同的科技资源(如知识、数据、人才、产品、软件、硬件等)有相应的元数据模型,有些已经有标准,需要考虑尽可能采用。
4.2 科技资源元数据模型的需求
不同的人对科技资源描述空间的维度往往有不同的定义,这就导致了科技资源集成难和搜索难。科技资源元数据通过对科技资源对象进行统一规范描述,有助于对科技资源的组织、集成、检索、发现和管理[30]。
4.3 科技资源元数据模型的建立方法
(1)参考已有的科技资源元数据模型,调查搜集尽可能多的科技资源元数据,建立科技资源元数据参考模型库。2020年1月29日在国家标准信息查询平台(http://www.gov.cn/fuwu/bzxxcx/bzh.htm)输入“元数据”搜索到国家标准66个、行业标准53个、地方标准24个。例如,目前已经有《GB/T 36478.3-2019 物联网 信息交换和共享 第3部分:元数据》《GB/T 38154-2019重要产品追溯 核心元数据》《GB/T 37282-2019 产品标签内容核心元数据》《GB/T 37600-2018 全国主要产品分类 产品类别核心元数据》《GB/T 35430-2017 信息与文献 期刊描述型元数据元素集》《GB/T 35397-2017 科技人才元数据元素集》《GB/T 30535-2014科技报告元数据规范》《GB/T 30523-2014 科技平台 资源核心元数据》《GB/T 30522-2014 科技平台 元数据标准化基本原则与方法》《GB/T 30522-2014 科技平台 元数据标准化基本原则与方法》《GB/T 26499.3-2011机械 科学数据 第3部分:元数据》《GB/T 25100-2010信息与文献 都柏林核心元数据元素集》《GB/T 24662-2009 电子商务 产品核心元数据》《GB/T 18391-2009信息技术 元数据注册系统(MDR)》《GB/T 22373-2008 标准文献元数据》《GB/T 22373-2008 标准文献元数据》等。
(2)从科技资源元数据参考模型库中,根据需要选择合适的科技资源元数据。如果元数据数量太多,使用不便;元数据数量太少,则描述不完整。需要进行元数据的相关性分析,去掉相关性较大的两个元数据中的一个;需要进行元数据的重要性评价,把对科技资源描述价值相对较小的元数据去掉;元数据的数量最终要考虑科技资源描述的完整性、特征可识别性、可分类性等;元数据的数量还与科技资源的其他具体描述需求有关;元数据选择与元数据建立和管理的信息化水平有关,当信息化较高时,元数据的数量可以多些。
(3)科技资源元数据类型可以由专家协商确定,也可以通过大数据分析得到,或者由专家协商和大数据分析共同得到。
(4)协同建立科技资源元数据模型的标准。该标准涉及面广、用户多,因此可以采用维基(Wiki)模式,组织广大用户参与,协同提出和修改科技资源元数据模型的标准。
科技资源核心元数据的定义是:描述科技资源最基本信息的元数据最小集合(修改自GB/T 30523-2014科技平台 资源核心元数据),包括:科技资源中文名称和英文名称、科技资源发布者、科技资源发布时间(最近提交日期)、科技资源存放地点(信息链接地址)、科技资源知识元、科技资源关键词(或标签)、科技资源标识编码、科技资源标准本体和关联本体。
元数据建立方法可以参考《GB/T 30522-2014 科技平台 元数据标准化基本原则与方法》《GB/T 26499.3-2011机械 科学数据 第3部分:元数据》。
5 科技资源本体模型及建立方法
5.1 科技资源本体模型的定义
本体没有统一的定义,以下给出一些不同领域的国家标准对本体的定义:
(1)在大数据语境下,它是一些约束后续各种不同层次逻辑模型的语义模型[19]。
(2)计算机科学领域的一种模型,用于描述用一套对象类型(概念或者说类)、属性以及关系类型所构成的世界[31]。
(3)被表述为一系列相互关联的概念与定义,这种表述类似于叙词表中的术语。但是,本体不是术语标准[32]。
(4)使用计算机能够处理的语言对论域的描述[33]。
(5)在文化遗产信息资源领域,基于本体的模型用于将异构、分散的文化遗产信息源进行集成、交换,有助于形成通用的、规范的本体模型,给领域专家对信息的编制和关联检索提供指南[34,36]。
许多领域需要通过本体构建,实现相关业务的标准化工作;同时,本体也是基于Web应用的互操作问题的关键。因此业界正在陆续制定相关的本体标准。
本文对科技资源本体定义是:科技资源本体模型规范了同一科技资源的名称术语及不同名称术语间的关系。
5.2 科技资源本体模型的需求
不同的人对科技资源往往有不同的名称术语及名称术语的关系,这就导致了科技资源集成难和搜索难。面对庞大的科技资源和名称,主要存在以下问题:
(1)有时同一科技资源有多种名称术语,一种名称术语描述多种不同的概念,这对科技资源的集成带来诸多不便。一方面需要通过标准化、规范化的方法解决这些问题,例如,采用数据字典[35]-[36]等方式;另一方面可以通过本体方法,建立标准本体和关联本体。标准本体对应描述某一概念的标准术语,关联本体对应描述这一概念的其他术语。在信息搜索时标准本体与关联本体一起用于搜索。科技资源本体模型通过对科技资源对象进行统一规范的描述,有助于对科技资源的组织、集成、检索、发现和管理。
(2)有时同一科技资源有多种概念结构,这对科技资源的集成也带来诸多不便。本體有助于解决同一概念的名称多样化问题和概念结构混乱带来的问题。名称多样化问题会进一步导致科技资源共享和利用中出现如下问题:①搜索到的科技资源信息不完整;②搜索到的科技资源信息不准确;③科技资源信息集成难。概念结构混乱会带来科技资源分类混乱、资源集成难和搜索难的问题。而科技资源本体模型,有利于实现科技资源的共享、集成、服务,例如:
参考文献:
[1] 黄恒琪, 于娟, 廖晓等. 知识图谱研究综述[J]. 计算机系统应用, 2019, 28(6): 1-12.
[2] 王志强, 杨青海.科技资源开放共享标准体系研究[J]. 中国科技资源导刊, 2016, 48(4): 19-23.
[3] 董明涛, 孙研, 王斌.科技资源及其分类体系研究[J]. 合作经济与科技, 2014(10): 28-30.
[4] 国家质量监督检验检疫总局, 国家标准化管理委员会.企业信息分类编码导则第1部分: 原则与方法:GB/T 20529.1-2006[S]. 北京: 中国标准出版社, 2007.
[5] 国家质量监督检验检疫总局, 国家标准化管理委员会.制造业信息化服务平台服务资源分类规范:GB/T 34045-2017[S]. 北京: 中国标准出版社, 2018.
[6] 国家质量监督检验检疫总局, 国家标准化管理委员会.网络化制造环境下的制造资源分类:GB/T 25111-2010[S]. 北京: 中国标准出版社, 2010.
[7] 国家质量监督检验检疫总局, 国家标准化管理委员会. 企业信息分类编码导则第2部分: 分类编码体系: GB/T 20529.2-2010[S]. 北京: 中国标准出版社, 2011.
[8] 国家质量监督检验检疫总局, 国家标准化管理委员会.面向装备制造业产品全生命周期工艺知识第2部分: 通用制造工艺分类编码规范: GB/T 22124.2-2010[S]. 北京: 中国标准出版社, 2011.
[9] 陕西省市场监督管理局.基于成组技术的零件分类编码要求:DB61/T 1224-2018[S]. 北京: 中国标准出版社, 2018.
[10] 涂勇, 龚雪媚, 赵辉.科技资源管理标准体系的研究[J]. 中国科技资源导刊, 2012(6): 41-44.
[11] 国家质量监督检验检疫总局, 国家标准化管理委员会.科技资源标识:GB/T 32843-2016[S]. 北京: 中国标准出版社, 2016.
[12] 孙凯.科技资源共享可行性分析及对策建议[J]. 西北大学学报(哲学社会科学版), 2005, 35(3): 109-112.
[13] 王雪.区域科技共享平台服务模式与运行机制研究[D]. 哈尔滨: 哈尔滨理工大学, 2015.
[14] 范菲雅, 倪炎榕, 袁晓舟, 等. 网络化制造环境下基于语义Web的应用服务资源模型[J]. 计算机集成制造系统, 2009(8): 53-59.
[15] 国家质量监督检验检疫总局, 国家标准化管理委员会.科技平台资源核心元数据:GB/T 30523-2014[S]. 北京: 中国标准出版社, 2015.
[16] 刘玲利.科技资源要素的内涵——分类及特征研究[J]. 情报杂志.2008(8): 125-126.
[17] 国家质量监督检验检疫总局, 国家标准化管理委员会.科技资源标识:GB/T 32843-2016[S]. 北京: 中国标准出版社, 2017.
[18] 顾复, 陈芨熙.一种基于标签的产品和零部件网页的自组织分类编码方法[J]. 成组技术与生产现代化, 2007, 24(2): 57-60.
[19] 国家市场监督管理总局, 国家标准化管理委员会.新闻出版知识服务知识资源建设与服务基础术语:GB/T 38377-2019[S]. 北京: 中国标准出版社, 2020.
[20] 国家质量监督检验检疫总局, 国家标准化管理委员会.信息与文献期刊描述型元数据元素集:GB/T 35430-2017[S]. 北京: 中國标准出版社, 2018.
[21] 国家质量监督检验检疫总局, 国家标准化管理委员会.信息技术元数据注册系统(MDR): GB/T 18391-2009 [S]. 北京: 中国标准出版社, 2010.
[22] 国家质量监督检验检疫总局, 国家标准化管理委员会.信息技术词汇第17部分: 数据库:GB/T 5271.17-2010[S]. 北京: 中国标准出版社, 2011.
[23] 国家质量监督检验检疫总局, 国家标准化管理委员会.物联网术语:GB/T 33745-2017[S]. 北京: 中国标准出版社, 2018.
[24] 国家质量监督检验检疫总局, 国家标准化管理委员会.物联网信息交换和共享第3部分: 元数据:GB/T 36478.3-2019[S]. 北京: 中国标准出版社, 2020.
[25] 国家质量监督检验检疫总局, 国家标准化管理委员会.科技人才元数据元素集:GB/T 35397-2017[S]. 北京: 中国标准出版社, 2018.
[26] 国家质量监督检验检疫总局, 国家标准化管理委员会.科技报告元数据规范:GB/T 30535-2014[S]. 北京: 中国标准出版社, 2015.
[27] 刘春燕, 安小米.基于生命周期的科技信息资源共享元数据研究[J]. 情报理论与实践, 2018, 41(5): 39-43.
[28] 国家质量监督检验检疫总局, 国家标准化管理委员会.科技平台资源核心元数据:GB/T 30523-2014[S]. 北京: 中国标准出版社, 2015.
[29] 赵启阳, 张辉, 王志强.科技资源元数据标准研究的现状分析与新的视角[J]. 标准科学, 2019(3): 12-17
[30] 国家质量监督检验检疫总局, 国家标准化管理委员会信息技术大数据术语:GB/T 35295-2017[S]. 北京: 中国标准出版社, 2018.
[31] 國家市场监督管理总局, 国家标准化管理委员会.信息与文献文化遗产信息交换的参考本体:GB/T 37965-2019[S]. 北京: 中国标准出版社, 2020.
[32] 国家市场监督管理总局, 国家标准化管理委员会.信息技术互操作性元模型框架(MFI)第3部分: 本体注册元模型:GB/T 32395-2015[S]. 北京: 中国标准出版社, 2016.
[33] 国家市场监督管理总局, 国家标准化管理委员会.智能运输系统 数据字典要求:GB/T 20606-2006[S]. 北京: 中国标准出版社, 2007.
[34] 国家市场监督管理总局, 国家标准化管理委员会. 新闻出版 知识服务 知识元描述:GB/T 38381-2019[S]. 北京: 中国标准出版社, 2020.
[35] 国家市场监督管理总局, 国家标准化管理委员会.基础地理信息要素数据字典 第1部分: 1∶500 1∶1000 1∶2000比例尺:GB/T20258.1-2019[S]. 北京: 中国标准出版社, 2020.
[36] 顾新建, 马步青, 代风. 基于大数据的知识共享方法研究[J]. 知识管理论坛, 2016(1): 30-38.
[37] 毕经元.基于Web2.0的知识元链接网络系统[D]. 杭州: 浙江大学, 2010.
[38] AMITS. Introducing the knowledge graph[R]. America:Official Blog of Google, 2012.
[39] 杜鹏程, 吴婷 , 王成城.科技人力资源研究领域的知识图谱分析[J]. 中国科技论坛, 2013(8): 83-89.
[40] 马亚宁. 上海人工智能公共研发资源图谱[N]. 新民晚报, 2019-08-30(1).
[41] TANG J, ZHANG J, YAO L, et al. ArnetMiner: extraction and mining of academic social networks[C]//Proceedings of the ACM SIGKDD international conference on knowledge discovery and data mining.New York:Association for Computing Machinery, 2008: 990-998.
[42] ZOU L, ?ZSI M T, CHEN L, et al. gStore: a graph-based SPARQL query engine[J]. The VLDB journal, 2014, 23(4): 565–590.
[43] 毕经元, 顾新建, 吕艳, 等.基于知识元链接的汽车零部件知识管理系统[J]. 浙江大学学报(工学版), 2009, 43(12): 2208-2213.
作者贡献说明:
顾 复:标准和其他文献的分析,论文的写作;
刘杨圣彦:论文部分内容的写作,文献查阅;
顾新建:提出论文的总架构,修改论文。
Description Method of Scientific and Technological Resources
Gu Fu Liu Yangshengyan Gu Xinjian
School of Mechanical Engineering, Institute of Industrial Engineering, Zhejiang University, Hangzhou 310027
Abstract: [Purpose/significance] Scientific and technological innovation is the key point of development, and scientific and technological resources sharing and collaborative innovation are indispensable. Sharing of scientific and technological resources is a systematic project, and first of all, in order to integrate, evaluate and share scientific and technological resources, we need to establish a description model of scientific and technological resources. [Method/process] The description model of science and technology resources defined in this paper includes classification model of scientific and technological resources, meta data model of science and technology resources, ontology model of science and technology resources, knowledge meta model of science and technology resources, science and technology resource graph model, etc. Scientific and technological resources include knowledge, data, products, talents, software, hardware and other resources. We proposed the method of establishing the model of science and technology resources description, as well as the characteristic and function of it. [Result/conclusion] The main contributions of this paper are as follows: standardizing the description model of science and technology resources is helpful for the integration and sharing of different types of science and technology resources; by the integration research of different types of description models of science and technology resources, we form the system architecture of the description model of science and technology resources, which provides an overall solution for the comprehensive and systematic description of science and technology resources, and helps us to share the science and technology resources; we put forward a method to build a description model of science and technology resources, based on crowd-sourcing theory and big data AI of description process of scientific and technological resources, and we establish and optimize the description model of science and technology resources.
Keywords: science and technology resource science and technology resource description model method of modeling science and technology resource sharing knowledge graph