APP下载

基于科技报告的科技信息数据关联分析研究

2022-05-31王佳莹张肖会

天津科技 2022年5期

王佳莹,吴 丽,张肖会

(江苏省科学技术情报研究所 江苏南京210042)

在科技计划项目管理过程中会产生诸多科研过程相关的信息数据,包括科学数据、科技档案数据、科技报告、科技成果、科研经费等,在上述科研信息数据中,科技档案、科技成果登记、科技报告产生于科研过程的不同阶段,能够在某一方面集中反映科技创新过程与成果。

1 科技报告、科技档案与科技成果登记的区别

1.1 定义的区别

科学技术档案是在科学研究中形成的应当保存的文件材料,是记录科技创新过程的有效载体;科技成果登记是对已经形成的科技成果全面而概括的数据集合,是科技成果的数据描述形态;科技报告是对科学、技术研究结果或研究进展的记录,是记录科技创新过程和经验教训的有效载体[1]。

1.2 数据信息的区别

1.2.1 科技报告与科技档案的区别

科技报告是科技档案的重要组成部分,由于没有相关的制度约束,科技档案中关于技术内容的描述十分欠缺。科技报告是文献化的科技档案,在一定程度上是科技档案的一种补充,丰富了科技档案的内容。

1.2.2 科技报告与科技文献的区别

专利与论文都属于科技文献,是科研项目的产出形式,均有专门的公开发行渠道[2]。学术论文是经过同行评审的公开出版物,对内容的独创性有严格要求,篇幅受到限制,对研究方法、实验过程、中间结果等描述较为简单。专利是科技活动中创新部分的提炼,科技报告中既包含成功的经验,也包含失败的教训,但只有成功的经验才能申请专利。与科技档案一样,科技报告的内容是对已发表的学术论文、专利的重要补充[3]。

1.2.3 科技报告与科技成果登记的区别

科技成果登记是通过众多著录项以数字的形式描述的科技成果,其作用是反映我国科技成果的属性,主要是面向科技决策者服务;科技报告则是通过文字的形式描述科技成果,其主要是为科研工作者提供前人研究的经验,两者相互补充。

1.2.4 科技报告与科学数据的区别

科学数据是在科学实验、测试等过程中获得的原始数据记录,其本身并不是科技报告。对科学数据通过归纳分析,从中总结科学规律与结论后方能形成科技报告。科学数据是科技报告的基本素材。

2 科技信息内涵分析

2.1 科技报告信息内涵

科技报告分为科技报告辑要页和科技报告正文,其中科技报告辑要页的信息来源于计划项目管理系统,包含项目完成单位信息、完成人信息、项目名称、关键词等信息;科技报告正文一般是word格式,分段介绍项目概述、研究方法、试验/实验过程与数据、研究结果。在科技报告正文中实际上是包含一部分科学数据的,也就是前文说到的试验/实验数据。科技报告自建立之初从国家层面就建立了完善的体系,省里的科技报告体系也是照搬国家,甚至系统都是一致的,在一定程度上有效解决了科技报告数据标准与利用的问题,这是科技报告的一大优势,也是后期我们可以利用的一大优势[3]。

2.2 科技档案信息内涵

科技计划项目档案的主要组成内容为项目合同(原件)、验收材料、验收证书(部分)。我们认为科技档案项目的精华在于验收材料,材料中包含验收申请表、项目合同复印件、研发工作总结、研发技术报告、项目经费决算表[4]、研究成果、验收委员会名单与验收意见,从上述材料中可以得到大量信息。

①验收申请表:项目承担单位的信息(包含所在地区、通信地址、联系人、联系方式),项目起止时间,验收形式,专利、论文等成果体现形式,承担人员信息,项目经费实际到位与支出情况,获奖情况,技术指标完成情况,经济指标完成情况,建设任务完成情况,主要研究内容与研究成果,项目完成人员信息。

②研发工作总结:比对项目合同中的实施进程详细阐述项目各阶段完成情况,详细介绍项目取得的成果、人才培养情况,总结项目实施过程中存在的问题和得到的经验,并提出相关建议。

③研发技术报告:项目的国内情况对比,在实施过程中研究方法的选取,试验/实验过程、数据、经验总结等描述,对项目的研究对象、研究方法、研究过程、研究结果进行系统的阐述。研发技术报告侧重于技术层面的数据描写,2015年后其性质与科技报告类似,但科技报告对格式的要求更加严格。

④项目经费决算表(审计报告):是项目实施期间经费的决算清单,揭示项目的资金来源与走向。

⑤研究成果:项目完成后形成的论文、专利、实务产品或实际技术运用的描写。

⑥验收委员会:行业专家信息。

⑦验收意见:对项目完成后成果的评价与建议,以及该项成果在国际或国内所处的水平与下一步研究方向的建议。

我们从上述构成中可以发现,在一份科技计划项目的验收材料中蕴含着非常丰富的资源信息,科技活动的几大要素(人、钱、事、物)在其中都可以找到非常准确的信息。

2.3 科技成果登记信息内涵

科技成果登记与科技档案的性质不同,与科技报告自上而下的体系也不同,它既是自上而下的一项工作,但又缺乏完善的信息系统支持。科技成果登记中包含的信息有成果名称、起始时间、成果简介、所属行业、成果体现形式、支撑成果的计划项目情况、产出专利情况、成果转移情况、第一完成单位情况、合作完成单位情况、完成人情况、评价委员会(行业专家)名单和意见。

3 科技信息关联分析

科技报告中涉及的项目名称可能是科技档案中的项目名称或是科技成果登记中支撑成果的计划项目名称,某一个计划项目的完成人可能是某一个成果评价委员会的专家。笔者承担科技奖励工作时每一年都会比对当年获奖的成果与科技成果转化项目,重合率接近60%。所以在本文的开头介绍过科技档案、科技报告与科技成果登记在科技管理的不同阶段,三者相互关联又相互补充。我们截取了共有关键词(完成单位、领域关键词,第一完成人、验收委员会)进行联想分析。

3.1 完成单位

如图1所示,从完成单位的角度来说,我们可以结合三者的信息分析单位性质、产业分布领域、区域分布和单位优势领域。

图1 完成单位角度的信息分析Fig.1 Information analysis from unit perspective

①单位性质:对完成单位性质进行区分,将其分为“高等院校”“科研院所”和“企业”,可以通过分析不同主体在不同计划类别中所占的份额得出不同计划类别针对不同单位的结论。

②产业领域分布:通过科技计划项目的产业领域分布可以看出当年江苏省热点产业引导方向,结合科技成果中的成果领域分布可以分析出全省产业引导形成的实际成果和全省产业引导趋势、热点产业分布。

③区域领域:通过不同单位主体所获得的科技计划项目得出的科技成果可以分析出全省各类产业的基本分布图;结合专利分析可以绘制江苏省产业分布区域;甚至可以通过截取某一个时间段分析出某一区域在某个时间段内产业的走势,为产业区域规划提供支撑。

④单位优势领域:通过完成单位与涉及领域之间的关系可以进一步了解每个承担单位的优势所在,如结合对高校承担的科技计划项目与产出的科技成果,分析高校重点学科、学科建设方向和该高校的优势 领域。

3.2 具体领域

如图2所示,选取某一个具体领域,我们可以从申报单位、研究主题、研究成果、研究层次4个角度进行分析。

图2 某一领域角度的信息分析Fig.2 Information analysis from a domain perspective

根据申报单位的性质不同,可以分析出不同的单位在该领域的分布特点;根据该领域的研究主题结合第一单位分析,可以得到该领域的优势单位信息;从研究成果的表现形式(专利、论文、经济效益)、成果转化情况和专利分析与传统文献相结合得到科技计划项目的产出分析,并得出科技成果的转化情况;根据科技计划项目验收时专家意见与成果评价得出该领域成果在国内外所处的水平,以期为成果转化和产业规划提供支撑。

3.3 人员信息

人员信息是最容易匹配的,标引人员信息进行配对就可以得到第一完成人、参与完成人、验收委员会、评价委员会的人员信息,如图3所示,可以分析出某一领域学科带头人与行业专家的信息,以及某一个完成人在某一领域的发展历程和所处的位置,甚至其核心团队信息都能一并解析得出。

图3 人员信息角度的信息分析Fig.3 Information analysis from perspective of personnelinformation

4 搭建科技成果服务信息平台

通过数据挖掘、整合与分析建立科技成果数据采集与发布系统,聚焦科技创新过程中形成的科技资源数据,结合科技大数据中心建设整合现有的科技报告、科技成果登记与科技档案数字化后的数据,充分利用知识管理与知识库信息技术和AI智能工具对数据进行深度挖掘、分类整理与多维度分析,按年度、地区、产业、知识产权分布、政府指南导向等不同分类形成科技成果信息服务系统。该系统可服务于政府科技管理决策咨询、高新技术园区科技成果转化、科研院所信息研究和企业行业竞争情报等不同需求的对象。

4.1 建设科技成果资源基础库

梳理并分析科技报告、科技档案与科技成果登记数据的数量、结构和存储方式,借鉴知识管理、服务等理念,利用大数据、云计算、人工智能等新一代信息技术对上述三者现阶段的工作流程、运行系统、存量数和增量数据进行摸排与分析,并对上述数据进行了规范、标准化的整合加工处理,最终建成了3种资源集聚的基础库。

4.2 建立科技成果资源聚合管理平台

针对基础库的资源建立涵盖数据采集处理、质量保证、安全管理、隐私保护、数据集成应用等在内的数据加工聚合。制定数据管理规范、共享规则与数据标准目录。通过对资源基础库中数据进行解析、识别、转换、清洗等操作构建主题词表、分类词表、编码规则、开放规则等,合理利用知识抽取、机器学习等信息处理技术将整合的资源数据挖掘有价值的信息,实现不同主题、行业、专家、科研机构等多维度的数据动态关联和数据有效整合与集中管理,进而提升数据服务价值。

4.3 建成科技成果服务信息平台

利用新一代大数据平台管理系统,在实现资源基础库与数据聚合管理的基础上利用数据标准与机器学习建立算子,并利用算子的拖拽实现不同维度的数据关联展示,面向产业跟踪、决策支持、知识服务等需求提供产业实时跟踪检测、区域产业分析对比、统计数据、行业快报、科技政策、产业趋势、人才推送与评价、招商引智等服务。