新型研发机构监测系统模型构建与机制设计
2020-06-15任志宽龙云凤
任志宽,龙云凤
(广东省科学技术情报研究所,广东广州 510033)
动态监测是过程管理研究的一个重要内容,也是企业或研发组织实施研发管理过程再造的重要手段[1-3]。新型研发机构的创新成果和技术方向具有原创性、前沿性、颠覆性特点[4],需要根据市场和用户实际需求,对研发过程中的技术信息、实验过程、知识流动等数据进行监测,掌握不同阶段新型研发机构发展情况,有效识别出成长性技术,实现财政资金、市场资本的精准对接,缩短过去财政资金扶持过程与技术突破的时间差,适时采取策略推进技术成果产业化。然而,由于新型研发机构对情报有预见性、前瞻性需求,要求系统具备全局性搜索、精准性识别、准确性预测等特性,但传统信息监测工具大多处于半自动状态,无法达到技术预测与市场前景预测的目的,信息采集与分析也主要取决于系统设计人员对专业技术的认识和了解,这影响了动态监测的效果。因此,研究与开发新型研发机构动态监测系统意义重大。本文基于数据挖掘、数据库管理、网站设计等技术,针对科技信息非结构化、无语义描述等特点,从大规模、无规则、意义模糊的数据源中挖掘潜在有价值信息,提出对技术和市场上相关大数据进行管理的解决方案,保障对任何对信息资源进行完整性、可应用、针对性筛选与采用,建立动态监测模块、深度分析模块和功能响应模块3 个子模块,设置控制阀值,实现精准和及时高效的最优;然后,从人机交互角度提出新型研发机构动态监测系统的运营机制、资源配置机制和安全管理机制,提高数据使用与对接效率,促进系统具备智能化和人性化热点。
1 研究现状
1.1 关于新型研发机构的研究
近年来,对新型研发机构的研究成果越来越多,主要集中于管理模式、运营机制、创新绩效等管理层面[5-9],对动态监测系统的研究基本属于空白状态。但部分学者从现代科研院所构建技术监测系统进行了探讨,如林丽珊[10]对中国科学院文献情报系统的科技态势自动监测平台进行研究,提出各类型知识服务系统的特征及架构;曹琼[11]从高校图书馆开展情报监测服务出发,提出国家科研机构主要关注科研工作者科研能力评价、学科发展态势、研究机构科研竞争力评价3 个方面的情报信息,应围绕这3 个方面构建情报服务支撑系统。然而,新型研发机构不同于传统高校、科研院所,是高校、传统科研机构、企业、中介等各方参与者开展产学研合作的重要载体,是各类型信息和情报的聚散地,前人研究成果或结论并不完全适用。
1.2 关于动态监测系统的研究
当前对动态监测系统的研究主要在企业和地方政府建设情报监测系统方面,集中在监测内容、监测对象、技术升级和平台构建等方面。陈龙[12]对网络时代Web 数据的特征特点进行分析,把握企业竞争情报系统发展智能化趋势,对企业建设竞争情报系统的体系结构进行研究,提出基于J2EE 的企业竞争情报系统技术框架。王卫东[13]提出由产业集群网络构成的信息、组织、咨询预警体系,研究了产业集群网络风险预警子系统的运作模式和组织架构。蒋蓉华等[14]采用Delphi 法设计了知识管理监测系统,实现了绩效评价与满意度评价的智能化与自动化。谭思明等[15]基于地方政府建设竞争情报动态监测系统的角度,从系统的建设方向、管理制度、网络平台、运营机制和信息源等方面提出系统的基本框架。唐超[16]从开源性情报挖掘的角度,提出风险管理系统的“监测—预警—决策”逻辑架构及运营机制。以上学者对监测系统的模型架构及机制设计作出了很大贡献,但研究对象集中于企业和政府,在功能设计、监测目标、信息反馈等方面均与本文有较大差别。
综上所述,当前情报监测系统的理论和实践在学界已经有了较多探索,并被企业和政府应用到实践中,然而,新型研发机构作为一种新生事物,主要研究成果多集中在管理角度,对情报平台和基础设施构建的研究较为缺乏,这不利于掌握新型研发机构发展动态和社会发展需求,因此,本文从实际应用角度对新型研发机构监测系统和机制进行研究,结合数据库系统构建理论及技术,建立监测平台实体,以期为实践提供具有可操作性的参考。
2 新型研发机构动态监测系统设计
2.1 动态监测的特点及要求
与企业、传统高校和科研院所相比,新型研发机构在信息监测和动态反馈方面存在很大差别:(1)对监测系统的自动化和信息化要求程度不同。企业信息监测主要瞄准市场对标对象,搜集维度主要是市场竞争者的相关信息;传统高校和科研院所以国家战略和任务为导向,系统设计围绕建设目标进行。相比之下,新型研发机构监测系统更加体现对潜在技术和知识的及时预测与反馈,并对技术进行成熟度分析和市场应用前景分析,技术复杂性和预测的不确定性较强。(2)对质量和错误的受控和稳定性有较高要求。在传统资本密集型或劳动密集型企业中,影响数据库信息质量的主要是硬件技术水平和管理水平,系统受控程度较高;新型研发机构的动态监测过程存在信息不完全性、动态性和延展性等特征,对数据算法要求较高,要在技术预测模型的基础上进行,受控程度与算法完备性有关。(3)对信息过滤和筛选有较高要求。新型研发机构动态监测系统要形成“信息获取—信息匹配—信息过滤—数据挖掘—数据反馈”的完整链条,要求系统设计能配合数据挖掘方法有效地剔除重复冗余数据,降低误技术误警率。
2.2 系统框架设计
2.2.1 设计目标
为解决现有产业情报系统或企业监测平台存在的扩展性不够、个性化服务缺少、跟踪不及时等问题,本文提出了构建新型研发机构动态监测系统的思路,旨在构建一种新的能够支持自主申请监测服务、监测源集中采集、监测信息分散化管理、准确评估信息价值、信息内容可定制的监测服务系统[15]。该系统具备能满足不同用途需求,反馈设计、计算和实验全过程的数据,能对数据信息进行有效分类,为用户提供个性化服务。系统设计要能很好解决监测系统运营过程中存在的系统结构可扩展问题、信息个性化计算问题、角色灵活切换问题、信息集中采集问题、服务可嵌入型问题等,要方便新型研发机构间、企业间、行政部门间的信息交流和发布,同时也为政府管理新型研发机构提供支撑。
2.2.2 数据体系
建立数据体系是实现有效监测的根本前提是动态监测系统构建的主要组成部分[17]。新型研发机构监测数据体系既要保证新型研发机构数据体系的完整性,又要尽最大可能减少数据冗余,且易于查询。本文借鉴唐超[16]对情报数据的划分方法,构建以“技术数据-人才数据-成果数据-产品信息-市场需求”为一体的使用方接口数据体系,各类型数据主要根据实际数据获取情况进行类型划分,如技术数据包括技术领域、技术参数、技术理论、实验数据4 个方面,同时,相对应地构建后台存储及分析数据体系,包括概念库、规则库、分析库。其中,概念库主要运用描述语言对技术数据的特征进行提炼和分类,然后由技术专家根据技术概念的内涵、标准、分类获取初步的规则库[18];初始规则库由技术专家输入,后续根据概念库聚类分析、关联规则集挖掘等方式发现新的规则,如成果需求方和攻击方的对接规则主要是对所有频繁项目集进行识别,对支持度满足用户定义阀值的进行排序,再根据频繁集中可信度阀值进行二次筛选;分析库是专业技术人员根据理论分析经验设置的一些常见分析方法和程序,同时以计算机辅助人工分析,进而得出系列结论。新型研发机构数据体系构建方法如图1 所示。
图1 新型研发机构监测数据库体系
2.2.3 模型框架
新型研发机构动态监测系统包括动态监测模块、深度分析模块和功能响应模块3 个部分,模型的主要逻辑是采用大数据常用算法,根据新型研发机构数据分类信息形成专门数据库,再采用数据挖掘技术对潜在信息进行分析和跟踪,建立市场和机构的信息交换机制,对市场需求及时反馈,提供个性化服务方案,让技术需求者在最短的时间内找到所需要的信息资源。模型框架如图2 所示。
图2 新型研发机构监测系统模型框架
在数据输入端,新型研发机构、企业、政府等用户主动发布信息需求或供给,系统利用数据挖掘技术对信息进行初步整理,将各类型信息反映在系统当中,然后对适时的海量数据进行搜集和筛选。这个过程主要分为3 个步骤:第一步是对面向对象属性的特征提取关键词,采用归纳算法对数据进行分类,获取所有属性的数据集合,由系统自动将技术信息反馈给数据挖掘对象[19];第二步是对数据进行处理,包括剔除异常数据、降低数据冗余等;第三步是利用决策树算法、K-Means 算法等大数据算法对不同数据进行信息挖掘[20],如对有关线索涉及的特征提取、主观句定位、用户态度提取、态度极性判断和技术结果显示等。数据处理的方向包括3 个方面:第一,以技术专利垄断性、人才稀缺性、市场需求程度建立数据挖掘的体系架构,掌握供需双方需求情况;第二,对技术搜索、技术试验过程中产生的数据信息进行深度挖掘,明确技术市场需求的特性,为新型研发机构制定决策信息提供指导;第三,建立以技术成熟度和市场接受程度为变量的数据曲线,确定两者切合度高的时间点,从而为决策提供依据。
(1)动态监测模块。信息获取后,系统自动将传输的数据流量和规则库中设置的规则算法进行数据匹配,根据参数阈值设置及重要性排序进入深度分析模块。在这个过程,通过各个对象的标签和特征进行分析,梳理用户的信息需求类型、信息需求方式、信息需求范围及信息需求深度等,形成动态监测序列;然后调取规则库中事先设置好的规则信息,从科学性、信息量、权威性等角度挖掘关键信息,根据用户需求差异对信息进行优先级判定。在信息初步对接后,从合作模式角度进行判断,最终进入下一阶段处理。
(2)深度分析模块。深度分析模块包括数据挖掘、信息萃取、技术发现、数据可视化等方面。为防止不相关信息占用分析资源,系统先对具体数据信息进行记录和归档操作,之后根据动态变化实现后续处理。采用人工和计算机协作机制在数据包和规则集合间进行联动匹配,针对市场需求信息和技术供给情况进行资源挖掘,在市场需求信息采取标签标记规则后,由需求方描述自己的产业领域、应用场景、工艺要求等关键词,进而方便配对在市场需求方间进行对接。在信息价值评估上,采用基于个性化监测样本及个性化权重体系的信息价值Ii(t)计算方法,相关要素包括信息来源的权威性Ait、信息的类型Bit、信息对监测对象的重要程度Cit、信息的时效性Dit和信息涉及的主题相关度Eit共5 个维度[20-21]。通过监测本体的可配置性i(一般指具体的战略计划内容,如技术突破、项目计划、专利发布、人才引进等)和指标权重ai的可配置性来体现个性化设置。信息价值Ii(t)的计算方法为:
在Ii(t)的计算过程中,每一条经过初步筛选的信息被分配给特定的监测领域后,系统会自动调取对应领域的监测本体和指标权重,计算该领域包括的关注对象数目,以及这些关注对象在权重体系计算下得到的总值,从而计算出每条信息在这个领域中的价值和排序。
(3)功能响应模块。该过程主要包括数据分发、结果响应、适时预警3 个流程。对于信息需求和对接层次低的用户,可分发数据信息;对于信息需求层次高的用户,技术仍处于培育期的,根据技术发展需求进行适时预警,分为轻度预警、中度预警和重度预警3 种,是动态监测后针对分析结果提出的应对举措。其中,对于轻度预警信息,需要对成长性技术发展动态进行跟踪,在关键阶段向用户提供动态监测评价报告,然后持续性跟进发展趋势;对于中度预警,需要在市场上发出明确信号,开展前期知识产权保护,并且动员市场资本或财政扶持资金进行技术培育;对于重度预警,要做好产业化设计,连接产业链上下游资源,推动成果转化落地。
3 新型研发机构动态监测系统机制设计
3.1 系统运营机制
按照“开放申请、信息采集、分散配置、个性化计算、定制化服务”的运营思维[22],本研究对新型研发机构动态监测的数据性质和作用进行分析和分类,对数据按照“搜寻—计算—反馈”等用途进行分类和构建,建立数据出现、识别、跟踪、采集的流程与制度,建立数据分类、核查、归总等机制[16]。对用户群体进行需求调研与分析,对信息源进行甄别,精准选取有效信息源,组织专家团队对信息进行编译和加工,及时推送和反馈信息。当用户提供需求后,系统能为用户提供统一的监测管理服务。首先,在目标网站、学术刊物、纸质档案等信息源上查找高价值信息,当信息进入监测数据采集中心后,由采集中心统一采集;然后,系统自动采集数据,并自动根据每一个用户关注的信息源,将采集到的新信息分别配给不同的监测服务应用,各个监测服务按照预料和计算规则对采集到的资源进行个性化计算;最终,在信息输出端以内容、格式、数据类型等差异体现个性化定制服务。这种服务是基于自身需求定制、基于个性化预料和规则计算而得的,如图3 所示。
图3 新型研发机构监测系统运营机制
3.2 资源配置机制
新型研发机构动态监测系统的资源要素包括软件资源、硬件资源和信息源3 个方面。软件资源依托上述系统模型框架进行Web 设计,可应用于Windows 平台、Android 平台、iOS 平台的远程登录与管理。系统用开发者提供了Web Service 开放接口、客户端API 接口和支持XML 输出的简单URL 接口等3 种类型的接口,便于后续功能嵌入,提升系统开放性和可拓展性。硬件资源主要构建基于Hadoop分布式系统的基础架构网络,用于信息搜集和专区;通过HDFS 和MapReduce 为海量数据提供存储和分布式运算,用于分析和计算;兼容用户电脑和手机等硬件使用,便于获取信息服务。信息源包括主动信息获取和开放数据挖掘两个方面[22],主动信息获取来源为各级科技管理部门的信息录入,开放数据包括各类型网站、图书馆、专利局等提供的信息。在资源存储上,依据信息监测领域进行硬件配置,每个监测领域分配一个服务器、拥有唯一标识,分别存储各领域监测信息源、领域监测语料、所获取监测信息的计算方法等。当用户使用系统获取个性化服务时,无论需求的学科背景、技术领域差异大小,只需要按照网格设计提供结构化信息,经过系统识别和分析,即可在定制范围内获得一个基于Web 的针对所需领域的信息监测服务。用户不用关注软硬件配置情况,只需要提出信息需求,勾选重点监测机构或企业的信息源,就可以获得有针对性的信息。如图4 所示。
图4 新型研发机构监测系统资源配置机制
3.3 安全管理机制
新型研发机构动态监测系统涉及系统安全、权限管理、信息安全3 个方面。
系统安全按从底层到高级的顺序分为运行环境层次安全、数据备份恢复安全、应用程序安全、应用程序使用安全、系统监控安全。其中,运行环境层次安全包括基础软件安全环境、硬件安全环境和网络安全环境,旨在保护计算机网络设备、设施及媒体安全;数据备份恢复安全包括程序备份恢复、数据库备份恢复两个方面,主要用于保护系统存储的数据安全;应用程序安全包括Web 服务器集群安全、数据库双机隔离热备份、内部外部用户Web 服务器隔离措施3 个方面,用于保证服务器运营安全;应用程序使用安全由功能权限认证、用户身份认证、文件操作安全及文件签名安全构成,主要在于保证程序运营过程中的安全;系统监控安全由监控进程和监控界面组成,用于提供实时监控和用户界面管理。权限管理上要根据行政管理权限、信息涉密程度、信息来源等合理分配权限,包括部门管理、用户管理、角色管理、参数配置管理等功能。权限设置及分配要打破部门分割壁垒,破除各自为政,建立信息共享、共控机制,发挥扁平化管理优势[23]。信息安全是对信息采集、信息传输、信息存储、信息发布分发和数据备份的整个过程的安全保证,要从预防信息泄漏、防病毒、防人为破坏等角度定期维护硬件设施。构建科学的数据储存机制,在建立电子数据储存库基础上,针对重要数据建立数据纸质储存库,确保数据安全与使用。对于用户密码、操作人员密码等等重要数据,在数据传输过程中或在数据库存储时进行加密,确保关键数据不被窃取。系统建立日志体系,在应用服务层和数据库层分别设有日志,为非法登录控制、事故追查等提供多种手段。如图5 所示。
图5 新型研发机构监测系统安全管理机制
4 实际案例
基于以上模型框架和机制设计,本研究项目团队开发了“广东省新型研发机构创新数据库(监测平台)”(以下简称“监测平台”)。监测平台是面向企业、高校、科研院所,功能涵盖广东省新型研发机构年度运行数据填报、用户权限管理、数据统计分析、短信邮件通知管理、科技成果管理、政策信息类管理、研发机构动态管理、企业自评管理。各类资源由不同类别用户自行发布和维护,经各级科技管理部门审核,资源信息面向社会公开共享。
4.1 平台基本概况
监测平台包括用户界面和后台数据库。用户界面采用流行的AJAX 技术以及PHP 技术,实现宽用户界面,为用户提供了良好的操作体验。后台数据层采用面向对象的开发结构和MVC 模式,利用单一入口访问模式,封装了创建、更新、读取和删除基本操作,能实现类别设置、数据导入、数据视图、项目编译、SEO 支持、多数据库链接和切换、数字认证和数据拓展等独特功能。如图6 所示。
图6 广东省新型研发机构监测系统主页面
4.2 监测结果
第一,定期监测分析报告。主要分为月度、季度、年度三大类监测报告。监测团队在完成数据的汇总、整理后,撰写监测分析报告,对当月、当季新型研发机构发展运行的基本指标和动态指标的变化进行分析,对机构分布、研发情况、创新活动、产出成果、成果转化等基本动态情况加以分析,并对监测发现的问题提出相关对策建议。在年度监测方面,监测团队在完成年度数据的汇总、整理后,撰写年度监测发展报告,年度数据的汇总要在当年12 个月动态数据汇总的基础上纳入按年度采集的数据,形成完整的年度统计报表后,分部分进行研究分析,总体变化情况要与上年度进行对比分析,对全省机构分布、经济指标、研发情况、创新活动、产出成果、成果转化、人才建设、机制建设等基本情况加以分析,对发展趋势进行预测,并对存在的问题进行总结,在此基础上提出对策建议。
第二,不定期动态监测报告。采取不定期排查方式,建立新型研发机构发展的不定期排查机制,通过不定期监测发现问题、及时处理,形成不定期动态监测报告,对于出现的问题进行深入分析,提出对策建议。同时,当政治环境、社会环境、技术环境、经济环境等外部环境发展重大变化时,对新型研发机构的发展开展专项监测,分析外部环境变化对于新型研发机构发展产生的影响,对于新型研发机构在新的发展环境下如何规避风险、抢占先机提出对策建议。
第三,专项调研分析报告。监测团队基于对动态监测数据和调研、访谈资料的整理,对于新型研发机构发展的专项问题进行深入研究,形成专项调研分析报告。例如新型研发机构人才团队建设研究、新型研发机构创办企业情况研究、新型研发机构研发绩效研究、新型研发机构成果转化情况研究、新型研发机构创新机制研究等,对新型研发机构发展的重点问题进行深入研究,为新型研发机构突破体制机制的限制、实现创新发展提供重要决策支撑。
第四,项目实施进展监测报告。项目实施进展监测报告主要是对财政资助的新型研发机构项目的开展情况进行跟踪分析,通过对项目实施进度、重要产出和成果、项目变更情况、财政资金运用情况、项目产生效益等数据进行汇总、整理、分析后,形成项目实施进展监测报告,对于项目的开展提供指导意见,充分发挥财政资金对新型研发机构发展的支持作用。
4.3 效果评价
经过对新型研发机构动态监测系统的实际运营,发现该系统能满足企业用户的实际需求,能有效解决新型研发机构信息流动不畅的问题,能加强经济、科技、社会和产业发展动态监测、研究与分析,不断提高各部门情报信息分析与应用能力,为提升产业及新型研发机构竞争力提供科学决策依据,为促进广东产业转型升级提供决策参考。
5 结论与讨论
本文提供的新型研发机构动态监测系统的设计要求、模型框架、运营机制、资源配置机制、安全管理机制,有助于企业、机构、政府、中介等部门收集和交流各类型信息源,搭建起覆盖技术、人才、成果、产品、市场的情报源体系,能有效解决新型研发机构数据统计监测系统性不够、成果产业化不畅、技术交易渠道狭窄、科技经济“两张皮”等问题,推动企业、高校、新型研发机构产学研合作。但是,动态监测平台需要长期稳定运营,信息源的挖掘需要长期坚持和积累,用户实际体验需要不断完善,这都是下一步需要解决和完善的问题。