大数据时代下的科技数据资源开发利用问题与对策探讨
2021-04-11张琳霞张虹霞
张琳霞,张虹霞
(1.中国船舶集团有限公司第七〇五研究所昆明分部,云南 昆明 650032;2.云南省科学技术情报研究院,云南 昆明 650051)
0 引言
2011年,美国咨询公司麦肯锡最先提出了“大数据时代”概念。大数据具有海量数据规模、快速数据流转、多样数据类型、价值密度低等特征。随着网络时代的发展,各类数据快速增长。近年来,我国制定了《促进大数据发展行动纲要》,《国家科技资源共享服务平台管理办法》等政策文件,大力推动公共数据互联开放共享,推进科技资源向社会开放。我国政府推动数据开放让庞大的公共信息资源进入市场,为其开发与利用提供了更多资源。科技数据资源作为数据资源的重要组成部分在大数据背景下开发利用还面临一定问题,有待进一步改善提升。
1 科技数据资源开发利用存在的问题
1.1 科技数据资源建设条块分割
大数据时代,强调海量数据的存储、分享和挖掘,目前科技资源的异构系统、异构数据导致了科技数据的割据。
1.2 可用、可信等优质数据相对匮乏
科技部门在大数据建设和应用的过程中仍然感到数据不足,想用的、能用的数据无处可寻,可用、可信的数据相对匮乏,数据缺乏连续性,这种优质数据缺乏的现状影响制约着科技业务的应用和科技数据产业链的形成。
1.3 数量来源分散、形式多样、复杂多变
科技数据包括科技管理日常文档、科技政策、科技项目、科技人才、科技专家、科技成果、科技奖励等多种类型,各类信息来源不同的业务工作和信息系统,数据结构和格式多样,复杂多变。
1.4 数据采集、存储、应用等过程规范性差
早期开发的信息系统从单项工作或单个系统出发,只考虑有关数据的采集、处理、存储,满足当前工作需要或是达到系统开发目标即可,因此,缺乏有关数据采集、整理、存储、应用的标准规范,形成数据孤岛、碎片数据,这种现象既不能保障数据的有效存储,同时对后续开展数据整合、汇总、统计、共享、利用时也造成不便。
1.5 数据内容不规范、不完整、不准确
由于缺乏数据规范和标准,在建设科技业务管理信息系统数据库时,发生在填报或采集数据时,同样的内容,例如学科、行政区划、领域等,填报的数据不一致,影响数据质量和数据统计。
1.6 缺乏专业的数据资源规划和建设人才
科技数据开发及管理人才匮乏,相关人员对大数据有关的知识学习不足,对有关的数据规划和分析利用的思考和方法掌握不够。
2 科技数据资源开发利用的对策建议
2.1 法制保障、政府重视并加强指导
目前,我国还缺乏关于科技数据信息增值开发利用的法律和制度,因此需要加强有关法制建设和研究,开发诸如许可制等制度建设,为科技数据信息增值开发利用提供法律保障。
2.2 建立开发利用、开放共享的保障机制
成立专门的科技数据信息资源建设管理和服务部门,负责科技数据信息资源共建与共享的具体工作。按照《政府信息公开条例》《促进大数据发展行动纲要》《科学数据管理办法》等相关规定,并结合工作实际,制定相关制度,明确科技数据采集、存储、加工、传递、检索、分析等应用中的职责、分工、权利、义务和奖惩等内容。建立经费保障机制,保障相关工作的正常开展,同时加强资金管理,提高资金使用的规范性和有效性。
2.3 构建科技政务大数据服务平台
遵循统一规划、统一管理、统一标准、分步实施、不断完善的原则,按照政务信息资源目录体系标准规范,围绕科技数据的采集、存储、检索、分析等过程,基于云环境、参考大数据开发利用的技术和做法进行统一的服务平台建设,面向各级科技管理部门、高校、科研院所、开展科研活动的企事业单位和个人提供数据服务。
2.4 构建专业的科技数据分析创新团队
组建专业的数据分析团队,选拔培养懂业务、懂技术、懂设计、懂分析的专业队伍,掌握大数据的新型处理技术,为科技管理数据的采集、整理、分析、研究、评估和预测提供技术支持。加强与有关高校、科研院所和企事业单位的合作,加强数据共建共享、合作培养专业人才、开展课题研究、实施工程项目,共同为科技管理数据的开发利用提供有力支持。
3 结束语
深化大数据应用是大数据技术参与到管理工作、决策过程中来的最终目的,对于科技部门来说,大数据将进一步提升科技管理的效率,因此,我们应围绕科技应用需求开展科技大数据的收集、处理、分析,使科技数据信息资源的作用真正发挥出来,将科技大数据成果普惠于民。