论科研单位档案管理中大数据的运用
2021-08-04丁晓芸丁琦
丁晓芸 丁琦
上海空间推进研究所
随着经济与社会事业在新时代的高质量发展,各行业、各领域、各学科都将高质量发展作为目标和导向,迎来更高的改革和创新要求。对于科研档案管理工作而言,在大数据时代背景下,科研单位档案的归档对象和范围、数量远远超出传统模式,同时可以利用大数据技术进行加工处理,将科研档案转化成语义知识丰富的大档案数据,为科研管理、科技创新等提供支撑,在科研档案管理中加强大数据运用显得至关重要。
一、科研单位档案大数据的主要特征
大数据又被称作海量资料、海量数据、巨量资料、巨量数据,通常是由数量巨大、类型众多、结构复杂的数据构成的集合,涉及的数据量规模巨大到不能利用当下的主流软件工具在合理时间达到获取、管理、处理、整理更有价值信息的目的。科研档案是科研单位在科学研究实践活动中形成的记录活动全过程的原始记录材料,结合大数据分析,科研单位档案与大数据的特征是相符的[1]。首先,科研档案数据量大,现如今很多科研单位的档案资料总量几乎都达到TB级,是庞大的数据资源库;其次,科研档案资源类型多,当前比较先进的科研单位的档案资源主要是电子资源,同时包含一些纸质档案和照片、音频、视频等档案,均属于非结构化数据,资源类型繁多,呈现出多样性特征;再次,科研档案价值密度不高,因为科研档案记录着科研单位开展科研实践活动的过程,价值较大,但在利用科研档案方面,数量庞大的档案引发价值密度低、利用率不高等问题,例如科研单位的馆藏科研档案数量可以达到百万级,实际利用率却偏低;最后,处理速度要求很高,现在比较先进的一些科研档案要依靠信息技术进行管理,处理科研档案达到实时或者近乎实时的速度。
人们对于科研单位档案的认识经历持续深化的过程,界定科研档案的概念和内涵时伴随时代的进步越来越明晰、深化。特别是把科研数据视作重要档案性资料直接纳入科研单位档案管理的范畴,有助于全面保管科研活动中形成的资料,为开发利用科研数据奠定基础[2]。但是随着科技的不断进步,科研单位的科研手段出现巨大变革,跨机构、跨地区、大规模的科研实践活动越来越多,各种智能传感终端被广泛应用于各个领域,促使科研数据可以被快速精准地获取,科研档案数据来源愈加广泛,类型也愈加多样。在数据驱动的影响下,科研档案作为科研单位重要的战略资源,蕴含着组织和个人在科研活动中的智慧,档案管理技术要求不断提高,使得科研单位传统档案管理中的思维局限、归档粗糙、数据库功能不全、人员专业水平不高等问题日益突出,有效运用大数据优化科研档案管理势在必行。
二、科研单位档案管理中大数据的运用策略
科技创新是增强竞争力的重要手段,是科研单位形成、保持和提升核心竞争力的必然选择,档案部门改善科研档案管理,更好地规范科研项目管理、服务科技创新责无旁贷,在实际工作中需要结合科研档案大数据特征加强对大数据的运用。
(一)融入精益思维,建立大数据档案管理思路
为了进一步推动科研档案的数字化、信息化建设,档案部门要重视大数据精益管理,通过融入精益思维建立大数据档案管理思路,实现对科研档案资源的自动采集和资源共享,为科研单位的运作与发展提供更好的服务[3]。大数据精益管理思维主要涉及到信息化思维和档案服务思维、档案资源共享思维,基于精益管理理念推进科研档案管理的革新、升级,意识到科研档案资源利用价值;要想自动采集科研档案资源,就要利用先进大数据技术自动抓取科研档案信息,从而结合网络数字资源实时动态把控科研档案的利用,实现个性化、精准化的数字化管理;共享科研档案资源也要关注大数据,由此整合档案资源,把科研档案归类为数字资源、基础资源、管理资源,通过结合大数据精益思维划分科研档案资源类型,建设大数据档案精益化管理体系,服务科研档案数字化升级管理。
(二)细化档案归档,提升大数据档案的完整性
《科学技术研究档案管理暂行规定》15号令丰富了科研文件材料归档范围,科研单位档案部门要按照规定增补相关材料,细化归档。例如科研立项阶段的论证指南、评审材料,研究实施阶段的科学数据和进展情况报告,项目结题验收申请书、项目绩效评价自评报告、科研成果报告等文件,进一步提升科研单位档案的完整性。尤其是根据大数据精益思维强调科学数据归档,不仅要把科研实践活动和项目过程中形成的科研数据归档,还要细化归档科研数据的规则[4]。例如针对冗杂的、数量多的科研数据要有序地、科学地归档和保存,提升使用科研数据的效率即科研项目的对应投资回报率。具体可立足科研数据生命周期管理细化归档,包括:在数据采集环节要求科研项目的负责人在项目开始之前制定好科研数据的管理计划,在项目过程中安排科研人员利用相关设备记录科研过程,并根据管理计划做好科研数据加工整理工作;在数据汇交环节由科研管理部门统一汇总科研项目形成的科研数据,上交档案部门,同时建立科研档案数据汇交制度,规范利益各方的汇交工作;在数据保存环节要科学配置科研数据的存储和保管、服务、安全等必要设施,完善科研数据保存制度,满足科研档案存储要求。
与此同时,在科研档案归档中要利用科研单位的信息系统进行前端控制,集成电子文件管理系统、档案信息管理系统,真正做到实时归档。科研材料形成与管理部门将办理好的文件材料利用各信息系统接口进行归档处理,完成逻辑归档;归档档案数据时督促、指导文件材料形成部门保证建立纸质文件和电子文件的正确对应关系,同步移交档案;文件材料形成部门根据科研档案整理要求把待归档电子文件分类上传档案服务器,存放在系统文件中心,集中归档,使科研档案更完整。
(三)完善数据库功能,强化数据档案资源运用
档案数据库是系统化的、有组织的数字大集合,目前科研单位的档案数据库信息主要来自既有档案、收集的电子文件,在细化归档的同时就需要完善数据库的功能,强化档案运用。针对既有档案要利用数字化技术将其他载体形式的档案信息转化成数字档案,例如扫描、著录等;针对收集的电子文件,要依托数字化管理和大数据做好归档整理工作,如上所述,构建档案数据库。接下来就是运用大数据技术深度挖掘科研档案数据,精准洞察、精准服务,提升使用者对科研档案的认同感,强化档案资源共享,发挥好科研单位档案的价值。例如进行用户信息数据挖掘,提取他们的科研档案信息需求,也就是通过查看他们访问档案服务器的日志跟踪行为,推测个性化需求,提供优质档案服务;挖掘用户浏览记录、统计检索记录,分析他们点击科研档案目录的几率,实行点击率高的科研档案的数字化处理;分析用户检索档案的关键词,充实并完善档案数据库检索关键词,有效提升查准率。
除此以外,加强科研档案数据信息的碎片化加工处理。科研单位传统档案管理主要基于卷和件进行,只能解决逻辑结构和物理的异构,存在语义异构问题。为了提升科研档案信息的关联度,满足大数据驱动下的档案系统精确检索、精确分类和统计需求,要利用知识图谱对科研档案数据进行碎片化的细粒度加工,提供深层次科研档案服务[5]。即利用大量人工标引的科研档案分类号实例组成实例库,进行相似度计算,按照计算结果自动分类科研档案;利用人工智能和自然语言处理等技术手段,以科研档案知识为基础,利用分类号、保管期限、题名、责任者、页码范围等著录信息条目进行元数据智能提取,然后对科研系统、办公自动化系统等业务系统里面的异构元数据需求开展映射、转换、互操作;利用智能识别分析科研档案正文信息的句法、章节层次等,自动抽取时间、地点和事件等关键性数据、图表信息,实现科研档案细粒度加工。抽取科研档案数据涉及到抽取档案实体、抽取关系、抽取属性,得到实验数据,将其和单位人事信息、科研项目等进行知识整合,通过智能校对、人工审核降低错误率。例如在科研单位的某项课题申报和组织换届,档案部门从知识层面汇集相关科研项目档案,对相关领域的科研专家进行智能搜索,按照呈现出来的科研成果和研究报告等综合分析知识层面的研究路径、关键技术等,为展开课题研究、明确研究方向以及论证课题的可行性等提供可靠的档案数据参考。
(四)加强管理培训,打造专业大数据档案队伍
科研单位档案管理的大数据运用需要科学配置档案人才资源,打造专业队伍,提供大数据档案管理保障[6]。为此,科研单位要加强档案人员管理培训,增强他们的服务意识,结合科研档案使用需求简化档案使用流程、创新服务手段,挖掘档案潜在价值,为不同科研项目提供针对性的服务;定期进行档案人员的信息化专项培训,使档案人员充实专业知识,掌握信息化操作技能和网络安全防护等;积极参加上级部门组织的专业技能培训,进行系统的、针对性的学习,增强档案大数据意识;把档案人员的服务意识、履职情况、培训情况等纳入绩效考核范畴,结合绩效奖惩机制提高档案队伍的综合素质。例如在档案人员专业培训中要考虑大数据的要求,督促档案人员严格遵守安全保密规定,承担科研档案保密责任,加强安全建设。因为科研单位档案中有很多需要保密的数据、信息,要组织档案人员学习《保密法》等,完善科研档案数据安全和保密管理,围绕数据信息、保密责任的落实、责任追究等实施重点控制;强化网络安全防护,认真检查科研档案数据库和信息系统的防病毒、防攻击、防瘫痪等安全维护情况,及时修复安全漏洞,筑牢单位内网和互联网之间的物理隔离;加大保密力度,检查科研档案数据库的保密管理状况,包括科研档案数据的存储与使用等,检查移交档案数据的台账,避免发生泄密事件。
三、结语
基于大数据和人工智能等先进科技的技术革命不断影响着档案管理工作,为挖掘档案数据、开发利用档案信息资源提供可能。如今大数据是科研单位档案管理不可摆脱、不可选择的新环境,更是深化科研档案管理改革的新机遇,科研单位档案部门通过把握时代机遇,积极迎接挑战,在科研档案管理中顺大数据之势而为,不仅依托科研档案大数据特征建立了大数据档案管理思路,还利用大数据技术提升了大数据档案的完整性,强化档案资源运用,同时打造专业档案管理工作队伍,立足新的大数据环境高效管理科研档案,扎实推进科研单位档案管理的信息化建设进程。