APP下载

基于Cite Space III的大数据档案研究综述

2018-07-26范桂红

山西档案 2018年3期
关键词:热点数据挖掘档案馆

文 / 范桂红

大数据以数据量化、挖掘数据潜在价值等特征成为社会关注新焦点。信息与技术深度融合的大数据技术引起档案管理从数据采集、挖掘、分析及管理思维范式的转变,这要求档案工作者具有更强的数据分析能力、信息洞察力及业务流程重组与优化能力。本文拟运用Cite Space III软件对CNKI中检索到928篇大数据档案研究文献进行可视化分析,通过文献时间分布、作者及机构、关键词共现、研究前沿时区等分析,以量化、动态的方式探讨大数据档案研究的热点主题及其演化趋势。

一、数据来源与研究方法

(一)数据来源

本研究的数据来源于CNKI中与大数据档案相关文献。检索式为“主题=大数据”并含“档案”,发表时间为2012年1月1日到2017年12月31日,文献来源、支持基金设置为模糊检索,共检索到1031篇,剔除论文集、增刊、硕博论文等,共得到符合条件文献928篇。选中文献后,导出Refworks格式,命名为download_2018文件,为本研究的数据源。

(二)研究方法

本研究利用CiteSpaceIII可视化软件探讨大数据档案研究热点及随时间的变化前沿趋势。分别对作者共引、机构合作、关键词共现、研究热点及前沿进行透视,并对数据结果进行综合分析。通过关键词聚类、时区视图识别该领域科学发展的新趋势。

二、结果可视化分析

(一)文献时间分布

对文献时间分布情况分析可以得到该领域2012—2017年理论动态变化及受关注情况。2012年档案学领域开始对大数据进行理论研究,但关注度仍然较弱,成果较少。由于大数据技术加速融合到档案数据采集、存储与利用之中,从2013年起研究开始繁荣起来,发文数量呈倍数增长的趋势,于2017年达到发文最高值。这表明,大数据档案研究逐渐成为热点,受到广泛关注。究其原因:一是数据信息安全需要,数据采集、数据隐私挖掘等技术为档案数据信息安全提供保障;二是国家层面的重视。2016年国家档案局印发《全国档案事业发展“十三五”规划纲要》,探讨数字档案与大数据融合,深刻影响档案工作的理念、技术、方法及模式,给信息安全、隐私保护和数字记忆留存带来挑战,为大数据时代档案资源整合与服务利用提供机遇。

(二)文献作者

随着大数据研究的深入进行,该领域研究的成果逐渐增多。张倩、周枫、田伟、王兰成、席畅等作者为该主题研究的中坚力量。数据分析表明:(1)第一作者发文量 3 篇以上的作者有 21 人,占论文总数的6.9%,表明该领域作者集中度较弱;(2)从合作强度来看,田伟、韩海涛、陈静合作5次,成为大数据档案研究合作最多的组合。作者之间的合作一般只限于本研究机构或者同一地区的不同高校,内部合作强度较大,研究团队之间处于独立状态,未形成较强凝聚力的科研群体及核心作者。

(三)研究机构

通过分析,该领域研究机构具有以下特点:(1)发文量7篇及以上的机构6个,发文量占论文总量的7.1%。上海大学、黑龙江大学、天津工业大学、辽宁大学、南京政治学院上海校区等分列前五位。整体看来,该领域的研究机构主要集中在高校档案学专业和高校综合档案馆(室),这表明高校在该领域研究较为活跃;(2)研究机构分布相对零散,只有极少数研究结构之间存在合作,其中,天津工业大学与天津师范大学、辽宁大学与中国人民大学之间合作最密切。该领域研究机构分布广泛,但合作意识薄弱,机构之间缺乏紧密合作,且处于独立分散的状况,规模化合作网络未形成。

三、研究热点与趋势

(一)研究热点

关键词是对文章研究内容的高度凝练及概括。通过对文献关键词共现聚类可以分析出该领域研究热点。[1]对出现频次(见图1)在 20 次以上的大数据档案研究关键词进行统计,共有大数据时代、档案管理、信息化建设、档案信息资源、大数据技术、高校档案、数字档案馆、档案数据、电子档案、数据挖掘等10个高频关键词。笔者认为,大数据背景下的档案管理、档案馆建设、高校档案管理、档案数据挖掘分析等为该领域的研究热点。

图1 关键词共现知识

图2 关键词聚类的时区

1.大数据背景下档案管理研究。当前,以数据收集、挖掘技术为切入点对档案管理进行研究,由管理理论、数据安全、服务创新、数据法律法规、数据资源建设等五个方面构成档案管理新模式。档案管理部门树立大数据观、大服务观及大价值观等管理理念,优化档案业务流程,挖掘档案增值信息,加强档案管理机构的职能建设。[2]用大数据的视角来审视档案管理工作,构建服务网络化思维、信息化思维、技术性思维及共享性思维四种档案管理新思维方式。[3]对大数据档案涵义、技术及趋势进行剖析,探讨大数据关键技术的实质,最大限度地发挥档案数据价值,成为大数据档案当前研究的热点。

2.大数据背景下档案馆建设研究。当前,基于用户需求角度,档案馆构建需求感知引擎、拓展深化数据服务内涵、推进个性化服务等模式;[4]基于利用服务角度,搭建个性化服务、智能化服务、知识化服务等四种模式。[5]档案馆依托大数据技术创新档案管理与服务模式,有利于提升档案馆核心竞争力,具有重要的理论意义与现实意义。档案馆作为存储档案实体和提供信息服务的部门,必须主动利用机遇进行战略性创新。档案馆建设应以智慧化、知识化、生态化为理念,深化档案数据挖掘、优化专业队伍建设、完善数字资源整合力度,构建智慧档案馆、数字档案馆。

3.大数据背景下高校档案管理工作研究。高校档案管理工作需提升大档案服务理念、大资源观念来实现档案大数据共享、建设数据资源集成库,为学校其他工作提供数据支撑。向泽红提出,用跨界·融合·联动理念指导高校档案信息的开发,提供高效档案服务,可以使高校档案管理能够更好地为师生服务。[6]周美兰分析了大数据特征,构建了以数字档案资源建设为核心的现代化高校档案资源管理体系。[7]大数据时代,高校档案管理工作需要注重档案信息资源管理,加强档案信息归档存储、数据知识挖掘、信息读取与利用、转变工作思路。

4.大数据背景下档案数据挖掘研究。探讨大数据档案管理系统、数据挖掘、数据分析、云计算等技术的研究成果较多,大量结构化和非结构化的大数据档案需要数据技术来处理。周枫认为,大数据技术将从档案资源挖掘、用户数据挖掘、关系洞察三个方面实现档案信息资源与用户需求的双向理想控制。[8]王兰成结合档案网站知识服务功能,对大数据知识挖掘处理中的数据集成、数据存储、数据分析、语义处理与可视化数据挖掘问题进行探讨,为档案大数据的分析挖掘提供了启示。[9]数据分析技术有利于深层次档案知识挖掘,提升档案价值。档案信息安全与档案实体安全是大数据条件下我们需要关注问题。

(二)研究趋势

运用关键词共现时区视图,可以在时间维度上掌握大数据档案知识聚类演进动态过程。[10]由图2可以总结出,2012年研究热点为数据挖掘、档案利用服务、大数据时代,档案学者开始转向本领域研究;被称为“大数据元年”的2013年,在以往热点的基础上增加了档案管理、大数据技术、档案数据、电子文件、档案信息化建设、企业档案管理等,表明大数据时代已经到来;2014年,大数据首次正式写入《政府工作报告》。于是,在以往热点的基础上增加了档案服务、档案信息资源、档案管理系统、信息安全、数据安全及高校档案、医院档案、国土档案等,这源于国家政策的引领。2015年国务院发布《促进大数据发展行动纲要》《国务院关于积极推进“互联网+”行动的指导意见》,数据成为国家基础性战略资源。于是,在以往热点的基础上增加了云计算、智慧档案馆、物联网、人事档案、档案开发与利用、档案资源共享等。2016年在以往热点的基础上增加了档案大数据、数据化、数据分析等;2017年在以往研究热点的基础上增加了档案价值、档案文化、数据优化等热点。

以后学者在关注大数据、云计算、数据挖掘、数据分析的同时,也应该从技术角度进行探讨。究其原因,一是数据挖掘、数据分析、云计算等新技术与传统档案信息采集与存储技术相融合;二是大数据理念逐渐渗透到档案信息资源开发与利用、档案信息资源共享建设、档案信息服务过程中,随着大数据技术的不断发展,大数据思维、大数据观、大服务观必将影响档案管理工作;三是大数据的数据价值拓展了档案文化价值、档案信息价值、档案数据价值,为档案利用工作提供了多元化发展方向。

猜你喜欢

热点数据挖掘档案馆
热点
改进支持向量机在特征数据挖掘中的智能应用
云南省档案馆馆藏《东巴经》
探讨人工智能与数据挖掘发展趋势
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
云南省档案局办公室关于表彰2018年度《云南档案》优秀通联组及发行先进单位的通报
热点
结合热点做演讲
软件工程领域中的异常数据挖掘算法
when与while档案馆