APP下载

大数据环境下档案信息资源共建主体研究

2018-01-24罗吉鹏

山西档案 2018年2期
关键词:部门资源信息

文 / 罗吉鹏

伴随Web2.0和云计算技术的兴起,学术界掀起一股大数据研究的热潮,“大数据是以海量数据为核心、以网络为基础、智能分析为手段、辅助决策为目标的信息资源及支撑技术的一体化体系,包括规模不断膨胀、类型复杂多样的数据集,以及对各种数据集进行高速采集、处理、分析,以提取有价值信息的技术架构”[1]。为了顺应大数据时代的到来,国务院于2015年颁布《促进大数据发展行动纲要》,把推进大数据的发展和应用上升到国家战略的高度,以期加快建设成数据强国,应用大数据为社会主义现代化服务。与此同时,档案信息资源被视为国家基础性战略资源的重要组成部分,为了在大数据发展的浪潮中实现档案资源的“增值”,国家档案局也将大数据写入了《全国档案事业发展“十三五”规划纲要》中,“‘四个全面’战略布局、国家大数据发展战略和‘互联网+’行动计划的推进,深刻影响档案工作的理念、技术、方法及模式”[2]。而大数据环境下档案信息资源的共建则是国家大数据发展战略的重要组成部分。

大数据环境下档案信息资源共建的主体要在“统一领导,分级管理”的档案事业体制下,遵循大数据思维,应用大数据技术,由各级档案行政管理部门吸收包括档案保管部门、信息技术部门、公众等在内的主体共同参与到档案信息资源共建的过程中,早日建立起以技术为支撑的覆盖全社会的档案信息资源体系。

一、大数据环境下档案信息资源共建主体的构成

(一)档案行政管理部门

档案信息资源共建是一种国家行为,作为国家机关的各级档案行政管理部门应在加强立法、规章制度建设的基础上,对全国的档案信息资源进行统筹规划、统一部署、协调各方和深度开发利用,发挥领导者的作用,从宏观层面领导各主体有序参与档案信息资源共建。

面对大数据带来的机遇和挑战,档案行政管理部门要加强自身职能作用的发挥。一方面,要完善共建中的法律法规、行业标准等,使大数据环境下档案信息资源的共建有明确的制度约束。2015年以来,为加速实施国家大数据战略,国务院和各部委相继颁布《关于运用大数据加强对市场主体服务和监管的若干意见》《促进大数据发展行动纲要》《组织实施促进大数据发展重大工程的通知》《大数据产业发展规划(2016—2020年)》等一系列旨在加强顶层设计的政策法规,但是我国的档案行政管理部门在有关档案大数据的政策法规制定上明显落后于国家大数据发展的步伐。例如,档案大数据的标准化建设,“标准化是对档案信息资源各方面建设总揽性的前提与基础,也是最亟待解决的实际问题”[3]。长期以来,我国的档案大数据呈分散零乱的状态,部门之间数据定义不一致、格式不统一、设备接口不兼容以及数据交换难等问题普遍存在,严重阻碍档案信息资源的共建,档案行政管理部门应尽快出台法规政策以打破“档案信息孤岛”的局面。另一方面,要加强资金支持,确保有充足的档案经费。经济基础决定上层建筑,大数据的发展不仅需要技术支撑,更需要资金支持。在某种程度上资金的投入也决定着档案信息资源共建的速度。目前,各级档案行政管理部门的经费主要由各级财政拨款,具有总量小、来源单一、发展不均衡的特点,有限的经费不足以迎接大数据带来的挑战。2016年5月1日实施的《国家重点档案专项资金管理办法》强调,由中央财政设立专项资金,对各级档案馆馆藏重点档案予以专项补助。大数据在档案信息资源建设中的一大目的就是保护档案原件、延长档案寿命,故财政部若联合国家档案局颁布《国家档案大数据专项资金管理办法》则可有效解决资金投入问题,加速档案信息资源共建的进程。

(二)档案保管部门

长期以来我国部分档案形成部门并没有按规定移交档案,“部门或专业档案馆(室)以部门利益为重,将本单位专业档案资源据为己有,分流了绝大部分利用价值极高、与人民群众利益息息相关的档案资源,导致整个国家档案资源体系‘支离破碎’”[4],人为造成的信息孤岛导致档案信息资源不丰富,阻碍了共建的步伐,使人民群众需要的档案散落在各保管部门。大数据环境下,档案信息资源具有增长快、种类多、来源广的特点,也对档案保管部门提出了更高的要求。

档案保管部门要树立大数据环境下“大档案观”的意识。大数据环境下,我国的各级档案保管部门应站在“社会记忆”的角度来收集档案,使馆藏结构向“大档案”方向发展,不能仅限于机关文书档案,应兼顾国家、社会、家庭、个人四个层次,使档案馆更多地反映一些人文性、地方性、平民性、碎片性的信息,从而可以完整地勾勒出时代的发展、社会的转型、人民的幸福;再通过大数据下的云计算、数据挖掘等技术分析信息之间的关联性,为更深层次的档案收集提供借鉴。值得注意的是,“大档案观”不是意味着馆藏资源的泛化,大数据具有价值密度低的特点,在海量的档案大数据中真正有价值的档案资源比重低。因此,档案的价值性仍然是收集档案时需要考虑的重要因素。

档案保管部门要树立大数据环境下“服务中心”的理念。长期以来,我国的档案保管部门始终树立“资源中心”的理念,馆藏资源内容转化能力不足,使收集的半现行期或非现行期的档案直接进入休眠期,档案信息资源的应用范围有限。大数据时代,基于大数据的分析和应用才是大数据的价值所在,所以要强调数据向知识转化、服务现实的能力。档案保管部门要在大数据的支持下,树立方便用户查询、满足用户利用需求的服务理念,提高档案服务与用户需求之间的匹配度。同时,大数据使档案服务变得量化,“大数据的产生,使得一切领域都将进入一个可量化的时代,重中之重,就是人的行为”[5],量化的数据使得点对点的服务成为可能,为档案保管部门提供个性化的服务打下基础。

(三)信息技术部门

“大数据是一个总称性的概念,它还可以细分为大数据科学、大数据技术、大数据工程和大数据应用等领域”[6],档案学界受自身学科背景限制,多数缺乏高级计算机技能,故应专注于大数据应用,为大数据分析提供基础数据。在大数据时代,“没有哪一个群体能解决所有问题。不同于传统的商业智能环境,大数据的分析和应用需要业务分析人员、数据整合专家,以及业务部门走到一起,开展通力合作”[7],因此在档案信息资源共建的过程中要重点与掌握大数据技术的信息部门或企业展开合作。

据互联网数据中心的一项调查报告,目前非结构化数据已占生成数据的80%且每年按指数60%增长,结构化数据仅占到1%—5%。面对非结构化数据的汹涌来袭,传统的信息技术已无法适应新的要求,众多与大数据有关的技术正在兴起并走向成熟。数据挖掘技术通过对海量的档案大数据建立数学模型,对结构化和非结构化的数据进行整理和分析,激活休眠的数据,深度挖掘出隐藏在数据背后之间的关联,对档案用户的显性行为和潜在需求进行预测,最后实现人性化的精准推送。数据挖掘技术可以有效改善档案馆被动服务的局面,实现主动为档案用户提供精细化的服务、满足用户个性化的实际利用需求和休闲利用需求,提高档案工作的社会地位。对于广大的档案用户来说,晦涩难懂的数据不是他们想要的,其关心的是数据分析的结果以何种方式展现在面前,能否以最通俗的方式让人理解并接受。数据可视化技术则可实现这一效果,“是指运用计算机图形学和图像处理技术,将数据转换为图形或图像在屏幕上显示出来,并进行交互处理的理论、方法和技术”[8],抽象的数据用图像和图形表现出来使人更加容易理解,进而发现数据背后的价值。

(四)公众

新世纪以来,随着档案工作社会地位的不断提升,档案馆馆藏开始走“亲民化”路线,公众的档案意识也在不断提高,大数据时代公众参与档案信息资源共建将成为发展趋势。“公众参与档案信息资源共建是指档案机构利用互联网将社会公众的力量引入到档案信息资源建设中,通过转移档案信息资源建设权限的方式实现档案信息资源的丰富化、有序化和最优化”[9]。大数据带来先进的技术、人性化的理念、个性化的服务让公众参与共建成为可能。

目前来看,公众参与档案信息资源共建的形式主要有档案著录和意见征询。档案著录是档案工作中的基础性环节。著录质量的好坏直接关系到档案用户能否查询到所需要的档案,关系到馆藏资源能否为社会所共享,关系到数字化的档案能否数据化地被利用。困于庞大的馆藏档案资源以及资金、人力等方面的限制,我国的档案著录工作有着质量不高、进展缓慢、公众参与率低等不足。在解决这些问题上可以效仿英国国家档案馆(以下简称NAKU)的做法。NAKU以社交媒体为平台、以公众为参与的主体来开展档案著录工作,Flicker“是Yahoo旗下的图片分享站点,不仅提供免费及付费数字照片存储、分享方案之在线服务,而且提供网络社区平台”[10]。NAUK有着海量的图片档案,但是大部分的图片缺乏著录信息,很难提供利用。NAUK便借助Flicker的平台,将信息不全的图片发布进行共享,允许用户对照片添加标签,之后由档案馆对标签进行整合,“目前利用者已经为25757份档案添加了13428个标签”[11]。公众参与档案著录,档案馆在节约人力、物力、财力成本的同时,也让公众在档案信息资源共建的过程中行使了民主权利,尤其在面对类型多、来源广、分布散的档案大数据时更需要吸引更多的公众参与到档案信息资源共建的过程中。意见征询则是通过档案网站、听证会、社交媒体等方式听取公众在档案收集、档案开发利用、档案服务等方面的意见,邀请公众参与到档案信息资源共建和工作的评估当中,体现人民当家作主的地位。共建的过程应当体现从公众中来到公众中去的基本原则。

二、大数据环境下档案信息资源共建主体的特征

(一)多元性

改革开放以来,随着经济结构的转型,我国的社会结构也发生着变迁,“传统的一元利益框架已被逐渐突破,社会多元利益的格局正在悄然形成,许多形成于传统一元体制下的理论在多元社会背景下面临着严重挑战”[12]。我国的档案信息资源建设也呈现出主体一元性的特征,各级档案行政管理部门充当着主导的地位,在计划经济时代主体一元结构符合当时社会发展的潮流。但随着大数据时代的到来和社会转型的要求,主体一元结构正在瓦解,档案信息资源多元共建的局面正在形成。

档案大数据不仅包括档案部门拥有的纸质档案、电子文件等形式的档案,而且包括档案部门和社会各行业在日常运转过程中形成的大量结构或非结构化数据。大数据环境对档案大数据的时效性提出了更高的要求,数据要在最短时间内实现最准确的分析,以便档案部门可以预测档案工作以及档案用户的行为趋势。档案部门单单依靠自身的力量很难对海量的数据进行收集、整理、加工、分析、利用等,必须借助社会多方面的力量,整合跨行业系统形成的数据,运用文本挖掘、云计算、可视化分析等技术来处理档案大数据,并发挥公众在档案信息资源共建中的导向作用。只有吸收更多的主体参与档案信息资源共建,才可以在完善档案工作的同时为档案用户提供更加高效的服务。

(二)服务性

2008年国家档案局提出“两个体系”建设,即建设覆盖人们群众的档案资源体系和方便人民群众的档案利用体系,突出档案信息资源在结构和利用上为人民服务的特点,改变过去为政治服务的单一性。大数据时代,档案工作应始终坚持以人为本的基本思想,依据公众个性化的需求,利用大数据时代先进的数据捕获、处理和分析技术为公众提供优质、高效的服务,满足用户对档案信息资源的需求,提高档案信息资源的服务效能。大数据技术的发展打破了档案馆服务空间与时间上的限制,拓宽了档案服务的范围,开拓出档案利用的新方式。于是,档案馆的服务不仅限于本地、线下的传统服务,而是可以辐射到更远的地区,为更多公众提供高效、特色、便捷的档案服务。

用户需求和技术进步是档案服务不断提升的原始动力。为了解决人民群众日益增长的对档案利用的需求和相对落后的档案个性化、人性化、便捷化服务之间的矛盾,我们要吸纳更多的主体参与档案信息资源共建,以档案用户为中心,以提高档案服务为目标,以大数据技术为手段,以大数据思维为引导,在共建平台、资源选择、技术创新等方面以用户的有效利用为出发点和落脚点,突出档案工作的服务性。

(三)共赢性

大数据环境下档案信息资源共建的各主体都是以契约共识、互利合作为前提与条件,在保证各主体基本利益的情况下来建设档案信息资源,形成互利共赢的局面。

大数据时代的到来要求档案行政管理部门加强顶层设计、完善制度法规、发挥总揽全局的作用,从宏观层面协调各个主体之间的关系,巩固自己在全国档案事业发展中的领导地位。对于档案保管部门而言,大数据技术的应用加速了馆藏档案数字化的进程,深度挖掘出档案潜在的价值,为档案用户提供针对性的服务,既提高了档案保管单位的社会意识,也提高了社会的档案意识,无形之中抬升了档案保管单位的社会地位。对于信息技术部门而言,大数据的发展使其与档案行业的联系更加紧密,信息系统的设计、文字识别技术、数据挖掘技术、可视化分析技术的广泛运用不仅获得可观的收入,也提高了其在档案数字化、数据化这一新兴产业中的市场占有率,为日后发展打下了基础;对于普通档案用户即公众而言,大数据时代的到来,在方便、快捷、高效地解决实际利用需求的同时,更使档案馆成为休闲利用的场所,提供着根源感、身份感、地方感和集体记忆。

(四)市场性

融入市场是大数据环境下档案信息资源共建的趋势,包容的环境将会吸收更多的市场主体参与到共建的过程中。在我国档案事业发展的过程中,很少把档案与市场联系起来,认为档案一旦市场化就会具备“商品”的属性,从而违背了档案的本质属性。但在大数据时代,应该发挥市场在优化资源配置中的作用,促进资源在各行各业中的合理流动,利用市场的资金、技术、人才等的优势来共建档案信息资源。

档案经费与经济发展水平应保持在相对协调的状态,但是近年来随着我国经济规模的不断扩大,档案经费增长呈现出相对滞后的状态。面对大数据环境下先进信息技术对档案工作的冲击,许多档案馆面临着有限的经费和无限的技术更新之间的矛盾。因此,我们要发挥市场在资金、技术上的优势,如“我国目前的档案信息化建设,其主要任务包括电子文件的归档、管理与长期保存,馆藏档案的数字化工作以及数字档案馆及电子文件(档案)备份中心建设等”[13]。数字化是数据化的基础,数据化建立在数字化之上,我国大部分档案馆出于资金和技术的考虑,选择将数字化的工作外包出去,由商业性档案机构承担起数字化的任务,有效地发挥了市场在大数据环境下共建档案信息资源的作用。

三、结语

“相关关系”是大数据时代重要的思维模式,其不仅仅是“通过对档案数据的综合挖掘、深度整合和数据分析,激活休眠状态的档案数字资源,展现数据价值,创造出新知识、新价值”[14],打破数据壁垒,挖掘数据与数据之间的相关性,还强调在大数据环境下搭建档案信息资源共建主体之间的相关性,打破行业之间的壁垒,促进资源的合理流动,吸引更多的主体参与进来,在互利共赢的合作中构建命运共同体的关系,共建我国的档案信息资源,使我国的档案事业朝着现代化方向发展。因此,在大数据环境下,多元化的主体在档案信息资源共建的过程中有着不同的功能定位。档案行政管理部门作为领导者,应当发挥总揽全局的作用,通过制定大数据环境下档案工作的规章、标准来规范档案信息资源的共建,并在资金、人才、技术等方面予以支持。档案保管部门作为执行者,应当在遵守档案法律法规的基础上,加速馆藏档案信息资源的数字化进程,建立满足档案用户的资源体系与利用机制。信息技术部门作为协助者,应当发挥自身在技术、资金、人才等方面的优势,在大数据时代协助档案保管部门共建档案信息资源,兼顾档案信息资源开发的成本与质量。公众是档案信息资源共建的参与者,大数据时代的到来使公众既成为档案信息资源建设的参与者,也成为档案信息资源建设效果的评判者之一。“亲民的”馆藏档案信息资源和服务体系是公众评判档案馆是否“亲民”的重要标准。故各主体既是相对独立的个体又是相互联系的团体,互相协同,加速大数据环境下档案信息资源的共建。

[1]乔颖.基于SWOT分析的大数据时代航空档案工作[A]//创新:档案与文化强国建设——2014年全国档案工作者年会优秀论文集[C].北京:国家档案局,2014:426.

[2]全国档案事业发展“十三五”规划纲要[J].中国档案,2016(5):14-17.

[3]刘玉波.档案信息资源共建共享机制建设问题刍议[J].黑龙江档案,2015(1):92.

[4]王小兰.“十二五”期间国家档案资源体系发展战略之我见[J].中国档案,2011(2):27-29.

[5]杨吉.涂子沛的“大数据”:不是你想的那样[J].中国图书评论,2012(10):118-120.

[6]黄欣荣.大数据时代的思维变革[J].重庆理工大学学报,2014(5):13-18.

[7]沈建苗.大数据应用:理想照进现实[J].计算机世界,2012-08-06.

[8]唐泽圣,陈莉,邓俊辉.三维数据场可视化[M].北京:清华大学出版社,1999:1-6.

[9]寇京.公众参与式档案信息资源共建模式探析[J].北京档案,2017(7):29-31.

[10]张学斌.国外档案信息资源开发的新方式探析——以英国国家档案馆为例[J].档案与建设,2014(3):15-18.

[11]英国国家档案馆在Flickr上图片数量统计[EB/OL].http://www.flickr.com/photos/nationalarchives/.

[12]薛刚凌.多元化背景下行政主体之建构[J].浙江学刊,2007(2):5-13.

[13]于英香.档案大数据研究热的冷思考[J].档案学通讯,2015(2):4-8.

[14]张文元,张倩.大数据技术与档案数据挖掘[J].档案管理,2016(2):33-35.

猜你喜欢

部门资源信息
联合监督让纪检部门不再单打独斗
基础教育资源展示
一样的资源,不一样的收获
资源回收
哪些是煤电部门的“落后产能”?
订阅信息
资源再生 欢迎订阅
医改成功需打破部门藩篱
展会信息
我国多部门联合行动打击网上造谣传谣行为