大数据环境下档案信息资源共建模式研究
2018-01-24吴毓
文 / 吴毓
档案信息资源共建共享是档案工作的重要组成部分,也是共建共享社会治理格局的必然要求。在大数据时代,档案信息资源共建共享迎来了新的发展契机。档案信息资源共建是共享的前提,共建模式从一定程度上决定了共建工作的效果,因此研究大数据环境下档案信息资源的共建模式有益于档案行业实现档案信息资源共建共享的目标。
一、大数据与档案信息资源共建模式
“大数据(Big Data),或称巨量资料,指的是需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产”。维克托·迈尔—舍恩伯格认为:“大数据是指不用随机分析法(抽样调查)这样的捷径,而采用所有数据进行分析处理。”[1]美国互联网数据中心指出:“互联网上的数据每年将增长50%,每两年便将翻一番,而目前世界上90%以上的数据是最近几年才产生的。”[2]在中国,随着“互联网+”计划的实施,数据的飞速增长也超出了人们的想象。2016年3月17日,《中华人民共和国国民经济和社会发展第十三个五年规划纲要》指出:“把大数据作为基础性战略资源,全面实施促进大数据发展行动,加快推动数据资源共享开放和开发应用,助力产业转型升级和社会治理创新。”[3]可见,大数据的时机已经来临,它将在众多领域掀起变革的巨浪。
“由于档案也是信息资源大家族中的一员,它也具有一般信息所具备的属性”[4]。因此,在大数据环境下,档案信息资源具有大数据特征,即数据量大、数据类型多、处理速度快。“如果把大数据比作一种产业,那么实现盈利的关键在于提高对数据的‘加工能力’,通过‘加工’实现数据的‘增值’”[5]。为了实现档案信息资源的“增值”,打破“信息孤岛”现象,档案信息资源的共建成为大数据时代档案工作的重要内容,同时也是档案部门亟待解决的问题。档案信息资源共建模式是解决档案信息资源共建问题的方法论,是一种参照性指导方略。它反映了档案信息资源共建中隐藏的规律关系。因此,构建共建模式是档案信息资源共建过程中的必然要求。此外,目前的档案信息资源共建活动空前活跃,构建档案信息资源共建模式有利于充分开发档案信息资源,突破档案资源建设瓶颈,提高档案资源开发与用户需求的契合度,保障档案信息资源共建工作有效开展。
二、大数据环境下档案信息资源共建模式的构建原则
为了顺应大数据时代潮流,确保档案信息资源共建模式完善可行,在模式构建时应遵循以下原则。
(一)适用性原则
任何一个国家档案信息资源共建模式的构建都是社会和自然因素综合作用下的产物,离不开该国政治、经济、文化、科技等因素的影响。首先,档案信息资源共建模式应该符合国家政治、经济体制现状。国家政治、经济体制是档案信息资源共建模式构建的基础,两者具有直接联系。[6]我国是社会主义国家,实行人民民主专政的高度集中的政治体制和社会主义市场经济体制,这与世界上很多国家有较大区别。因此,档案信息资源共建模式构建应该适应我国当前国情。其次,档案信息资源共建模式要适应我国档案事业发展需要和现有的档案工作体制机制。大数据环境下,档案信息化、数字化已经成为我国档案工作发展的新趋势,由此可见,档案信息资源共建模式构建要符合这一发展方向,进一步促进档案资源朝着信息化、数字化方向发展。最重要的是,适应性原指生物体与环境相适合的生存潜力,是生态学术语,现引申为战略方针在所处环境的适应程度。档案信息资源共建模式的构建处于大数据环境下,其根本就是要适应大数据环境,适用大数据时代的需要,适用大数据时代海量档案数据的特征,具有实际操作性。
(二)动态性原则
由于大数据具有4V特征:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)。[7]其中,大量代表数据体量巨大,存储单位从过去的GB到TB,直至PB、EB;高速代表数据采集、处理、计算速度较快,能够满足实时数据分析需求;多样代表种类和来源多样化,包括结构化、半结构化和非结构化数据,具体表现为文本、图像、视频、音频信息等等;价值代表数据价值密度低,但将原始数据经过采集、清洗、深度挖掘、数据分析之后,具有较高的商业价值。因此,大数据环境本身就是一种不断变化发展的动态性环境。同时,档案信息资源共建也是一个动态过程。在大数据动态性环境下,档案信息资源共建模式也应该是非僵化、动态变化的,即遵循动态性原则。构建档案信息资源共建模式,要将档案行政部门、档案保管部门和社会公众等联动起来,多主体参与到档案资源共建,同时根据用户需求的动态变化,对档案数据进行实时处理分析,完善档案资源共建模式;[8]要树立动态发展观念,遵循动态性原则,来构建档案信息资源共建模式,以期推动档案信息资源共建工作更好地发展。
(三)多样性原则
大数据环境下地方档案行政管理部门和系统专业主管部门之间仍然存在不少矛盾,存在地方档案管理“条块分割”现象,并且,地区间档案信息化和网络化程度发展不平衡,区域间档案信息资源共建工作发展不均衡。这要求档案信息资源共建模式决不能采取一刀切模式,必须量体裁衣,灵活多样。只有构建灵活多样的档案信息资源共建模式,才能使档案信息资源共建富有更加强大的生命力和活力。大数据环境下产生了“档案大数据”概念。“档案大数据”主要是由档案部门管理保存的各类档案数据和档案部门在实际工作中形成的大量数据这两部分构成的。档案部门管理保存的档案数据包括纸质档案和电子档案,档案部门在工作中形成的档案数据包括用户访问档案网站形成的浏览记录和查阅数据,以及档案信息资源共建共享平台的日志、档案统计系统形成的数据、档案数字化过程产生的数据等[9]。对“档案大数据”进行充分挖掘,有利于档案信息资源的合理配置,对档案信息资源共建具有重要作用。庞杂的档案数据类型不仅对档案部门处理数据的能力提出了挑战,而且对档案信息资源共建模式提出了更高要求,决定了共建模式构建应当具备多样性,以便对大数据环境下档案信息资源进行有效利用。
(四)前瞻性原则
确定档案信息资源共建模式,既要立足于现实,又不能囿于现实,应当具备可持续发展观念和大局意识,把握未来发展方向,模式设计适度超前,与国家地方中、长期规划相结合,为将来增加新的功能或重建模式预留空间,要具有可扩展性。[10]并且,既定的模式应保持较强的稳定性,不宜随意更改,否则,将影响档案信息资源共建的进程,也会给国家带来不应有的损失。[11]互联网、金融、销售等以数据为导向的行业,可以通过大数据的决策与预测功能,深度挖掘自身企业数据并进行处理分析,制定企业未来发展规划,以期达到服务企业长远发展需要。[12]因此,企业不仅可以利用大数据进行实时数据采集分析,而且可以利用大数据分析预测未来发展方向,例如,今日头条通过关键词查找可以实时分析用户特征和兴趣爱好,[13]淘宝通过用户消费记录与浏览数据可以预测用户购物需求,推荐用户可能要购买的商品[14]等等。大数据环境下,档案部门建立网络平台系统,构建适度超前的档案信息资源共建模式,共建档案信息资源,对档案数据进行实时收集、实时归档、实时计算、实时分析,既可以预测用户潜在需求,又可以为社会公众提供更加全面的档案个性化服务。
三、大数据环境下档案信息资源共建模式的类型
在大数据环境下档案信息资源共建模式构建原则的基础上,笔者认为共建模式大体上可以分为四种类型。
(一)档案联盟模式
档案联盟模式是指在一定范围内,通过制定相关的合作框架和协议,档案行政管理部门、各级各类档案馆和其他档案机构等具有档案保管权的共建主体围绕相同的共建目标,建立起统一的合作组织,以达到档案信息资源共建的目的。档案联盟模式充分体现了适用性原则,其优点在于汇集了档案信息资源共建主体中最重要的部门,能够在这些部门之间建立起合作组织,有利于实现档案信息资源、人力资源和管理资源的优化配置。因此,它可以发挥传统合作模式无法比拟的功效。
档案联盟模式一般分为区域性档案联盟模式、全国性档案联盟模式以及区域性和全国性相结合的档案联盟模式。区域性档案联盟模式一般是指在省级范围内,由各省档案局(馆)作为牵头部门,和各市、县级档案局(馆)以及各机关、企事业单位内的档案机构等建立起区域性的档案联盟组织,在档案信息资源的共建工作中按照事先制定的规划进行各种资源的统筹分配,从而形成区域内的档案信息资源共建格局。全国性档案联盟模式是指由国家档案局(中央档案馆)作为牵头部门,和各省、市、县级档案局(馆)以及各机关、企事业单位内的档案机构等建立起全国性的档案联盟组织,从国家层面制定各种规则和标准、合理分配各种资源,从而达到全国档案信息资源共建的目的。目前,全国性的档案联盟模式在短时间内较难实现,然而在大数据环境下档案信息资源的共建工作又十分迫切,因此区域性和全国性相结合的档案联盟模式可以很好地解决这两者之间的矛盾。区域性和全国性相结合的档案联盟模式是指在建立各省级档案联盟的基础上,国家档案局(中央档案馆)将各省级档案联盟联合起来,建立起一个由国家档案局(中央档案馆)领导、各省级档案联盟共同组成的组织,并通过相应的协调机制对各省级档案联盟进行指导,从而达到全国档案信息资源共建的目的。
(二)公众参与模式
公众参与模式是指档案机构改变档案信息资源共建权限,将社会公众和档案部门一起作为共建主体,通过互联网媒介作用,让每个人都成为参与者,所有参与者构成虚拟网络社区,围绕着相同的共建目标,最终实现档案馆与公众协同作用共建档案信息资源。公众参与模式充分体现了动态性原则,其优点在于能够将社会公众引入到专业性的档案信息资源建设之中。通过社会公众的主动参与,档案信息资源共建工作可以更加全面地把握用户的动态需求变化,有效地开发利用档案信息资源,实现档案信息资源的丰富化、有序化和最优化。因此,公众参与模式比传统单一主体共建模式具有更加完善的优越性。
公众参与模式一般分为权限转移模式和意见征询模式两种。[15]权限模式一般是指档案信息资源开发专业人才权限转移,档案部门通过某种方式向公众转移,开始接受外部人员参与档案信息资源共建。该模式通过动员公众参与到大量档案信息加工和处理工作,将社会公众从档案信息资源共建的“旁观者”变为档案信息资源共建工作过程中的“参与者”,汲取公众智慧,弥补了人力资源的不足,节约了人力成本。档案众包是依托于网络技术,将档案信息资源共建的相关业务外包给网络大众的最典型的形式。[16]意见征询模式是指档案部门通过档案网站、社交媒体平台或其他方式来收集公众对于档案信息资源共建的意见和建议,包括用户需求、用户体验或对档案信息资源共建的改进方法等,完善档案信息资源共建工作。目前,我国社会公众参与档案信息资源共建的实践结果不尽如人意,根本原因在于缺乏国家性政策和资金的支持。我国公共档案社会意识和公众参与意识也不是很强,对档案、档案工作、档案信息资源共建没有清楚的认识。为了吸引公众主动参与档案信息资源共建,档案部门应当建立激励机制鼓励社会公众积极参与档案信息资源共建。
(三)市场调节模式
大数据时代,面对数量庞大、种类多样、来源广泛、生成速度快的档案大数据,单靠档案部门自身的力量很难完成对它们的收集、处理、加工、应用等工作,必须引入市场机制,利用市场的力量来弥补档案部门在档案信息资源共建中资金、技术、人才等方面的劣势。市场调节模式是指发挥市场在促进资源合理流动中的作用,以市场需求为导向,引入更多的市场主体参与到档案信息资源共建的过程中,以期为档案用户提供更加优质的服务。
以云计算、数据挖掘、分布式计算等为代表的大数据技术,不仅改变了信息服务的手段,而且还打破了传统的档案信息资源共建模式。“一元模式”已经被打破,伴随而来的是共建的“多元模式”,即发挥市场在档案信息资源共建中的调节作用,促进资源的合理流动,节约成本。市场调节模式包括“公益制模式”和“产业制模式”,向着“双轨制”方向发展。“公益制模式”的主体是国家各级档案行政管理部门。他们在档案信息资源共建中提供无偿性的服务,不以盈利为目的,但必须按照市场的变化和规则来调整自身的服务方向,以市场为导向来建设档案信息资源。“产业制模式”则是直接由市场调节,但必须接受国家法律法规的约束,以获取经济利益为目标,在此基础上共建我国的档案信息资源。如众包模式就是利用市场来调节档案信息资源的共建,将档案的数字化加工、深度挖掘、档案文化产品开发等业务外包给市场,利用市场在资金、技术和人才等方面上的优势来共建档案信息资源,实现资源的丰富化、有序化和多样化,提升档案馆的服务质量,提高用户需求与资源供给之间的匹配度。
(四)多方联动模式
大数据的环境改变着社会的组织结构和社会中各角色之间的关系,个体、组织和社会之间紧密地交织在一起并形成复杂的网络关系,在互联互动的发展中重新定位自己的角色。而建立档案信息资源、档案服务和档案用户之间的联动关系则是大数据环境下档案信息资源共建的发展趋势。多方联动模式是指档案部门在日常的档案工作中,以档案信息资源建设为基础,以档案服务为连接,以档案用户的需求为出发点和落脚点,把三者构建成有机的联系体,并始终围绕着社会公众,避免档案信息资源建设和档案服务的盲目性、片面性和单一性。长期以来,我国的档案信息资源、档案服务和档案用户之间处于分散、孤立的状态,档案信息资源的收集、开发和利用未能从满足档案用户多样化需求的角度出发,档案服务未能立足于特色馆藏和档案用户的个性化、多样化、便捷化需求,档案用户利用档案存在重实际轻休闲的行为目的,诸多因素加在一起阻碍了我国档案信息资源共建多方联动模式的形成。
多方联动模式的实现需要利用大数据发展的技术,搭建档案信息资源建设、档案服务以及档案用户管理的联动平台。“三个平台间有一定的逻辑关系,是相互关联的,其最终目的是满足公众需求,实现档案资源建设、档案服务与档案用户的动态联动”[17]。档案信息资源建设平台,在收集上要覆盖广大人民群众,利用数据挖掘技术和可视化分析技术对档案信息资源之间的关系进行挖掘和分析,找出数据与数据之间潜在的关系,加速档案数据的知识化转向,提高馆藏档案的质量,为大数据时代档案用户多样化的信息需求做好准备。档案用户管理平台在利用馆藏资源对档案用户进行线上和线下服务的同时,注重对用户的利用需求进行分析,找出用户需求与档案数据之间的关系,并将形成的档案用户数据及时提供给档案服务平台。档案服务平台要在收到数据之后,对档案馆已有的服务模式、理念、资源等进行优化,通过不断的反馈提高服务质量,在满足用户既有需求的基础上利用大数据技术预测出用户的潜在需求。
[1][13]维克托·迈尔—舍恩伯格,肯尼思·库克耶.大数据时代:生活、工作与思维的大变革[M].盛杨燕,周涛,译.杭州:浙江人民出版社,2013:3-8,109-104.
[2]云创大数据.大数据向人类认知方式提出新挑战[EB/OL].http://www.cstor.cn/textdetail_4392.html.
[3]新华社.十三五规划纲要(全文)[EB/OL].http://sh.xinhuanet.com/2016-03/18/c_135200400_6.htm.
[4]冯惠玲,张辑哲.档案学概论[M].北京:中国人民大学出版社,2006:103-127.
[5]陶水龙.大数据视野下档案信息化建设的新思考[J].档案学研究,2017(3):93-99.
[6]高波.文献信息资源共建共享模式新论[J].中国图书馆学报,2002(6):24-27.
[7]陈明.大数据概论[M].北京:科学出版社,2015:7.
[8]吴加琪.多主体与的区域档案信息资源共建共享机制研究[J].浙江档案,2016(7):7-9.
[9]郑金月.关于档案与大数据关系问题的思辩[J].档案学研究,2016(6):37-40.
[10]吴加琪.构建区域档案信息资源共建共享平台的思考[J].北京档案,2014(8):24-27.
[11]高波.文献信息资源共建共享模式新论[J].中国图书馆学报,2002(6):24-27.
[12]张涛.大数据带来的变革及应对策略[J].高科技与产业化,2013(5):59.
[14]于英香.档案大数据研究热的冷思考[J].档案学通讯,2015(2):4-8.
[15]寇京.公众参与式档案信息资源共建模式探析[J].北京档案,2017(7):29-31.
[16]孙洋洋.基于众包模式的档案馆信息资源协同共建研究[J].浙江档案,2015(11):17-21.
[17]周耀林,赵跃.档案资源建设与服务联动模式探析[J].档案学通讯,2015(5):51-57.