大数据时代对档案工作的影响及模式变化
2017-11-20陈婧
陈婧
(上海大学图书情报档案系上海201899)
大数据时代对档案工作的影响及模式变化
陈婧
(上海大学图书情报档案系上海201899)
随着大数据时代的到来,大数据的影响愈发热烈,档案资源作为大数据的一部分,其受到的影响也越来越明显。从大数据的概念及特性出发,与档案工作相结合,分析当下档案工作所具有的大数据特性以及大数据给档案工作带来的影响,进而提出了大数据时代档案工作模式应有的变化。
大数据档案工作影响工作模式
G270.7
A
2017-07-06
2012年3月22日,奥巴马宣布美国政府投资两亿美元启动“大数据研究和发展计划(Big Data Re-search and Development Initiative)”。这是继1993年美国宣布“信息高速公路”计划后的又一次重大科技发展部署。美国政府认为,大数据是“未来的新石油”,并将对大数据的研究上升为国家意志,这对未来的科技与经济发展必将带来深远影响。
可以说,现在的大数据是与自然资源、人力资源一样重要的战略资源,也是一个国家主权的体现方式。国家的竞争力也将部分体现为对大数据的规模、活性以及对数据的解释、运用的能力[1]。换句话说,一个国家在网络空间的数据主权将是继海、陆、空、天之后另一个大国博弈的空间。在大数据领域的落后,意味着失守产业战略制高点,意味着数字主权无险可守,意味着国家安全将出现漏洞。大数据将直接影响国家和社会稳定,是关系国家安全的战略性问题。结合到档案行业,档案数据也是大数据的一部分,如何维护好、利用好档案数据,为档案工作提供更多的帮助,就显得尤为重要。
一、大数据视野下档案的大数据特征
大数据的概念自不而言,在此不做过多赘述。大数据的特征我们认为现在是“5V”特征,即Volume(大体量)、Velocity(时效性)、Variety(多样性)、Value(价值)以及Veracity(准确性)。大数据时代的到来,对档案数据资源也赋予了新的特征。并且,笔者认为,档案数据作为大数据的一部分,它也具有了大数据的属性。所以,档案数据也具有了大数据的特征。如下表1所示。
表1 大数据视野下档案的大数据特征
1.海量档案数据增长迅速。大数据特征“大体量”、“时效性”对应于档案数据资源,我们可以看到档案信息资源总量也愈发庞大且增长十分迅速:据统计,我国“十一五”末馆藏档案已达到39264万卷(件),且据估算我国档案还正以每5年40%速度递增,这些海量资源将形成一个巨大的档案资源库,传统的集中存储与计算已经无法适应呈指数级别的数据增长速度。
2.档案数据类型繁多且结构复杂。大数据特点“多样性”也很好地体现在了档案数据中。档案数据类型也越来越多,包括:从以前的图片、音频、视频、纸质文件、电子文件等,加上现在的用户利用信息、服务数据、档案馆交互数据等信息,形成了大量的异构数据:既有结构化数据,也有非结构化数据。
3.档案数据资源丰富且价值高。大数据特征“价值”、“准确性”体现在档案数据中:档案数据资源丰富且价值高。档案数据资源是国家和社会精心保存的历史记录,所以其来源都非常真实,数据分析时精准度也就提高了,并且这些数据具有很高的利用价值。且大数据时代的到来又让档案数据资源能得到更深层次的挖掘和分析,以此又能获得新的信息和资源,所以其价值很高。
二、大数据给档案工作带来的影响
孟小峰、慈祥在《大数据管理:概念、技术与挑战》一文中把传统的数据库比作“池塘捕鱼”,把大数据比作“大海捕鱼”,详细分析了二者的差异[2]147。笔者认为这是一个很好的比喻。确实,捕鱼环境变了,跟着很多东西都变了:鱼的数量和种类多了,捕鱼的方式也更加灵活多样了,甚至捕鱼环境也在不断改变。所以,大数据时代的到来,确实是一个全新的变化。它带给我们挑战,也带给我们机遇。
1.机遇。大数据时代给档案工作带来了一定机遇,也带给我们很多机会。大数据时代的必然就是,经济主体会从企业为中心到以个人为中心;经济活动会从高效生产到普适化交易,交易形式也会从中介型交易走向个体对等(P2P)交易。大数据在数据处理理念上有三大转变:要全体不要抽样,要效率不要绝对精确,要相关不要因果[3]。总体来说,机遇有以下几个方面。
(1)大数据的支持能够提升档案资源价值。大数据更新了传统档案数据资源,激活了原有的数据,进而提升了档案资源质量。档案馆的数据处理范围、方式、对象等都将发生巨大的变化。同时,传统的档案业务将向数据分析、数据挖掘方向转移,对海量数据的分析与处理将成为档案馆的主要业务内容[4]65。可以说,大数据对于档案服务的提升起到了关键性的作用,深度挖掘其潜在价值、存在规律,将很好地提升档案服务水平。
(2)大数据能够促进档案工作的发展。利用大数据的分析预测功能,我们将能够改进档案工作的发展策略。具体到档案馆工作中,我们的关注点将不仅仅是传统的馆藏资源、建筑外观、借阅服务,更多的是档案数据资源量、数据处理能力、数据分析挖掘能力、数据共享能力等。对于大数据的深刻剖析,更能发现事物的本质及其规律,更好地辅助工作人员制定发展策略。所以,这一切都依赖于大数据。
(3)大数据或可成为档案行业的核心资产。不可否认的是,未来档案工作的发展要依靠对档案大数据的综合掌握,档案大数据或成为档案行业的核心资产。例如档案馆的馆藏数据、用户的需求数据、用户浏览数据等都可能成为未来档案馆进行趋势分析的重要依据,也关系到档案馆的发展前景。很多有价值的数据都是转瞬即逝,能够对档案数据进行实时归档、实时调用、实时分析就显得很重要了。所以,要在数据拥有量的基础上拓展这些技能,更好地为档案工作服务。
2.挑战。(1)档案数据存储能力的挑战。大数据的“大”,不仅体现在数据量的大,还由于它的实时性和动态性,导致数据加速度增长也很快。如何有效地将这些数据分类存储、实时归档存储并能随时取出为我们所用,就给我们提出了一个很大的挑战。(2)档案数据安全问题。大数据所带来的数据安全问题也被很多学者所关注。并且很显然,我们在生活中已经感受到了各种数据安全问题。例如各种诈骗电话、盗用个人信息进行违法行为等,档案数据同样面临着安全方面的问题。如果一些机密档案泄露,很可能造成无法挽回的后果。所以,对于档案数据安全问题,仍然需要加强,需要更好的保障。(3)综合素质人才的紧缺。主要是缺少数据分析、数据挖掘、数据安全、数据处理等方面的人才。从人才培养的角度看,数据专家不仅仅需要技术方面的技能,还要有一定的内在素养,不仅要掌握计算机、统计学方面的知识,还要有管理学、心理学等这些文科方面的素质。大数据不是简单的大量数据的堆积,它有很强的关联性,所以传统的专业知识结构不能满足大数据环境下人才的需求。从信息技术角度看,它的发展就是多学科的交叉融合,所以,有必要加强档案学科和其他学科的交叉学习,进而拥有更具综合实力的人才,更好地为档案工作服务。
三、大数据时代档案行业工作模式转变
1.思维模式的转变。大数据时代在思维模式上的转变主要是三个方面:一是管理思维上从经验驱动转向循数管理;二是服务思维上从供给导向走向需求导向;三是业务思维上从关注因果关系逐渐走向更多关注相关关系[5]。而我所说的思维模式的转变,主要是指信息化思维、技术性思维和分享性思维。
具体来说,信息化思维就是依托信息技术、依赖技术人员、依靠技术进步的生存发展模式,信息化思维就是在一切档案工作中用信息化视角认识事物,用信息化方法分析矛盾,用信息化手段处理难题[6]。主要分两个方面,一是数字化,包括档案目录的数字化(建立档案目录数据库)和档案全文内容数字化(建立档案全文数据库);二是数据化,也就是把数字转化为数据加以利用的能力。因此,档案部门要加强档案数据化建设,将档案管理提升到知识管理层面,为大数据时代的档案管理与服务奠定坚实的数据基础。
技术性思维就是要构建档案资源与用户需求的双向理想控制[7]。大数据时代,档案馆要借助技术,对广泛异构的数据源进行抽取和集成,结果按照一定的标准统一存储,利用合适的数据分析技术对存储的数据进行分析,从中提取有益的知识并利用恰当的方式将结果展现给用户[8]151。我们要从常规思维转向更广、更深的层次去思考和挖掘数据价值,例如利用文献调研与模型分析法、知识图谱法、德尔菲法与层次分析法等大数据技术去发掘档案信息内容[9]。因此,拥有技术性思维能有效帮助我们档案工作取得更大程度的飞跃。
分享性思维是指资源的一个共享。档案资源同样需要进行共享。例如,地方档案馆之间、国内档案馆之间、国际档案馆之间都需要进行资源共享,在这种交流碰撞中就可以综合更多的资源,获得更多的信息,从而有利于档案工作更深层次的发展。
2.服务模式的转变。档案数据化也引领着档案服务模式的创新。在如今这个时代,服务已经成为第一位的体验。大数据时代提出的一个新目标是价值服务。因为,拥有大量的数据本身并不会增加任何价值,数据的核心是价值,而驾驭数据的核心是分析[10]。
笔者在本文中对档案工作提出的服务主要是指个性化服务和智能化服务。大数据时代档案利用者也表现出与以往不同的特点,突出表现为档案利用者对档案数据资源的个性化需求日益增强[11]66。大数据时代使得档案资源变得多样化、复杂化,且档案资源总量庞大,致使档案利用者的利用方式也趋于多样化、个性化。传统单一的档案利用方式已不能满足这些利用者,他们需要更多的个性化方式。所以,我们要在档案工作中引入个性化的思想,进行档案资源的个性化管理,对档案数据资源个性化服务系统进行改进,体现大数据时代档案资源的价值。智能化服务则是对应于大数据带给我们的科技的飞速发展。档案的服务工作中我们也要做到智能化,紧跟时代步伐,不断更新服务方式,灵活运用现代智能技术,提供智能化服务。
四、结语
社会进步和技术发展都为档案工作的发展提供了源源不断的动力。因此,档案工作要想在大数据时代做出一番成绩,就必须在认清楚现有基础的情况下,加强档案业务数据的分析、管理和应用,主动创新档案行业的服务模式,提升竞争力和内涵。但同时,在大数据热潮下我们也要保持一定的冷静,在不断变化前进的时候不能盲目去做削足适履与本末倒置的事情,那样就适得其反了。我们在进行技术创新与管理转型的过程中,应保持理性,档案信息化工作有其本身的规律、特点和任务,不必为了贴上大数据标签而透支大数据概念[12]。总之,我们要在做好传统档案工作的基础上,再去不断突破和创新,在法律的框架下做出更有益于档案工作的事情。
[1] 李国杰,程学旗.大数据研究:未来科技及经济社会发展的重大战略领域——大数据的研究现状与科学思考[J].中国科学院院刊,2012(6):647-657.
[2] [8]孟小峰,慈祥.大数据管理:概念、技术与挑战[J].计算机研究与发展,2013(1):147
[3] 李广建,化柏林.大数据分析与情报分析关系辨析[J].中国图书馆学报,2014(2):14-22.
[4] [11]田伟,韩海涛.大数据时代档案馆服务创新研究[J].档案学研究,2014(5):64-67.
[5] 周枫.资源·技术·思维——大数据时代档案馆的三维诠释[J].档案学研究,2013(6):61-64.
[6] 张军.试论“大数据”环境下档案人应有的思维方式[J].档案管理,2014(3):50-51.
[7] 宋淑琴.大数据视野下档案管理思维方式的转变[J].档案学研究,2015(3):36-39.
[9] 王兰成,黄永勤.大数据背景下档案社会化媒体信息的挖掘与利用探析[J].档案学研究,2015(6):73-76.
[10] BillFranks.驾驭大数据[M].黄海,车皓阳,王悦,译.北京:人民邮电出版社,2003:12,6,1-5.
[12] 于英香.档案大数据研究热的冷思考[J].档案学通讯,2015(2):4-8.
Influence of the Big Data Age on Archives Work and Mode Change
Chen Jing
(Library,Information and Archives Department of Shanghai University,Shanghai 201899,China)
With the arrival of big data age,the impact of big data becomes increasingly intense,and archives resources as part of big data are influenced more and more obviously.Starting from the concept and characteristics of big data,combined with archives work,the paper analyses the big data characteristics of the current archives work and the impact of big data on the archives work,and then puts forward the changes of archives work mode due in the big data age.
big data;archives work;impact;work mode
陈婧,上海大学图书情报系硕士,研究方向为档案管理。