“大数据”背景下西部高校档案工作发展浅析
2016-08-02龙宛苡
摘 要:本文首先简要介绍大数据概念界定和特征,其次通过描述大数据背景下西部高校档案工作发生的新变化,接着对当前西部高校档案工作的尴尬现状进行阐述,最后对此提出建议。
关键词:大数据;西部高校档案;发展浅析
现今IT业发展之快令人应接不暇,“大数据”技术横空出世可谓炙手可热,2013年甚至被称为“世界大数据元年”,开辟时代新局面,赋予时代新内涵。我国政府为抢占新一轮科技竞争战略制高点,将大数据上升为国家战略层面,战略部署辗转西部,随之大数据渗透至各行业,并成为迅猛发展的新动能。步入“大數据”时代档案行业应如何适应并借势而上、立足潮头?本文立足于“大数据”背景下,以国家大数据战略为契机,呼吁西部高校全面推行档案信息化工作,利用“大数据”的优势充分挖掘有价值的信息,提高档案管理工作效率,从而提升档案服务质量。
1 大数据概念界定与特征
(一)大数据概念界定
工信部在《2014年大数据白皮书》[1]中提出大数据,源于2011年5月麦肯锡从经济和商业维度诠释大数据发展潜力的专题研究报告:大数据指的是大小超出常规的数据库工具获取、存储、管理和分析能力的数据集。[2] 维基百科释义“大数据”,指所涉及的数据量规模巨大到无法通过人工在合理时间内达到截取、管理、处理并整理成为人类所能解读的信息。[3] 大数据是一个总称性概念,它还可以细分为大数据科学、大数据技术、大数据工程、以及大数据应用等不同领域。[4] 如IBM、Teradata和oracle等研究集中于大数据技术研发,MIT(Massachusetts Institute of Technology,即麻省理工学院)Cal(University of California,Berkeley,即加州大学伯克利分校)这些高校大多聚焦于大数据科学研究,政府企业更倚重大数据应用方面。虽然目前对大数据没有很统一的认识,但多数比较认同大数据是指对数量巨大、类型繁多的数据进行采集、预处理、存储、分析,发现新的知识,挖掘新的价值并应用到实践中,从而提高效率。
(二)大数据特征
2001年,高德纳咨询公司分析员Doug Laney在其研究演讲中将数据增长特性归纳为有三个,分别是:量(Volume)即数据多少;速(Velocity)即资料输入、输出的速度;类(Variety),即多样性。在此理论基础上,IBM提出大数据的4V特征,得到了业界的广泛认可。(1)Volume(数据量大),
每年数据量剧增,从PB到ZB数量级甚至更大,IDC的报告指出早在2013全球数据量4.4ZB;(2)Variety(数据类型多),包括传统的格式化数据,以及来自互联网的日志、视频、音频、图片、地理位置信息等数据类型;(3)Velocity)(处理速度快);(4)Veracity(真实性),即追求高质量的数据。
大数据技术与传统的数据挖掘技术有着本质的不同,它开发数据网络挖掘、特异群组挖掘、图挖掘等新型数据挖掘技术,从各种类型的数据中快速获得有价值信息,时间越长大数据分析价值就越低,甚至失去意义。
2 大数据背景下高校档案工作新变化
大数据渗透各个行业使得人们进一步认识关注信息资源,并且不断从深度上挖掘,从宽度上拓展,实现利用最大化,高校档案作为信息资源的重要组成部分,必然受到影响并已悄然发生新变化。
(一)高校档案信息量急剧增长
档案是社会组织或个人在以往的社会实践活动中直接形成的清晰、确定的原始记录作用的固化信息。在大数据背景下,高校学生的学籍、选课、成绩、借书、上网、论坛、微博、教师的基本信息、上课课件和视频、远程教育课程等都会产生大量数据,同时还有设备、机房和图书信息等也会产生大量数据。[5] 除人才培养方面意外,高校管理活动、科研学术、社会服务等同样也会产生大量数据,这些数据量大,类型多样,来源分布广,变化速度快,明显具备了大数据特征。以贵州医科大学(简称贵医)为例,
数据来源的主要渠道:(1)各类网站。贵医现有1个学校主页网站,下设多个院系、党群行政和直属单位等二级网站;(2)各级管理系统。部分业务部门有自己的管理系统,如办公自动化(OA)、教务、学生、财务、人事等系统,每天都会产生大量的数据;(3)科研数据。贵医每年在科研中也会产生海量的实验数据;(4)各类媒体报道。在各个新闻媒体时有关于贵医的报道。从上述几个渠道产生的信息量大且种类多,都具有一定价值,属于归档范畴,可见高校档案信息量与日俱增。
(二)高校档案信息需求剧增
当下高校档案用户信息需求呈现多元化的发展,包括教学、科研、校园文化等各个方面。随着践行“阳光政府”信息公开,人们对国家的法律政策和学校的相关规定等需求不断增加;随着学校发展壮大,如今高校更加重视文化底蕴的建设,纷纷开展诸如历史、名人、校园文化等特色档案,如贵医2014年更名(贵阳医学院更名为贵州医科大学)期间,利用历史档案、名人档案、特色档案等总计600余次;时代在进步用户对高校档案利用也提出了更高的要求,如近几年的出国深造、移民等人数逐年增多,有学生要求档案馆出具中英文成绩单及学籍证明,如贵医2013-2015年期间,有此要求的次数分别是2次、8次、19次,逐年呈上升趋势。可见,大数据促使高校档案数量增长,同时刺激用户对档案信息的需求类型随之提高。
(三)高校档案信息价值提高
大数据进行数据挖掘,首先需在从海量信息中,提取真实可靠有价值的信息。高校档案是指高校从事教学、科研、管理等活动直接形成具有保存价值的各种图文、声像等不同形式的记录载体。正因为这类信息资源最真实可靠、最具权威的特性,在进行大数据挖掘和分析技术处理时比其他信息资源更具优势。
3 西部高校档案工作面临尴尬现状
大数据背景下高校档案信息量与日俱增、种类繁多,传统的档案工作方式已无法适应新的变化,实施档案信息化建设迫在眉睫,然而西部高校档案工作面临尴尬的现状很难跨越第一步。
(一)对档案信息化建设工作重视力度不够
高校普遍存在对档案工作重要性认识不够,档案工作未列入学校考核指标范畴,因此对档案工作缺乏指导、关注少,资金投入不够、人员配置匮乏,从而导致档案事业的发展滞后。西部高校财政本身的困窘,档案工作专项资金更少,要实施档案信息化建设,需要必要的资金投入保障,用于档案信息化的服务器、扫描仪等相关硬件设备高达数万元,档案资料繁多外包成本高达数百万元,西部各高校档案馆每年可支配经费应付日常开销尚且捉襟见肘,数百万资金望而却步,人员严重匮乏情况进行档案信息化建设显然是力不从心,如贵医档案馆在编4人,在馆档案5000余份。
(二)档案信息服务能力与方式滞后
档案部门长期习惯保管重于利用的工作方式,以文书管理为主;馆藏结构类型单一;仅限为教职员工生服务;用户亲自办理相关审批手续,程序较为繁琐。部分西部高校没有设立档案馆,档案以科室隶属于人事组织等部门,查阅登记等还是手工方式,没有引入档案管理系统,即使应用该系统的高校也普遍存在以下问题:1、在检索上查全率和查准率低,系统信息更新速度远远赶不上每日信息量。档案利用常通常采用借阅、复印等形式,录入系统的仅仅是简单的目录,很难对档案信息分析处理,更难挖掘出有价值的信息。如贵医档案馆2013年成立,目前还没有引入档案管理系统,还是传统人工收集、整理、登记等工作方式。可见,档案信息服务能力与方式远远满足不了大数据发展需求。
(三)档案信息安全问题凸显
各类信息资源在大数据背景下逐渐开放和共享,同时给档案信息带来了安全隐患。西部高校进行档案信息化的为数不多,国家相关法律法规滞后于档案信息化的发展,因此没有统一标准进行规范化控制,无法建立健全的档案信息安全保障体系。如我国在上世纪90 年代初开始信息化建设,1999 年颁布《电子文件归档与电子档案管理办法》,直到2001 年才出台《档案管理软件功能要求暂行规定》等。
大数据背景下西部高校档案工作发展建议
在大数据背景下,西部高校档案工作迫切需改变传统的工作模式,充分挖掘档案信息的价值,全面建设档案信息化,改进工作方式,以适应大数据时代的发展要求。
(一)抓住发展机遇 加快档案信息化基础设施建设
西部高校档案信息化建设的必要前提是大量资金支持,资金问题一直是制约档案工作发展的主要因素,因此档案部门应紧跟国家发展脚步,多方寻求支持,抓住发展机遇。五中全会公报提出实施“国家大数据战略”,标志着大数据战略正式上升为国家战略,我国政府为抢占新一轮科技竞争战的略制高点,战略部署辗转西部,国家级首个大数据综合综合试验區落户贵州,IBM在成都建立云计算大数据中心,腾讯云数据中心落地重庆,契合了西部高校档案工作发展壮大的迫切实际需求,以此为依托争取国家支持,全面实现档案信息化,提升档案利用价值。同时,应当把档案事业纳入到学校整体发展规划中,实时进行监督管理,给予必须的人财物等资源,为学校的档案信息化建设坚实后备力量。
(二)提高档案工作服务能力与方式
挖掘档案有价值信息,西部高校信息化起步晚,首先就得规范收集,在原有范围基础上,增加对人物、历史、文化等类型收集,
并且高校档案工作须实时与各业务系统对接,确保电子文件的形成、运行和归档过程真实可靠性。同时还要关注并主动收集电视、互联网等各种媒体上产生的档案资源。搭建档案管理系统,确保该系统的扩展性,服务器能承载巨大的数据量,检索方式延伸至可以搭建内容,确保该系统检索功能良好。逐步开展档案信息加工服务,针对用户提出的需求,通过加工给予有价值的服务,提升档案服务质量。对外经济贸易大学档案馆开发了成绩管理系统,该系统能自动翻译学生成绩,并制作统一、规范的成绩单等成品,实现档案利用高效率,受到师大的好评也值得我们学习借鉴。
( 三 ) 加强档案信息安全管理能力
大数据给档案信息资源带来隐患,西部高校档案信息安全还是沿用传统模式,因此要特别加强信息安全管理,构建信息安全保障体系。首先档案工作人员要树立高度的责任感与安全意识,认识数据重要性并确保其安全、保密,这是任何预防任何隐患的必要前提。高校档案部门从技术着手,通过设立多重不同密码、全方位进行监控、网络安全技术等严格控制访问,加强隐私管理,保留检索日志,避免档案泄密;建立数据备份系统防止信息化资源被毁坏、遗失,实现信息化档案异质异地、随时保存备份。同时,高校档案部门应根据学校档案工作发展实际需求,制定信息安全方面的规章制度,确保各项工作有章可循。
总而言之,西部高校档案信息化较发达地区高校起步晚,发展缓慢。大数据时代到来,不仅给传统档案管理工作带来新的挑战与机遇,以国家大数据战略重心投入西部为契机,赢得相关管理部门与学校的大力支持,结合实际做好统筹规划,全面推动实现高效档案信息化的可持续发展,提升高校档案利用。
参考文献
[1] 工业和信息化部电信研究院.大数据白皮书 [R].2014.
[2] James M, Michael C, Brad B. Big data: the next frontier for innovation, competition and productivity [R].McKinsey Global Institute.2011.
[3] 维基百科. 大数据[EB/OL],(2014- 02- 21)[2014- 02- 27]. http://zh.Wikipedia.org/wiki/大数据.
[4] 黄欣荣.大数据时代的思维变革[J].重庆理工大学学报(社会科学).2014,(5):14
[5] 任祎.大数据时代下高校信息化建设思路探究 [J].电子测试,2014,(7):128-130.
作者简介
龙宛苡(1986-)女,苗族,贵州铜仁人,贵州医科大学档案馆,助理馆员。