探讨大数据时代背景下的档案管理模式
2016-04-05杨明
杨明
(四平市铁西区平西乡人民政府计划生育指导站,吉林 四平 136000)
探讨大数据时代背景下的档案管理模式
杨明
(四平市铁西区平西乡人民政府计划生育指导站,吉林 四平 136000)
文章首先讨论了在数据时期的背景下,档案馆融入智慧城市的建设、电子文件的管理、档案数据的存储与备份、档案馆加入政府 2.0的建设、档案管理工作从实体管理上升到常识管理等方面都需要引入大数据技术;其次,介绍了档案管理中的大数据应用;最后总结了在大数据时代下对我们是机会也是挑战
大数据;档案管理;需要方法
1 新时代背景下档案管理引入大数据技术的必要性
(1)档案馆深入智慧都市需要大数据技术。2012年2月20日,住房和城乡建设部公布了首批91个智慧都市试点,这个由国家统一监督和指导的都市建设正式起航。要建设智慧城市,应该做到“节省能源加重信息传播”、“重视信息减少灾害”和“利用信息帮助群众”这几点。一个永久保存档案并提供档案为社会服务的科学文化事业机构的档案馆,里面储存着很多的档案,这里是信息汇聚的地方,但是由于人力资源稀少、技术不成熟等原因,使这些信息没有得到合理的运用。智慧都市的开展成为了对档案资源开发和运用的大好时机,一个可以深入到城市中并变化形象的机会。智慧都市需要信息的运用,要想深入到城市中去就要好好地使用这些数据,使智慧都市出现数据流,为上到高层,下到小民去运用,要使整个档案馆的信息发出新的活力,找到其中所具有的无比财富,单单依靠人力是不可能实现的,一定得是技术,所以大数据处理技术是必须之选。
(2)对数据的管理需要大数据技术。在这个时期,储存文件的数量已经堆积成山,储存文件的去向成为了一个大问题,人们只知道这些储存文件中有许许多多的商机,同时也知道要从堆积如山的文件中得到财富是何等的艰难。对于这些如山的储存文件,人们一直推举的“直接鉴定法”将会有很大的危机,在去一件件找寻信息根本不可能。直到后来有人总结出了比较类似的方法,就是从整个文件中找到有价值的东西,进而就避免了对人力的浪费。从这个方向看,在确定这个储存文件的管理权以后,就可以对这个类型的储存文件进行筛检,但这仅仅是储存文件的第一步,在今天的配置下,筛检这些十分简单,问题是怎么很快的从这些如山文件中找出需要的文件;以及怎么样给他们分类;怎样鉴定那些文档是有用的;怎样从中找到人们所需要的。
要想解决上述提出的问题,档案工作者要在管理方面下功夫,技术方面也不能落后。大数据技术就是技术的一个更新。将人们发明的新硬件安装到以前的版本上,这样可以收集到新的储存文件,这个可以达到每天TB甚至是向PB数量级增长,大数据软件可以在这些如山的储存文件中建立索引。
2 使用非结构化电子文件离不开大数据技术
(1)新时期储存文件的备份离不开大数据。大数据有好多分类,其中有结构化数据、半结构化数据和非结构化数据,现在的互联网出现了非结构化数据增长十分快速的特征,到2012年的年末,非结构化数据已占到整个数据的70%以上,同时,由于数据显性或隐性的网络化存在,让储存文件间的联系一直无处不在。一直以来,人们整理储存文件一直是关系型的,其中代表的有IOE(I指IBM的服务器,O指Oracle的数据库,E指EMC的存储模式)模式,档案行业也一样,可是在现在的形势下,IOE模式已经落后了很多。大数据模式除了有庞大的规模之外,还有这如山的文件数量,这是文件系统及原数据管理的一大难题,一旦处理不当,就会影响到很多方面。对于这些成长迅速的非结构化文件,进行储存文件整理时就处处困难,而在大数据库的基础上,像SQL这些已经可以完成关系数据,更别说是空间数据、图像、数据流等非结构化数据,而且基于对象的存储架构可以在一个系统中管理十亿级别的文件数量,减少很多不必要的麻烦,大数据技术给文件管理这一问题提供了一个很好的处理办法。
档案数据库的应用大大提高了馆员的工作效率,但是在这几年,馆员在利用档案数据库的过程中,经常会遇到不能给数据库中添加新的储存数据的情形,这就是之前所遇到的的“胀库”现象,这是因为库房的容量不足造成新的档案储存不到库中。根据新闻报道,从2013年6月至2014年2月八个多月的时间中,香港政府所处理的纸质信息堆起来的高度超过了24163m),这好比46个环球贸易广场首尾相接垒起来那么高,香港方面没有一个法律来说明不能这样做,所以官员们可以随便烧毁文件。人们在为这些有可能存在着财富的文件被销毁而默默心疼时,同样也被政府能够制造这么多文件给震惊到了,如果可以把这部分文档进行分类并储存的话,那样产生的数据数量将是十分巨大的。在档案信息化越来越完善的今天,并伴随着大数据的出现,档案数据库的内存已经远远不够。想要储存如山的文件并保证其安全,不能只是不断的建设大楼修建机房,再说,档案数据还要有备份这也需要大量的储存空间。这让档案馆不得不改善储存、增高效率和节省成本,和其他的电信行业、通讯行业、电子商务、微博运营等行业面对的内存不足问题相比,档案行业所需要的储存空间就不值一提了。通过调查一些大公司,如中国移动、腾讯、百度、阿里巴巴等,可以发现这些公司都是大数据应用的佼佼者,这又从另一个方面说明了大数据的应用已经开始成熟,说明了大数据储存可以解决空间问题,这些公司对大数据的使用经验可以被借鉴和运用。
(2)加入政府2.0的修建离不开大数据技术。政府2.0是政府在处理政务上一个很大的创新,它可以直接对话群众,从“闭关锁国”的结构逐渐走向一个开放、共赢、互动的结构,政府2.0可以对政务更高效率的进行处理,让政务人员可以在别的地方找到自己想要的消息。档案馆是一个非官方的机构,最基本的作用就是提供档案让人们所运用,建设政府2.0离不开档案馆,而现在每一个档案馆之间所用的档案管理系统都不太一样,档案信息七零八散的分布在各个档案馆之间,档案部门和政府之间也完全没有建立起沟通。随着大数据技术逐步繁荣,即使不在一个部门,不在一个区域,也能实现信息的共享,这大大提高了人们对储存文件的利用。
(3)档案工作从实体转型到知识离不开它。如今人们想要的不仅仅是如何使用这些储存文件,更多的是想要知道储存文件背后的一些事和其中所藏着的东西,所以,对档案的利用也转变成了为人们提供便利。一个好的处理核心可以说是档案服务的技术核心,也是储存文件的一大帮手,可以为人类创造更大的收益,发掘一些以前人们看不到的财富,是人类在大数据上走得更远的一个碣石。
3 结语
大数据时代的来临,可以说是对档案工作管理者的一个挑战,然则更大的是机遇。随着大数据技术的一步步成长,大数据一定会有更为宽大的平台,档案管理将在大数据时代涅槃重生,储存档案中所含有的巨大财富和知识将会真正的为人们所利用。
Exp loration of Archives M anagement M ode in the Age of Big Data
YANG M ing
(Family Planning Center of Pingxi Township People's Government in Tiexi District
of Siping City,Siping,Jinlin 136000,China)
This paper first discusses under the background of big data,integration of archives in the smart city construction, managementofelectronic documents,storage and backup of records data,construction ofarchives into government2.0 construction,filemanagementhave transformed from entitymanagement to common knowledgemanagement,which need to introduce big data technologies;secondly,this paper introducesbig data applications in filemanagement;finally,itsummarized in that the era of big data isboth opportunity and challenge forus.
big data;filemanagement;approach
G270.7
A
2095-980X(2016)11-0150-01
2016-10-07
杨明(1969-),女,吉林四平人,助理馆员。