应然与实然:大数据背景下机关人事档案信息化建设的路径选择
2019-03-18李桂宁
李桂宁
摘 要:大数据的迅速发展正有效地推动着社会各个领域的变革,也为机关人事档案信息化建设带来重大机遇。文章分析了当前机关人事档案建设中的实然现状,档案种类呈现单调性、数据形式缺乏结构性,档案信息欠缺互补性。思考了大数据时代机关人事档案数据的应然水平,需呈现丰富性、结构性、时效性和价值性。最后提出实现机关人事档案从实然状态向应然水平平稳过渡的“三步走”策略。
关键词:档案信息化;大数据;机关人事档案
大数据的迅速发展正有效地推动着社会各个领域的变革,人们思考问题的方式、获取信息的途径、人际交往的行为倾向等皆因信息技术的介入发生巨大变革,其威力正深刻影响着档案信息化建设的理念与方式。2016年,国家档案局颁布了《全国档案事业发展“十三五”规划纲要》,首次在文件中提及“大数据”“云计算”等新兴技术名词,彰显了国家对大数据时代档案信息化建設的重视。
1 实然:机关人事档案信息化建设的现状
当前电子政务工作开展的如火如荼,档案信息化建设也经历了探索起步、迅速发展以及深化转型阶段。但是,就现实情况而言,目前机关人事档案的信息化建设处于尚处于初步探索阶段,建设水平良莠不齐。通过文献分析与工作实际,发现机关人事档案信息化建设中主要存在三大问题:
1)档案种类存在单调性。当前机关人事档案存在内容陈旧,结构单一的现象。人事档案往往分为十类,以个人资料、政治背景为主,主要反映个人生平事迹等基本情况,有关个人考察考核、表彰奖励、学业工作成就等材料较少且承载信息有限,难以反映用户整体的工作状态。这种千人一面的档案材料不足以反映出用户的人生履历,缺乏全面性。大多机关单位人事档案仍是纸质形式,依旧以人工操作为主,这种档案管理形式往往效率低下,且难以实时增补档案信息,缺乏动态性。
2)档案数据忽视结构性。已有的机关人事电子档案,往往采用OCR识别技术,将纸质版档案转化为电子档案,存档形式往往是非结构化的数据形式。因此这种直接扫描得到的电子档案本质上是无序的,虽然能够进行有序化整理,但往往沿袭传统人事档案编排方式,难以彰显信息化的优势。另外,这种形式的电子档案由于没有借助结构化的“实体—联系”(E-R)数据库模型,实际应用时,难以分析人事档案之间的内在联系,导致数据孤立形成信息孤岛的现象。
3)档案信息缺乏互补性。一些机关单位已经初步执行档案信息化管理,从应用途径与方式来看,大多数单位往往将电子档案看作纸质档案的拓展形式,并非将其与档案管理平台建立关联,实现优势互补,对现有档案进行更新与增减时,档案管理人员往往不仅需要对纸质档案进行修改,也要对电子档案进行完善。长此以往,在档案管理工作中存在大量重复且冗余的信息,无形中延长了工作时间并消耗了大量精力,档案管理人员对网络管理平台中的档案缺乏分析与利用,导致网络管理平台成为孤立的空间,优势难以体现。
2 应然:大数据支持下机关人事档案信息化建设的追求
1)大数据。大数据最早出现于1997年,NASA两名研究员针对飞机周围的模拟气流无法处理且可视化呈现,他们认为这种数据集相当大,对主内存和磁盘均产生挑战的问题为大数据,主要应用领域涉及数据挖掘和数据分析。大数据的类型一般有非结构化、半结构化与结构化三种形式。非结构化的数据是那些没有固定存储格式的数据,如以pdf、word形成存在。半结构化的数据是经过一定加工处理的数据,如以XML、HTML形式存在。结构化的数据是经过处理、具备一定结构,并可进行存储、处理及提取的数据,如数据库中的数据。
2)大数据为机关人事档案信息化建设提供新思路。档案信息化是指档案在不改变其实质的情况下,其结构与存在方式作符合信息原则的转变。也就是说,不改变机关人事档案内容信息,只改变档案存储的载体与结构,甚至在大数据技术的支持下,能够借助信息化的手段,挖掘数据之间的内在关联,并进一步预测其未来发展趋势。而机关人事档案信息是信息资源中的一部分,具有一般信息所具备的特征,因此借助大数据视角,审视档案信息化建设也是有迹可循的。首先,机关人事档案数据应体现丰富性,大数据能够容纳百万兆字节甚至千兆兆字节的数据,解决数字化档案资源难以存储的困难;其次,机关人事档案数据应体现多样性,当前机关单位的数字化人事档案往往是由纸质档案扫描而来,采用pdf、word、excel等方式存储而来的非结构化数据,形式较为单一。在大数据背景下,可支持记录的数据类型多种多样;再次,机关人事档案数据应展现时效性,大数据时代的典型特征是对数据及时快速的处理,它能够将档案分门别类进行存储,并设置相关索引,从而能够实时查询并更新数据,体现出数据处理的高效性、时效性和价值性。
3 可然:实现实然状态向应然水平平稳过渡的策略
大数据在机关人事档案信息化建设过程中,一方面需要考虑如何借助丰富的信息化手段,增补已有数据,并不断丰富数据类型,拓宽数据采集的方式与途径。另一方面,需要思考如何高效处理数据,挖掘档案数据、用户数据的价值,并分析数据之间的内在关联,以预测趋势走向。本文认为,从机关人事档案信息化建设的实然状态向应然水平转向的过程,并非一蹴而就,而是逐层递进的。因此,提出大数据背景下,机关人事档案信息化建设的“三步走” 策略,实现从实然状态向应然水平的平稳过渡。
1)全方位的机关人事档案数据采集与处理,着力提升档案管理的广度。明确数据容量的丰富性和数据种类的多样性,是机关人事档案数据采集的前提,有意识的采集记录用户成长发展的音视频档案,可以丰富和完善已有的档案类型,全方位、多角度记录机关人员成长轨迹,实现机关人事档案的全文著录、数字化文件归档、数据库构建以及标签索引的建立等工作,帮助档案管理人员通过普通检索,高效查阅到不同人事档案。
2)多层次的机关人事档案数据挖掘与分析,着力提升档案管理的深度。大数据关注的更多的是人,而非产生的数据,数据是为人的发展与进步所服务的,其内在价值在于数据挖掘与数据分析。对纸质档案数据化后,容易出现信息超载现象,对档案管理人员产生信息负荷。因此需要对人事档案数据进行挖掘与分析,实现准确洞察与精准决策。数据挖掘与分析是指利用统计学、机器学习等手段与方式,对机关人事档案数据进行处理与分析,挖掘用户信息。通过对档案管理人员的检索记录与浏览历史进行挖掘,发现管理人员点击率较高的档案目录并进行数字化。分析档案管理人员检索时选用的检索词,完善数据库中索引关键词,以提高检索准确性。
3)个性化的机关人事档案数据检索与服务,着力提升档案管理的效度。基于前两步策略,可实现人事档案资源的数据存储、挖掘与分析,而第三步策略则是在已有的基础上,达成智能化检索与个性化推荐的目标。与普通检索方式相比,个性化推荐系统能够根据挖掘出来的检索偏好数据,通过一定的优化算法,将符合档案管理者检索需求的人事档案,个性化的推荐给档案管理者,并引导档案管理者发现自己的需求,从而极大的优化搜索流程,提高检索效率。
总而言之,大数据技术为机关人事档案的信息化建设提供多种可能性,数据的采集与结构化的存储使得档案的高效检索成为可能。数据挖掘与数据分析技术能够深入挖掘数据背后暗含之义,实现数据的增值。而档案的个性化推送与服务功能,真正实现“以档案工作者为中心”的理念,基于不同工作者的检索差异提供个性化的推荐服务。三步走策略层层推进,有效帮助机关人事档案信息化建设实现从实然状态向应然水平的平稳过渡。
参考文献
[1]张军.试论“大数据”环境下档案人应有的思维方式[J].档案管理,2014(03):50-51.
[2]田伟,韩海涛.大数据时代档案馆服务创新研究[J].档案学研究,2014(05):64-67.