大数据环境下高校档案资源体系建设研究
2019-03-13刘彩云
刘彩云
一、概述
高校档案资源作为国家档案资源的有机组成部分,其档案资源体系建设对保障国家基础性战略资源具有重要意义,如何转变高校档案工作的理念、技术、方法及模式,加强大数据环境下高校档案资源体系建设是高校档案馆面临的挑战。
1.概念界定
在大数据环境下,“档案数据”这一术语出现在学术研究中的频率越来越高,探讨高校档案资源体系建设需要厘清“档案数据”的概念。上海大学图书情报档案系副主任于英香指出:“对档案数据的界定除了从档案和数据本身出发,还须注意两方面的问题:一是档案数据应与档案信息(资源)区分,二是重新认识内容管理在档案数据管理中的地位”。同时,学者王金玲提出:“档案数据在传统意义上主要指与档案自身相关的目录数据和全文数据,并进一步将大数据环境下的档案数据划分为档案目录信息资源、档案内容信息资源、多媒体信息资源、档案应用信息资源、档案实体信息资源以及档案馆库信息资源六个大类”。综合两位学者的a观点,本文所提及的“档案资源”为广义的档案资源,包括档案本身和大数据环境下新技术应用于高校教学、科研等各项工作所形成的多媒體信息、应用信息等档案数据。
2.大数据环境下高校档案资源体系建设的必要性
一方面,在档案信息化与互联网利用成为大势所趋的背景下,结合新技术加强档案资源体系建设、提供优质服务是高校档案馆在大数据环境下实现转型发展、化挑战为机遇的契机。
另一方面,自2008年IBM公司提出“智慧地球”概念以来,全球掀起了智慧城市建设的浪潮,高等学校在智慧地球、智慧城市的带动下开始建设智慧校园,高校OA系统、教务系统、财务系统等的建设与推广驱动了大量电子档案的生成,探索高校档案资源体系建设是融入智慧校园发展大局、顺应档案信息化发展大势、打造高校智慧档案馆的发展需要。
3.大数据环境下高校档案资源体系建设的可行性
其一,大数据环境下开展高校档案资源体系建设具有政策支持。在宏观层面,改革开放不断深入和现代化进程加快,“四个全面”战略布局、国家大数据发展战略、“互联网+”行动计划的推进等措施对信息化建设进行了顶层设计。微观层面而言,《全国档案事业发展“十三五”规划纲要》将档案资源多样化、档案管理信息化作为发展目标,全面推进档案资源存量数字化、增量电子化、利用网络化,为高校档案资源体系建设指明了任务落实方向。
其二,大数据环境下开展高校档案资源体系建设具有技术保障。例如,云计算为高效率、低成本完成大容量、异构复杂数据计算提供了有效方式,数据挖掘技术为有效解决从数据到知识的转化提供了可能,数据可视化以及虚拟现实技术的应用为用户理解和感知信息提供了便利。此外,物联网、人工智能、定位技术等新兴技术的迅速发展与融合还将给高校档案工作带来无限的发展空间。
二、大数据环境下高校档案资源的特征
1.档案资源量大且增速快
高校档案作为高校开展各项工作和举办重大活动的原始记录,全方位记录了高校招生与就业、教学改革、国际合作办学、专业设置与发展规划、硕士点申报与审批、博士点申报与审批等工作的发展轨迹,随着改革开放的深入,教育事业的发展日新月异,在“双套制”管理制度的推行下,纸质档案数字化成果和增量电子档案呈现出快速、大量增长的趋势。
2.档案资源类型多元化
高校档案馆档案资源类型多元化特征体现为结构化、半结构化及非结构化数据并存。在保存传统的、经整理有序的纸质档案的同时,文档、图片、音频、视频、实物等载体多样、形式各异的异构数据也源源不断进馆,呈现出Doc、Pdf、Tiff、Txt、PPT、JPG、PNG、MP3、WAV、MPG、AVI等多种类型。
3.档案资源具有高价值
与大数据环境下大部分信息资源价值总量高、价值密度低的特点不同,“档案归档鉴定使档案数据的价值密度高于没有经过鉴定的一般性数据,档案是一种大数据‘富矿”,档案是经过人为鉴定、整理、归档的原始记录,相对其它信息而言,档案的原始记录性决定了其具有较高的价值并随着档案利用工作的深入而逐渐递增。
三、大数据环境下高校档案资源体系建设存在的问题
1.档案资源采集对象定位狭窄
首先,高校档案馆当前采取以实体档案为主、辅以“双套制”归档的管理模式,关注点仍局限于传统纸质档案与部分电子文件的收集,难以满足大数据环境下大量电子文件快速增长的管理与利用需求。其次,各大高校档案馆在对档案信息化建设的探索中未能高度重视档案数据的管理,“档案部门关注的是海量数据信息储存的软硬件系统建设,尤其侧重硬件方面的配置。而对于维护业务系统正常运转的日志数据、数据库软件系统支撑数据以及各种安全密钥等数据的管理尚未引起重视”。因此,在大数据环境下,高校档案资源采集对象的定位有待扩展。
2.档案资源采集来源渠道单一
高校实行档案材料形成单位、课题组立卷的归档制度,档案资源来源于党群、行政、教辅、科研等各部门及各院系,其采集渠道主要包括三种:一是材料形成单位传统立卷归档,这部分为纸质、音频、视频、实物等类型的档案;二是信息化建设下通过接口与档案管理系统连接、在线立卷归档的各部门(各院系)办公系统,如行政OA系统、财务系统、教务系统、科研系统等,这部分为电子档案;三是开展档案征集或捐赠活动。从采集对象来看,这三种渠道所采集到的档案资源关注点仍主要为狭义上的档案资源,忽视了相应档案数据的采集与管理,从采集范围来看,这三种渠道所采集到的档案资源难以覆盖学校网站、社交媒体等来源的信息。因此,在大数据环境下,高校档案资源采集渠道有待扩展。
3.档案资源采集技术有待提高
在大数据环境下,对海量数据价值的关注度不断提升,档案资源作为价值高且价值密度高的特殊数据,各类档案资源之间的内在关系亟待进一步挖掘分析,如何运用好大数据环境下的新兴技术对档案资源开展深度挖掘与分析是各个档案部门需要深思的课题。由于建设成本不足、技术突破困难、人才欠缺等多方面原因,高校档案资源体系建设侧重于馆藏纸质档案的数字化、增量电子档案的采集与存储,缺乏档案资源精细化管理,提供的档案服务利用层次浅,难以开展大数据环境下对档案资源“富矿”价值的挖掘。
4.档案资源存储处理效率较低
檔案的非现行性决定了档案工作本身具有滞后性,但在大数据环境下,智慧校园的建设产生了大量类型多样、结构各异的数据,这些数据最终有可能部分、甚至全部转化为档案资源,如何实时存储和处理这些异构的档案资源是高校档案信息化建设适应大数据发展趋势需要解决的难题。高校档案信息化管理手段还未覆盖档案管理的全流程,对潜在档案资源的存储与处理相对滞后,难以满足大数据环境下高效、快速处理数据的需求。
四、大数据环境下高校档案资源体系建设发展对策
1.转变档案信息化建设理念
高校档案馆作为集中统一保管高校档案资源并提供信息服务的阵地,转变档案信息化建设理念,一要树立广义的“档案资源”观念,充分认识大数据给档案资源来源、数据存储与处理等带来的变化,拓展档案资源体系建设的外延与内涵;二要对档案资源体系建设进行长远规划,将海量档案数据战略纳入智慧档案馆建设规划,实现增量档案电子化、存量档案数字化、档案服务网络化、资源开发深度化、馆库管理智能化,以信息化促进档案工作现代化。
2.拓宽档案资源采集范围
从广义的档案资源出发,在大数据环境下必须进一步拓宽档案资源的采集范围,除了传统档案资源的收集,“对实时产生的具有证据价值、信息价值、服务价值的数据都应该进行有效管理”。高校档案馆开展馆藏纸质档案数字化、增量电子档案归档的同时,应加强对多媒体信息资源(包括媒体信息、网站信息等)、档案应用信息资源(包括用户信息、档案利用信息等)、档案实体信息资源(基于RFID电子标签所产生的档案实体位置信息、出入库信息等资源)、档案馆库信息资源(智能化设备运行产生的供电信息、温湿度信息、安保信息等)等结构化、半结构化、非结构化信息资源的采集。
3.推行档案资源异构采集策略
由于大数据环境下的档案资源类型多样、结构各异,必须提供多样化的资源采集方式,实行异构采集策略,以满足不同档案资源类型的采集。一方面要加强学习智慧档案馆建设的优秀典型案例,吸取先进的档案资源采集经验,如,青岛市档案馆推行的“包含控制中心、魔方适配器、主动捕获引擎、嵌入式工具集和资源池的数据魔方式的智慧收集”。另一方面,加强高校档案人才队伍建设,通过举办工作人员培训和引进人才,加强对应用接口、数据交换引擎自动导入、元数据方案设置等前沿智慧采集技术的学习与应用,双管齐下,实现档案工作者角色由保管员向知识组织者的根本转变。
4.加强档案资源深度挖掘
档案资源深度挖掘作为档案资源体系建设与档案资源利用体系建设的连接环节,是挖掘档案资源价值的关键。一方面,加强以高校档案资源为中心的数据挖掘,分析各类档案资源之间的关系,发现档案资源潜在的大数据价值。另一方面,要开展以档案应用信息资源为中心的数据内在关联挖掘,以此为依据对高校档案用户搜索、存储、利用等行为进行预测分析,推出个性化推送服务。
(作者单位:贵州财经大学档案馆)