论高校档案管理与大数据技术的应用
2018-08-30许琪玮
许琪玮
【摘要】随着近年来我国高等教育体制改革的深化,如何在高校档案管理中应用大数据技术优化档案管理机制,提高档案管理效率,已经成为档案管理人员最关心的问题。鉴于此,本文就大数据技术在高校信息化档案管理机制的应用展开详细探讨,并提出具体的研究思路,以供广大读者借鉴。
【关键词】高校档案管理;大数据技术;问题研究
一、大数据技术的含义及特征
(一)大数据技术的含义。大数据(big data)是指在一定空间、时间维度内使用常规软件和开源工具捕捉、采集到的数据,是信息分析机制、数据采集模式所需决策力、洞察力和数据组织机制优化能力的快速、高效率增长的信息资产。基于海量的数据资源分布和快速增长的信息资源,以计算机技术为基础科学化、组织化的处理数据,针对大数据的分布結构、信息类型以程序控制为导向创造出了人工数据处理方法,也就是“大数据技术”。信息化情景中,数据资源结构、形式呈现多元化,关联性越来越弱,借助数据库、信息网络对生活实践中产生的数据资源存储分类。通过分析大量具有相似特征的数据资源确定事物未来的变化趋势,实现对未来发生事物的技术性预测。
(二)大数据技术的特征。大数据技术作为一种从大量网络结构性、非结构性、异构类数据提取有价值信息的能力,所需处理的数据,规模巨大。例如,自人类文明产生以来所有的印刷材料的数据存储量为200PB,典型的个人计算机硬盘容量为TB级别,一些互联网公司的数据量接近EB级别。所以大数据技术的处理数据规模巨大。其次是数据类型多样。人们使用网络产生的数据资源有多种类型,包括音视频资料、文本数据、地理位置信息、上网记录等,符合用户个人预期的个性化数据占主导位置。同时,利用大数据技术对数据资源进行分析,运算效率较高,遵循“1秒定律”可以从各种结构的网络数据中快速找到有价值的信息供用户使用。最后是价值密度低。“大数据”是海量信息资源的总称,计算对象是大规模的网络数据,但真正有价值的信息可能是整体数据的一小部分。以视频资源为例,一小时的视频,在不间断的数据分析中,有价值的信息可能只有一秒钟。所以,大数据技术应用的主要目的是从海量的信息数据中提取有价值的信息。
二、高校档案管理中大数据技术的应用途径
(一)建立档案数据资源趋势分析机制。在高校档案管理中,档案管理员为了满足用户的个性化需求,从海量的数据资源中提取有价值的信息提供给师生或是学校行政部门,有必要建立数据资源趋势分析机制,基于用户行为及个体意愿从大量结构化、异构化的数据资源中提取有价值的信息数据提供给使用者。所谓数据资源趋势分析机制是指档案管理机制的构建者利用大数据技术、分布式数据库、算法工具构建面向网络资源、馆藏资源进行分析、处理、获取、管理的逻辑系统。一方面高校档案管理部门要以师生用户的隐性信息需求为核心,分析用户的需求变化和分布状态提供专业的数据平台供用户使用,另一方面档案管理部门利用算法工具分析馆藏资源、网络资源的使用情况及资源中所包含的价值性信息,针对使用者使用需求进行匹配。值得注意的是,用户的资源需求是多元的,所应用的算法工具及分析模型要在不同的时间节点内自适应调整,能随着档案信息资源更新、用户需求变化做出改变,实现用户需求管理与知识挖掘同步进行。
(二)创建关联性数据标注系统。数据标注系统是高校档案管理部门针对用户需求管理、信息资源挖掘和价值性信息使用所形成的知识标注机制,主要是针对用户的需求变化、档案信息资源使用情况、价值性信息挖掘,对用户使用过、未使用的数据资源进行数据性关联性标注。高校档案管理部门针对海量的数据信息、档案信息资源进行知识挖掘最重要的原则是根据资源的价值进行数据标注,使之具有标签管理特征。用户根据档案资源的标注,借助标签管理系统能够根据档案信息资源的数据逻辑特征快速找到关联性数据,准确查询。
(三)实现档案资源可视化处理。在档案信息资源挖掘和标注过程中利用计算机可视化技术,对结构化的档案数据进行分析对比,能根据算法工具就资源的类型、时间、作者、价值等信息进行统计,依托计算机网络生成分析报告,以可视化的数据模型呈现出来。同时,利用计算机可视化技术能对有关资源主题深入分析,基于关联性数据资源生成可视化图表,用户充分了解档案信息发展建设情况,选择有价值的信息资源。值得注意的是利用计算机可视化技术能够帮助档案管理部门以更加直观的方式查看基于数据挖掘机制产生的价值信息,为后期开展用户的个性化档案管理服务进行经验积累。
(四)设置智能辅助工具。传统的档案信息检索使用模式主要是通过输入相应的关键词,得到检索结果从中发现有价值的信息资源。基于大数据技术产生的智能辅助工具是在信息资源合理利用、合理使用的基础上加上智能算法形成的。通过主动推送信息,在用户输入关键词时,系统根据用户的搜索行为自动向用户提供信息数据。例如,在检索某一时间节点信息时,系统会根据用户的输入法使用变化,自动筛选数据资源,及时向用户提供与之对应的档案信息,方便用户快速作出决策。
综上所述,在高校档案信息管理中应用大数据技术可以快速提高档案信息检索效率,根据师生用户需求和学校的档案管理建设需要及时匹配信息数据,便于师生及学校管理部门快速作出选择,直接获取档案信息。
【参考文献】
[1]金明辉.创新高校档案管理工作服务于教学科研[J].佳木斯大学社会科学学报,2016(05).
[2]侯英杰.大数据背景下高校档案编研工作发展前景分析[J].兰台世界,2016(17).