大数据时代高校资源共享库的服务模式与关键技术
2016-03-21李泽春河池学院现代教育中心广西宜州546300
李泽春(河池学院现代教育中心,广西 宜州 546300)
大数据时代高校资源共享库的服务模式与关键技术
李泽春
(河池学院现代教育中心,广西 宜州 546300)
大数据背景下的高校信息资源共享库的建设已经摆上了我国高校建设的议事日程。一些高校已经开始着手建立信息资源共享库。基于大数据背景,当前的大数据技术发展迅速,高校信息资源共享库建设也必须遵循大数据技术发展方向,打造未来可拓展的高校信息资源共享库,由此才能实现依托于大数据技术的信息资源共享成为现实。文章介绍了大数据背景下高校资源共享库建设的必要性,着重叙述了大数据时代高校资源共享库的三种服务模式,以及实现高校资源共享库建设的四大关键技术,为大数据时代高校信息资源库的建设提供参考价值。
大数据;资源共享库;服务模式;关键技术;教育信息化
高校信息资源共享不是近些年来的新话题。早在十九世纪中叶,德国的默尔(Robert von Mohl)首次提出了图书馆馆际合作。作为当时信息资源最大的载体——图书馆,其相互之间的合作建立了分工协调的信息资源共享思想。随着这一思想的发展,当时,普鲁士的十个大学图书馆参照不同分工,展开图书采购,并建立馆际互借关系。图书馆作为信息资源共享的主体,这一合作获得了用户的一致推崇和赞誉。新中国成立以来,我国也针对高校图书馆间的合作展开了一系列尝试和探索。随着信息技术给人类带来的巨大变革,传统图书馆之间的互借模式,发展到今天,已经成为依靠各个高校之间建立的数据库,就可以轻松实现信息资源的共享。由此可见,信息资源共享库的建设是高校基于大数据背景下信息资源共享的必要条件。用户只需要通过鼠标的点击就可以享受资源共享带来的便利,而这通过共享库构建的关键技术实现的。因此,当前高校信息资源共享已经成为共识,共享库的关键技术实现则是基于大数据背景下,信息资源共享库建设的首要和必要条件。
1 大数据背景下的高校资源共享库
1.1 高校信息资源共享的必要性
高校信息资源共享是信息技术与现代管理理念的融合。大数据背景下,信息资源共享的本质是通过借助于网络工具,实现以用户为中心,以用户利用为目标,整合高校信息资源,实现高校信息资源的可获知性和获取性,促成社会组织与公众平等拥有高校信息资源的获取权和获取条件,最终实现高校信息资源的价值最大化。
高校信息资源共享是由高校本身的社会责任、义务和工作职责所决定。就高校的社会责任而言,其不但要担负传道、授业、解惑的教育性问题,同时要担负推动社会发展的科学探索使命;高校的义务则被天然的赋予了存储知识和发展知识的义务;高校的工作还需要承担全人类文明向前推进职责。因此,当大数据信息技术越来越成熟的背景下,高校信息资源共享不但是社会进步的表现,同时承载着多项使命和义务。其内涵无论从宏观角度的人类文明进步,还是微观角度的某一科技知识的发展,高校信息资源共享的发展已经刻不容缓。
1.2 大数据与高校信息资源共享本质
大数据从字面意思来讲就是海量数据,这些海量数据是通过当前的网络技术条件获取。博客、社交网络或者是基于位置的服务LBS为代表的新型信息发布方式等,借助于云计算、物联网等技术为大数据提供了取之不尽的数据源,并且海量数据仍在不断的增长和累积当中,大数据时代已经来临。如果从表面的技术演进来看,数据库的发展必然向大数据时代演进。但是两者却存在着本质的管理区别。
首先是数据规模的本质差异。从数据库处理的基本单位来看一般以Mb为单位,而大数据时代则往往以GB、TB甚至是PB为单位,量变引发数据管理的质变成为必然发生的现象。
其次是数据类型的差异。传统数据库种类往往比较单一,以我国高校最早的信息资源共享为例,仅仅是图书馆之间的馆际合作。大数据时代则包含了人才库、图书馆数据库、网络信息资源数据库等的合作,数据种类之繁多是数据库远远不能比拟的。
基于以上可见,大数据脱胎于数据库,但与数据库存在本质的区别。而以大数据为背景的高校信息资源共享则成为一切相关于高校的信息资源的共享。也就是说,大数据背景下,高校信息资源共享不但囊括了传统高校图书馆馆际合作,也包含最新的研究成果共享合作、招生信息合作、人才资源库的合作等等。因此,广泛定义上的高校信息资源共享必须以大数据为基础,才能真正实现高校信息资源价值的最大化。
2 大数据时代高校信息资源共享库的服务模式
大数据时代高校信息资源共享库的服务模式一般可划分为校内共享模式、校际共享模式和社会共享模式。
2.1 校内共享模式
校内共享模式是高校信息资源基本的共享模式,主要特点:一是通过网络通讯专业人士搭建校内信息资源共享平台,通过高校各个部门的组织状况、地理布局和楼层结构、信息资源来源等情况,构建信息资源共享的计算机基础设施;二是校内信息资源共享是通过局域网实现,只要满足通信设备、通信线路和相应的网络软件要求,做到终端、多台计算机及其附属设备的连接,就能够实现校内信息资源的共享。最后,校内信息资源共享的优势是独立使用网络资源可以保证属于秘密性质的网络资源不被盗用,在物理隔离的保障下,实现了最大程度的数据安全。同时,还具有局域网内数据传误码率低、共享安全性高等特点。
2.2 校际共享模式
校际共享模式是高校之间的信息资源共享模式,如同一区域内高校之间建立共享库或者是同一类高校间建立共享库。以当前的校际共享模式来看,一般是通过省级教育主管机关的电子政务网作为平台实现校际共享。这一共享模式的特点是,第一要实现省级教育主管机构的政务网系统工程。通过高校与省级教育主管机构的政务网系统工程的整合,形成高校信息资源共享库。第二是共享库建设必须实现同一的数据标准,也就是通过建立统一的元数据标准、元数据主持系统、元数据仓储和利用协议标准等措施,实现用户的无障碍信息资源访问。第三是高校之间的数据共享理念必须一致。因为,一旦各个高校为了巩固自身利益,妨碍共享库的建设,在诸多校际信息资源共享库建设模式上会存在较大的差异,所以必须统一高校信息资源共享理念。第四是针对用户应用层面服务界面的统一、检索方法的统一等。
2.3 社会共享模式
社会共享模式是指高校以互联网为基础,以高校专业网站为节点,利用网络技术突破时空、地域的限制,向不同高校信息资源用户提供共享服务。该模式特点首先是社会部门与组织间的协作关系。比如档案信息资源社会共享必须要求档案学会、协会、学会等档案机构参加,在组织上相互互联,构成档案信息系统的网络节点服务系统。其次是高校信息资源共享网站集群系统的建设。因为单一的网站无论其功能还是信息资源量都是有限的,因此需要整合高校信息资源做到网站全方位联通的模式,使用户信息资源使用中实现和高校任何信息资源的互动与沟通。
3 高校信息资源共享库的建设环境和支撑条件
3.1 高校信息资源共享库的建设环境
大数据依托于信息化技术,信息化技术的环境基础有计算机、网络信息技术和高校信息资源环境两部分构成。从高校信息资源共享库建设的实现环境来看,技术方面已经日益成熟,无论是计算机的硬件还是软件都获得了长足的进步和发展。信息存储、数据处理、信息资源安全已经脱离是否能够应用的范畴,发展到如何利用的更好的高度。信息环境方面,高校信息资源无论是公文处理、高校管理、文献管理等都为高校提供了源源不竭的信息,甚至QQ、网络游戏乃至于高校的网上购物、电子银行等,数据信息像空气一样无处不在。社会环境方面,高校信息资源共享库建设的法律法规处于不断完善的过程中,用户或公众对于高校信息资源需求意识的觉醒,都使得高校信息资源共享库的建设环境已经成熟。
3.2 高校信息资源共享库建设的支撑条件
大数据背景下的高校信息资源共享库建设,需要各个支撑条件。
(1)基础物理设施硬件
基础物理设施硬件主要是信息资源共享库的基本设备技术研究与发展。其中服务器集群、网络设施、高性能存储集群等技术是构建高校信息资源共享的物理设备关键性基础技术,并能够保证以此为基础的物理设备具有可拓展性技术特征。
(2)开发与应用技术
开发与应用技术则是针对大数据为用户提供各种服务方式的过程中,能够实现上层应用程序的开发环境、运行环境、数据库环境等。基于Web技术的网络应用,通过API服务模式将分散资源进行筛选和组合,最终实现用户的信息资源需求的满足。
(3)资源整合
资源整合则是用户应用和数据分析等的元数据库和索引库的构建。无论是元数据的编辑、转换、导入、导出等各类操作,还是分散于各个高校的异构数据等信息资源,通过一系列大数据相关技术,经过标准化、规范化的统一,为用户需求进行服务。
(4)应用层面技术
应用层面技术则主要表现在资源管理技术和应用服务技术两个方面。当前的移动终端技术的不断突破,应用要求的不断提升等,都需要大数据技术以应用为核心,实现云中运行的基本模式。
(5)信息资源安全
信息资源安全以当前最为先进的技术而言,依旧是Google、IBM等提供的一揽子信息安全保障技术。
4 高校信息资源共享库的关键技术
4.1 大数据处理技术
大数据最大的特点就是多样性,这意味着大数据来源广泛、类型复杂、数据量庞大。因此,从大数据中实现数据的处理必然要经过三个数据处理技术流程。
(1)数据的抽取和集成
数据抽取和集成技术不是新兴的技术,早在数据库为主的数据处理时代,这一技术就已经获得了相关的应用发展。大数据背景下的数据抽取和集成首先对数据源进行关系和实体的提取;然后通过统一定义的结构来存储这些经过关联和聚合的数据。这一过程中为了保证数据质量和可信性,必须进行数据的清洗工作。如前文所述,大数据的处理特点之一是先有数据后有模式,且这些数据处理模式仍旧处于不断的变化演进中。因此,数据抽取和集成也处于不断的变化之中。当前大数据主要的抽取和集成模式有四种:基于物化或 ETL方法的引擎、基于联邦数据库或中间件方法的引擎、基于数据流方法的引擎、基于搜索引擎的方法。
(2)数据分析
数据分析是大数据处理流程的核心。数据分析的数据源是针对异构数据进行抽取和集成获得原始数据,从原始数据中选择全部或是部分进行数据分析。传统数据库处理手段(数据挖掘、统计分析、机器学习等)不能适应大数据背景下数据分析的要求。因此,海量数据条件下数据价值的有效性;大数据时代算法的调整以及数据分析结果质量的衡量,是大数据分析技术应用和发展的前提。
(3)数据解释
数据解释是将数据分析结果呈现给用户的手段。传统数据解释在较小数据量的前提下,可以用文本的形式为用户提供数据分析结果。但是大数据海量数据背景下,数据解释就必然的要依托于可视化技术、人机交互技术等来实现。常用的可视化技术有标签流、空间信息流、历史流等。人机交互技术使用的内涵则是通过用户主动参与数据分析过程,从而对数据结果直观掌握,主要有数据起源技术等。
4.2 云计算相关技术
云计算是大数据的基础平台和支撑技术。如果将大数据应用看做是“汽车”,支撑这些汽车运行的是高速公路,所谓的“高速公路”就是存储、管理与分析等的云计算技术。当前高校云计算技术条件下的信息资源共享实现主要基于物理层、平台层和应用层。
(1)物理层
物理层是通过虚拟化技术提供Laas服务。虚拟化软件针对物理设备进行系统管理,依据应用需求分配虚拟硬件资源。
(2)平台层
平台层通过分布式计算和并行处理关键技术,提供PaaS服务,主要实现云计算平台服务器集群间的协同工作,同时实现超大规模计算和海量存储工作。
(3)应用层
应用层使云计算具有统一接口、单点登录、一站式访问等特征,提供SaaS服务,面向用户的智能检索、资源导航、个性化定制等需求。
以上三种技术手段的具备是高校信息资源共享库建设的基础性支撑技术。在实现手段上,无论采用哪种技术或在何种范围内实现信息资源共享,都需要物理层、平台层和应用层的构建与实施。
4.3 信息安全保障技术
高校信息资源共享库的安全保障技术主要集中在系统安全、数据安全、网络安全以及用户操作安全等方面。信息安全保障技术的原则是实现信息资源的保密性、完整性、可用性、可控性、真实性、法律凭证以及可追溯性。
目前,已经实现的数字签名技术是保障信息资源安全性普遍应用的技术手段之一。主要是通过云计算实现分布式、异构信息资源的负载均衡避免网络过载。针对数据丢失、破坏、病毒入侵、服务中断、硬件损坏等安全性问题,采用冗余备份、容错容灾等技术实现信息安全保障。当前的Google、IBM等云技术服务商都会向用户提供诸如集VPN、身份认证、数据加密、冗余备份、安全存储等技术为一体的信息安全保障系统。
4.4 泛在网相关技术
泛在网(Ubiquitous Networks)指利用现有的电信网、互联网和卜一代网络以及一部分专用网络,来实现人与人、人与机器、人与物甚至物与物之间直接进行信息感知、获取、传输、储存与决策等服务的网络架构。当前针对泛在网研究主要表现在总体框架技术方向研究、网络能力技术方向研究和感知技术方向研究。
泛在网内部功能需求与架构研究,以韩国为标准主导,而标准化的范畴集中在:泛在网络/物联网架构及需求研究等。业务、应用、标识解析方面的研究则主要表现在,针对智能交通以及智能交通系统;智能医疗,电子健康的多媒体架构等。由于泛在网如同其特征所表现的内涵,总体的国际和国内泛在网技术研究方向主要围绕以下四点内容展开:
一是规范泛在网术语,这一研究的目的是为泛在网研究提供整体性的统一意见;二是智慧交通、智慧医疗、智慧社区、智慧家庭、智慧城市、智慧旅游等应用需求制定与其相适应的应用标准;三是研究M2M应用通信协议、泛在网IPv6等相关技术,形成泛在网网络搭建基础和通信媒介的确立;四是针对泛在网的特点(任何时间、任何地点、任何人、任何物都能顺利、顺畅的通信),重点研究物理层与MAC层技术实现与标准统一,使泛在网的物理基础形成可靠的系统支持。
5 结语
当前,大数据背景下高校信息资源库有校内共享模式、校际共享模式和社会共享模式三种服务模式。基于大数据背景的高校信息资源共享库的构建,无论是理念方面还是技术应用方面,无一不是依托于当前的大数据概念。围绕大数据展开的相关技术研究与应用也以惊人的速度在不断进步当中。当前的大数据已经将智慧城市、智慧公交系统、智慧家庭等数据应用前景展示在人们眼前,高校的信息资源共享也只是这些技术研究基础上的延伸。所以,基于大数据背景的高校信息资源共享库建设不但可行,而且有益于国家、社会和个人的发展。虽然当前高校信息资源共享库建设时机已经到来,但并不是说大数据背景下的高校信息资源共享就完全没有了障碍。面对大数据带来的海量信息,有限的高校信息资源共享库依旧要防范和研究以下诸多问题:一是数据质量和广泛的异构性带来的大数据集成的问题;二是动态变化环境中索引的设计、先验知识的缺乏和数据处理的实时性带来的大数据处理难度增加的问题;三是数据公开和隐私保护的安全问题;四是大数据的能耗问题;五是大数据集成、分析到解释都面临易用性的挑战。基于这些问题发现,大数据背景下的高校信息资源共享,其本质是不断构建信息资源共享库和不断实现技术与应用突破的动态建立过程,而不是一劳永逸的单纯应用数据库组合的思维。因此,高校信息资源共享库的建设是多方努力和协调的成果,随着大数据相关技术的进步,这一成果必将沿着持续完善的方向不断推进。
[1] 韩冰,顾京.浅析我国职业教育数字化教学资源建设的现状[J].教育理论与实践,2013(6):16-18.
[2] 刘菊霞.中日两国基础教育信息化比较研究——第四届中日教育技术学研究与发展论坛侧记[J].中国电化教育, 2013(2):34-38.
[3] 钟绍春,王伟.关于信息技术促进教学方法创新的思考[J].中国电化教育,2013(2):111-115.
[4] 王聪,初建杰.关于我国高校数字化教育教学资源发展策略的思考[J].中国教育技术装备, 2013(3):27-29.
[5] 胡树祥,石鹏建,郑家茂,等.美、日开放教育资源考察与启示[J].中国大学教学,2012(12) :14-19.
[6] 孟祥增.教育网站中的数字化学习资源调查[J].远程教育杂志,2012(6):67-73.
[7] 蒲昌玖.高校数字校园建设研究与探讨[J].重庆教育学院学报,2012(6):41-44,72.
[8] 张德成.大学生对校内数字化教育资源的运用研究[J].中国医学教育技术,2012(5):39-42.
[9] 张琪.高校数字化教学资源现状调研与优化建设策略[J].软件导刊(教育技术),2012(9):65-67.
[10] 赵方,汪行舟.对高校教师数字化教育资源应用需求情况的调查研究[J].教育与职业,2012(27):179-181.
The service mode and key technology of university's resource sharing library in the era of big data
The construction of University Information Resources Sharing Library under the background of big data has been put on the agenda of China's university construction. Some colleges and universities have begun to set up information resources sharing. Based on the background of big data and current data technology development rapidly, the information resources of colleges and universities shared library construction must follow the direction of technology development of big data, building for the future development of information resources in Colleges and universities shared libraries, thus can realize relying on big data technology information resources sharing become a reality, introduced the resources under the background of big data shared library construction is necessary, emphatically narrated the big data era of the resources sharing in the university library service mode, and to realize information resources sharing in Universities Library Construction of four key technologies, to provide reference for the construction of the big data era of information resources in University Library.
big data; resource sharing; service model; key technology; education information
TP311.13
A
1008-1151(2016)12-0015-04
2016-11-07
广西中青年教师提升项目“基于云平台的高校数字教育资源共享共建模式研究与实践”(KY2016LX547);2016年度广西职业教育教学改革研究项目“信息技术与教育教学深度融合研究—以广西高职教育为例”(GXGZJG2016A090)。
李泽春(1970-),男(壮族),广西河池人,河池学院现代教育中心讲师,硕士,从事教育信息化、现代教育技术领域研究工作。