APP下载

高职院校图书馆大数据在学业预警中的应用

2015-05-12高晓东周建江苏工程职业技术学院图文信息中心江苏南通226001

图书馆学刊 2015年1期
关键词:入馆学业预警

高晓东 周建(江苏工程职业技术学院图文信息中心,江苏南通226001)



高职院校图书馆大数据在学业预警中的应用

高晓东周建
(江苏工程职业技术学院图文信息中心,江苏南通226001)

[摘要]基于对图书馆入馆统计分析报表的研究,发现并证实了图书馆大数据在学业预警平台中的重要作用。围绕图书馆大数据应用的探索和实践,用好自身资源对于图书馆迎接大数据时代的到来具有深远的意义。

[关键词]图书馆大数据学业预警

[分类号]G250.7

近年来“大数据”革命开始爆发,从洛杉矶警察局和加利福尼亚大学合作利用大数据预测犯罪的发生到Google流感趋势(Google Flu Trends)利用搜索关键词预测禽流感的散布,体现了大数据巨大的应用价值和商业价值。在图书馆学界,提高文献数据处理能力,搜寻新的数据计算、探索图书馆大数据新的应用途径也逐渐成为研究热点[1]。高职院校图书馆既有数据收集、存储的基础条件,也有大数据分析、利用的技术条件。一方面,图书馆书目种类多、数量大,各类电子资源丰富形成了大量的结构化数据记录;另一方面在日常服务过程中,读者基本信息、借阅信息、入馆信息、资源检索信息等非结构化数据也在不断高速增长。长期以来这些数据只做了简单的存储而没有被重视和利用,通过大数据分析工具以及其他技术手段挖掘其背后蕴含的深刻含义,是提升图书馆服务水平和能力的重要途径,也是为学校其他业务部门提供决策的重要依据和支撑。

1现状分析

职业教育的蓬勃发展,使得高职院校招生规模逐年扩大,而高职学生学习的主观能动性和实践能力却有所下降,进而让人担忧学生的就业率。同时通过对图书馆入馆统计报表的分析,发现图书馆纸质图书的借阅量逐年减少,人均入馆次数也明显降低。造成当前局面的主要因素包括:①学生的自身素质和读书热情不高;②任课教师对学生的参考书籍阅读重视程度不够;③图书馆的服务能力和服务水平还有待提升。

鉴于此,首先,学生自主学习能力的培养应该纳入教育教学考核体系,并且作为学生综合素质测评的一个重要指标;其次,图书馆要与二级教学单位密切沟通联系,分析原因,寻找解决问题的途径,因地制宜采取措施激发学生读书、学习的热情;再次,教育职能作为高校图书馆的三大职能之一,图书馆有义务培养学生学习的主观能动性和学习兴趣,也有必要通过各种信息化手段,通过预警信息的发布和推送来促进和帮助学生提高学业水平。

2概念界定

2.1大数据概述

大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理并整理成为帮助企业经营决策更积极目的的资讯。大数据可分成大数据技术、大数据工程、大数据科学和大数据应用等领域。目前人们谈论最多的是大数据技术和大数据应用。工程和科学问题尚未被重视。大数据工程指大数据的规划建设运营管理的系统工程;大数据科学关注大数据网络发展和运营过程中发现和验证大数据的规律及其与自然和社会活动之间的关系[2]。

2.2学业预警机制

预警机制是指在预测出事件将要产生或可能产生不良后果时能及时发出警告,从而主动防范以减少不必要损失的工作制度。它具有主动性、超前性、针对性和及时性的特点,能够在预测范围内把风险与损失降至最低。学业预警是一种学校主动管理、学生自我管理、家长积极参与的多方协作管理模式[3]。“学业预警”制度最初由江西理工大学实施,分为期初预警、期中预警和期末预警3个阶段。学校主要通过对不同学习阶段的学生动态加以密切关注,对缺课达到一定数量的学生采取提醒、教育等预先警示方式给予指出并责令改正。学分制下高职院校的学生学业预警机制,是对学生学习过程的监控,通过学校、社会、家长、学生之间多方面沟通与协作,对学生在学习中即将发生的问题与困难进行提示[4]。

目前,学业预警体系还不够完善,学生档案信息还不健全,判定学业水平的参数来源比较单一,对学生全方位跟踪的能力还不够。实际上,学业预警系统目前的数据主要来源于教务管理系统,而作为学业预警体系,其庞大的数据来源应该是多方面的,如图书馆利用数据、一卡通流水甚至各种视频监控数据,进而构建完整的学业预警体系。

图1 图书馆学生入馆统计

3图书馆大数据服务学业预警的思考

3.1图书馆入馆统计分析

针对图书馆纸质图书借阅量下降以及入馆人数偏少等诸多现状,根据图书馆现有的管理系统进行入馆数据统计分析,统计报表的样式如图1所示。统计报表的数据来源主要是门禁系统数据、图书馆自动化管理系统数据、一卡通数据等。

本报表以学生为个体,以其所属的二级教学单位为分组进行研究。主要参数包括所属二级教学单位、二级教学单位在校生人数、二级教学单位在校班级数、到馆人次、到馆人数、借阅册数、到馆率、人均到馆率、人均到馆次数、Top100到馆次数占比、Top100借阅册数占比。其中到馆人次是在统计周期内重复统计同一个读者多次入馆的总次数;到馆人数是指统计周期内一个读者多次入馆只统计一次;到馆率=到馆人数/在校学生数×100%;人均到馆率=到馆人次/在校学生数×100%;Top100到馆次数占比是指该二级教学单位在统计周期内到馆次数最多的前100名学生所占的人数;Top100借阅册数占比是指该二级教学单位在统计周期内到馆借阅图书最多的前100名学生所占的人数。

从报表数据来看,不难得出以下结论:①各二级教学单位的入馆人次分布不均,除个别二级教学单位入馆人次较少外,大部分二级教学单位入馆人次相当。一方面说明了二级教学单位对学生入馆学习的重视程度不同,另一方面说明了图书馆对不同专业能有效提供参考文献的服务能力不够。②到馆人次和到馆人数明显存在差异,Top100到馆次数占比发布不均。这说明同一个学生在统计周期内多次到馆,而大部分同学很少入馆学习或者根本没有入馆,即存在少部分主观学习能动性较高的学生,但大部分学生需要通过一定的监督和促进手段来培养其学习兴趣。③Top100借阅图书册数发布不均。学生入馆后可能去了电子阅览室查阅电子图书和数据库,也可能进入阅览室完成功课,但是没有借阅纸质图书。从某种方面说明了传统的纸质图书与现代电子图书相比,其弱势凸显,这需要结合电子图书和数据库的检索和下载记录来分析。从一张简单的入馆统计分析报表中,还可得出其他更多的信息,如学生入馆次数、借阅纸质图书册数与其学业水平的关系,这是图书馆大数据利用的意义体现。

3.2图书馆大数据支持学业预警

3.2.1图书馆大数据来源

目前,高职院校图书馆的信息化管理水平相对较高,在长期的服务过程中产生了大量的半结构化和非结构化数据。结构化数据包括图书馆管理系统中记录的读者基本信息、借阅记录、超期违章等,这些数据具有较强的逻辑性。在图书馆服务过程中产生的没有明显因果关系的大量数据,如读者流量的电子资源、对文献的咨询、书目信息的检索等则是非结构化数据,其具有随时、海量与弹性的基本特征。非结构化数据每时每刻都在不断增长。

图书馆大数据的应用首先取决于大数据源的获取。图书馆具有独立的服务器和存储设备,电子资源以及相关管理系统均已经本地化部署。通过数据库客户端工具可以方便地查询和获取相关字段,这为图书馆大数据获取提供了便利。图书馆大数据源包括:①门禁系统。高职院校图书馆基本上已经拥有了先进的门禁系统。学生入馆需要刷卡进入通道机,系统实时调取学生的基本信息并记录入馆时间。从该系统记录的数据可以分析出入馆学生所属年级分布状况、入馆高峰时段、入馆时长等信息。②OPAC系统。OPAC系统是图书馆自动化管理系统的Web服务方式,OPAC系统可以为学生提供书目查询、新书通报、借阅历史、预期催还等服务。该数据系统可以分析出学生的图书检索记录、热门检索词、超期催还率等。③图书馆自动化管理系统。借出率、借到率、年借阅量、热门图书、逾期催还、优秀读者年级分布等。④电子资源。图书馆电子资源服务常见的有CNKI、读秀、超星数字图书馆等。相关电子资源数据库对读者的检索记录、下载记录、热门检索均做了存储。⑤电子阅览室管理系统。通过一卡通机房管理系统,可以对上机时长、高峰时段、人员分布甚至上机浏览内容进行分析。其次,构建大数据应用环境。图书馆海量数据预处理是关键,即对数据进行筛选、过滤、分类、关联等初加工和清洗,使原始数据存储有序化以提高数据的应用效率。

3.2.2图书馆大数据分析

图书馆大数据分析借助于BDA(Big Data Analysis)实现。BDA是将先进的分析技术用于大数据集,从而实现从数据到有价值信息的转换。它关注两个方面:一是大数据本身及分析技术;二是二者的结合实现从大数据提取有价值的信息。BDA的分析过程采用各种平台和工具,如阿帕奇Ha⁃doop。Hadoop是一个开源的系统,主要包括两部分,一是分布文件系统(HDFS),二是分布计算系统(MapReduce)[5]。HDFS是一个分布文件管理系统,呈主/从结构,一个主节点称为名字节点(Namenode),其余的计算机是从节点,称为数据节点(Datanode)。主节点管理元数据,从节点存放和管理应用数据。一个HDFS系统可以支持巨大的分布文件系统,为了进一步支持大数据,在HDFS上构建了一个NoSQL数据库系统。除此以外,Hadoop在HBase上还提供了一个数据仓库/数据挖掘软件Hivi以及面向机器学习软件包Mahout。

以Hadoop技术与平台实现图书馆大数据分析,实施流程与常用的OODA环即(观察、定位、决策、行动)类似,包括图书馆大数据访问(大数据聚集(大数据分析(决策(人在环路或人不在环路))))。图书馆多源大数据的分析主要解决多源信息的集成、复杂数据的索引与检索以及异构数据库联合。借助Objectivity公司开发的Objectivity/DB可以实现多源数据的集成以及采用一种并行搜索引擎快速确定可能包含所查询对象的“数据容器”,并利用线程迭代找到目标数据容器。

由图书馆大数据实现学业预警信息转换,首先要依据学校相关学业制度,其次要科学设定评判学生图书馆利用率的阈值。如一学期内学生从未到图书馆或者到了图书馆但文献资源的检索和借阅为零,则至少表明该学生对专业学习的兴趣不高。从这些方面可以找到学生学业水平不高的原因,是学业预警系统决策的重要支撑依据。在图书馆异构数据库,Objectivity/DB则采用单一逻辑视图方法处理。Objectivi⁃ty/DB不仅能管理和构造所有数据库还能通过ODBC或中间件增加传统数据库的管理系统网关。图书馆大数据通过构建协同工作环境的分析流程如图2所示。

图2  Objectivity /DB图书馆大数据分析流程

3.2.3学业预警信息的推送方式

基于BDA,看似杂乱无章的数据将形成“某某同学,您近期借阅图书偏少”或者“某某同学,您近期未到图书馆”等智慧信息。这些智慧信息通过多种途径和手段,如手机短信推送、即时通讯工具、学生一体化信息平台与学生进行交互,最终成为支持学业预警的有效依据,便于学生、二级教学单位、学生管理业务部门能够在第一时间掌握学生学业动态。

由数据得到信息,由信息督促学生提升学业水平。近几年来,通过高职院校图书馆与二级教学单位共同努力,学生入馆数据明显发生变化:学生读书学习的热情提高,学生学习的主观能动性得以发挥,学业水平也有所提升。

4 结语

高职院校图书馆开发和利用大数据不仅是图书馆服务模式转变的重要途径,同时对于教育教学研究的决策具有重要支持作用。笔者探讨了高职院校图书馆大数据应用于学生学业预警平台的积极意义,以及为学工等部门提供的决策依据,旨在抛砖引玉。但在大数据时代,高职院校图书馆大数据所提供服务的深度和广度还有待进一步探索和实践。

参考文献:

[1]韩翠峰.大数据时代图书馆的服务创新与发展[J].图书馆,2013(1):121-122.

[2]百度百科[EB/OL].[2014-07-02].http://baike.baidu.com/ view/6954399.htm?fr=aladdin.

[3]华金秋.大学生毕业预警机制研究[J].气象教育与科技,2007(3):137-138.

[4]陈钦华.构建学分制下高校学生学业预警机制的探索[J].广西师范学院学报,2007(S2):63-65.

[5]百度百科[EB/OL].[2014-07-02].http://baike.baidu.com/ view/908354.htm?fr=Aladdin.

高晓东男,1981年生。硕士,馆员。研究方向:知识管理、计算技术。

周建男,1965年生。图文信息中心副教授,主任。研究方向:计算机应用及现代教育技术。

收稿日期:(2014-09-01;责编:王天泥。)

猜你喜欢

入馆学业预警
艰苦的学业
阅读推广视角下高校图书馆新生入馆教育研究
河南一高校学生排千米长队进图书馆
音乐提升学生学业表现
树起学业担当之心
法国发布高温预警 严阵以待备战“史上最热周”
园林有害生物预警与可持续控制
基于体验式学习的高校图书馆入馆教育新模式
机载预警雷达对IFF 的干扰分析
35