大数据环境下的图书借阅与学生成绩的相关性研究
2018-01-09吴旭东陈正军冯璐远李映曦
吴旭东+陈正军+冯璐远+李映曦
摘要:该文应用建立在大数据环境下通过与学院网络中心及教务处联系,大数据包括:图书馆数据库2005年-2017年借阅数据库、教务处2005年-2017年教务管理数据库、学工处2005年-2017年学生管理数据库。利用数据挖掘的若干重要分析方法,抽取大数据进行分析。对学院陶瓷艺术设计专业400多名学生,在校期间20多门主干课程的成绩、图书借阅、平时表现相结合,通过聚类分析、关联规则分析算法找出陶瓷艺术设计专业学生在校期间图书借阅行为和学习成绩之间的关系,进而为提高图书馆的读者服务、学生的学习效果、学校的教学管理,提供一些参考性的建议。
关键词:大数据;图书借阅;学生成绩
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2017)34-0004-02
1 概述
众所周知,高校图书馆担负着读者教育和信息情报支撑的双重功能,学生在校期间利用图书馆资料,提高自身的学习成绩和综合素质是图书馆为教学服务的一大重点方向。传统的统计学分析在图书馆管理中已经应用了许多年,由于各种原因导致教学服务的效果不佳。图书馆的借阅服务对学生学习方面影响的研究也有很多,国内许多知名学者已经开展了一些研究。如杨新涯等撰写的论文《高校学生成绩与借阅行为关系的初步研究——以重庆大学为例》利用统计专业软件SPSS证明借阅行为与成绩等级有着较高的相关性;乔慧君等撰写的论文《高校图书馆借阅率与学生学习状态关系研究》明确指出,通过图书馆的数据能够较好的了解和检测学生的学习情况。虽然已经充分证明图书馆资源对于提高学生成绩有较强的关系,但对图书馆资源利用与学生学习状态的关系深入研究较少,针对某特殊专业学生在图书馆借阅本专业图书的行为,以及结合本专业课程的学习成绩的研究几乎是空白。本文重点研究陶瓷艺术设计专业400多名学生的学习基本情况,对学生学习状态与利用图书馆资源之间的关系进行深入具体的剖析,为提高学生的学习效果,教学管理提供一些参考性的建议。
2 聚类分析
通过对原数据库的分析,该数据库不能直接运用SPSS Clementine进行挖掘。如表1所示为学生成绩的图书馆借阅表的部分信息。
通过图1与表2结果显示,将学生读者分为三类,第一类学生读者平均图书借阅量为25册,所有课程的平均分为80分;第二类读者为22册,平均分为79分;第三类读者11册,平均分为67分;从各科的平均分来看,借书册书越来越多,平均分就越高。借书量与学生成绩存在着一定关系,借书量在11册第三类读者学生学习成绩普遍偏低,体育课除外。特别是思想品德修养与法律基础课程,平均分才20分,非常明显区别于前两类,这说明这些学生普遍思想认识和水平有待提高。其中操行分,也就是平时出勤分和表现也普遍偏低,这也充分证明了平时不爱学习的,学习成绩偏低,学习的主观能动性不强,那么来图书馆借书也特别少。借书量在22册的第二类读者,无论是专业成绩还是基础课成绩都明显高于第三类读者。
借书量在25册的第一类读者学生的专业成绩普遍强于二、三类读者。其中,第一类读者的专业课程平均分比第三类读者高许多。第一、三类平均分差值为13分、借书量差值为14册、其中分差较大的课程分别是思想道德修养与法律基础差值为55分,陶瓷彩绘装饰差值为25分,花鸟人物、书法差值为14分,设计色彩、装饰雕塑差值11分,装饰设计差值10。这说明经常来图书馆借书的读者对专业课程学习的有极大的帮助一般差距都在10-20分左右,而且对基础课程的帮助也不小,特别是大学英语和思想道德修养与法律基础。利用聚类分析算法模型,建立了陶设专业的学生分类标准,通过学生的借阅情况来分析和预测学生的专业成绩,并得出了学生的借阅行为与成绩等级有较高的相关性。
3 关联规则分析
把图书借阅信息数据与学生成绩数据合并,经过初步整理,为了能适应关联数据挖掘模型,对数据进行抽象、离散化等预处理。为了便于数据挖掘的进行,学生成绩采用的是百分制,需要将课程的名称以及考试成绩映射成字符。课程名称按数据表中的顺序依次映射成为英语字母A、B、C等;课程成绩映射的方法为:60分以下设置为“3",60分至80分之间(包括60分)设置为“2”,80分以上(包括80分)設置为 “1”。将借阅量用字母T表示,借阅量也分成0、1、2、3、4档,学生借阅总量中T0表示借书量在0-9册,T1表示10-19册,T2表示20-29册,T3表示30-39册,T4表示40册以上。经过处理以后如表3所示。
实验结果共有13条规则,其中前7条置信度在100%不符合要求所以是无效的结果,后6条是有效的。如表4所示。
规则1中显示,大学生心理学80分以上和借阅量20-29册的学生占6.76%,其中大学生心理学80分以上的同时有60.0%的学生借阅量20-29册。
规则2中显示,体育80分以上和借阅量20-29册的学生占6.76%,其中体育80分以上的同时有60.0%的学生借阅量20-29册。以上两条规则充分说明,大学生心理学成绩优秀、心态好、心理、身体健康的学生有60.0%常来图书馆借书。
规则3中显示,设计素描80-60分和借阅量0-9册的学生占43.24%,其中设计素描80-60分的同时有53.12%的学生借阅量0-9册。这说明设计素描课程一般的学生,利用图书馆也一般。
规则4中显示,国画山水80-60分和借阅量40册以上的学生占5.41%,其中国画山水80-60分的同时有50.0%的学生借阅量40册以上。这点强有力地证明,经常利用图书馆的学生,专业成绩也好。学院图书馆以陶瓷、艺术类收藏为重点,收藏许多画册,经常来馆的学生充分利用这些资源,所以中国画山水成绩较好。如图2所示,以10陶设1班李某、10陶设11班金某两位学生为例,借阅册数分别为143、177册,其中135、99册都是J类,而且以美术类书籍居多。endprint
规则5显示,大学英语60分以下和借阅量0-9册的学生占50.0%,其中大学英语60分以下同时有2.7%的学生借阅量10-19册。这说明英语成绩差的学生,利用图书馆普遍不高。
規则6中显示,设计美学60分以下和借阅量10-19册的学生占50.0%,其中设计美学60分以下同时有2.7%的学生借阅量10-19册。这说明设计美学成绩差的学生,利用图书馆普遍不高。
掌握以上信息之后,教师可以根据学生的成绩情况和图书借阅情况,及时调整教学。图书馆馆员也可以根据此情况,为专业成绩较低的学生推荐一些专业书来提高成绩。如10陶设3班,学生陈某只在图书馆借了两本书(J类),且该学生的专业课设计色彩、装饰设计基础、陶瓷产品造型设计与制作、花鸟人物、书法、装饰雕塑均在60左右。图书馆馆员与系部教师积极联系,对陈某这一类学生,图书馆的利用率不高,专业成绩平均在60分,教师在教学期间积极引导他们养成借阅图书的习惯,图书馆馆员在该类学生进入图书馆后,可以热情关心,为该类学生积极推荐设计色彩、装饰设计基础、陶瓷产品造型设计与制作、花鸟人物、书法、装饰雕塑这类新出的专业书籍,并为学生建立图书利用档案。
4 结论
本文从图书馆数据库中的借阅行为记录出发,与教务处学生成绩数据相结合,通过建立一些典型的大数据分析法模型来证明图书借阅行为与成绩等级高度相关,并得出了一些有趣的结论。
1) 通过聚类算法建立了陶设专业的学生分类标准,第一类学生读者平均图书借阅量为25册,所有课程的平均分为80分;第二类读者为22册,平均分为79分;第三类读者11册,平均分为67分。从学生的借阅情况来分析学生的成绩,发现学生的借阅行为与成绩具有较高的相关性。
2) 使用关联规则分析,发现了一些有趣的规律即:设计素描80-60分和借阅量0-9册的学生占43.24%,其中设计素描80-60分的同时有53.12%的学生借阅量0-9册。国画山水80-60分和借阅量40册以上的学生占5.41%,其中国画山水80-60分的同时有50.0%的学生借阅量40册以上。通过以上规律可引导学生充分使用图书馆资源,提高学习效果,并为学生建立图书利用档案。
参考文献:
[1] 杨新涯、袁辉等.高校学生成绩与借阅行为关系的初步研究——以重庆大学为例[J].数字图书馆论坛,2013(9)
[2] 蓝石.社会科学定量研究的变量类型、方法选择及范例解析[M].重庆大学出版社,2011.
[3] 黄斯达.基于图书馆借书信息的学生成绩挖掘模型研究[J].现代计算机,2008(10)
[4] 唐海萍.基于数据挖掘技术在图书馆管理模式[J].现代情报,2008(9):109-110
[5] 于徽.数据挖掘技术及其在图书馆的应用[J].黑龙江科技信息,2008(9):97-98endprint