APP下载

面向智慧校园的学生异常行为检测*

2017-12-27任孟其宋汝鑫邵子豪赵国生

关键词:经纬度离群决策

任孟其,宋汝鑫,王 萌,邵子豪,赵国生

(哈尔滨师范大学)

0 引言

随着国家对教育事业的重视以及计算机的普及,学校信息化建设已成为未来发展的必然趋势.全国各大高校也已在“云计算”[1]、“物联网”和“数据挖掘”等新技术的推动下陆续地提出了“智慧校园”理念.

现有智慧校园研究中,大部分文献都采用的是以一个宏观的角度总结智慧校园的建设,缺乏对单一问题的专项研究.如Zhang等[2]运用运行期模型对智慧校园中的无线传感器网络设备进行统一化管理提升了校园网系统的通用性和可扩展性,使智慧校园管理更加高效;Chen等[3]运用协同过滤推荐算法,通过历史数据的收集与分析,在基于校园学生日常的学习需求和社会娱乐中提供一些更加智能的建议;乔蕊等[4]研究了在物联网环境下智慧校园的建设与发展,通过在物联网环境下,对建设智慧校园的关键技术进行了深入研究,分析了目前建设中的技术难点及未来的一些发展展望,是一篇具有总结性的文章;熊频等[5]提出的面向智慧校园的学习环境建设研究,以美国宾夕法尼亚州州立大学智慧校园建设为例,分析了智慧校园环境建设的总体情况与关键点,最后提出了关于顶层设计、学习方式、多元化应用服务等校园环境建设的策略;吴旻瑜等[6]结合了当代互联网时代的高速发展,提出了将“互联网+”与校园建设相结合的新思路,为新时代的校园建设提供了一条新的发展道路.

在建设智慧校园的道路上,校园学生安全问题显得尤为重要;但现有文献中有缺乏对学生异常行为的检测.为此,该文针对智慧校园中的校园安全问题,结合数据挖掘中产生的位置信息,提出一种基于消错决策和离群偏离度计算的智慧校园学生行为异常检测的方法,该方法通过使用消错决策的错误值计算,实现快速识别学生中单一时间点的异常行为,并对部分学生可能出现异常行为的趋势进行数值化显示,使用离群偏离度计算实现了对学生全天候的可能性异常行为检测,提高了对学生异常行为检测的准确度,降低了单一时间点的偶然因素,便于学校管理人员采取更加快速、合理的对策,降低学生发生危险的可能性,提高学校的管理水平.

1 智慧校园

所谓智慧校园是指通过利用云计算、虚拟化、物联网和大数据分析等新技术改善广大师生的生活方式及学校资源的使用方式,提高校园资源的总体利用率,由此构建一个更加全面的、更加准确的智能环境感知和综合信息服务的平台.

相对于常规的校园,智慧校园有以下特点,见表1.

表1 智慧校园特点

2 异常行为检测

近年来,校园安全事故的频繁发生,引起了社会各界的高度重视,在智慧校园的建设中,校园安全中学生异常行为检测扮演着十分重要的角色.为此,将消错决策与离群偏离度计算引入到对学生日常行为的检测当中就显得尤为重要.

2.1 消错决策

消错决策[7]可以避免由于某些错误数据所带来的损失,从损失的角度出发,降低错误的损失,达到更好的数据检测效果.

在异常点检测问题中,假设有m个学生数据表示为A={a1,a2,…,am},采集的n个属性表示为D={d1,d2,…,dn},检测矩阵为X=[xi,j]m*n, 其中xi,j为数据ai基于属性dj的测量值.当所测数据中有异常数据存在时,可利用以下规则检测各个学生数据在不同的属性上是否会发生错误,并利用错误值进行描述.具体步骤如下所示:

步骤1:计算学生数据错误值t.

(1)

其中i= {1,2,…,m},j∈N.

根据公式(1)求得学生数据ai的错误值序列为{ti,1,ti,2,…,ti,n},ti,j为数据ai在属性dj上的错误值.

(2)

其中i={1,2,…,m},N={1,2,…,n}.

当ti*=1时则为异常行为.

步骤3:计算学生数据ai在属性dj下的出错值,据此推断数据可能的异常情况.

ki,j=ai×dj,i∈M′,j=1,2,…,n

(3)

步骤4:对数据进行排序,将异常序列{vi,1,vi,2,…,vi,n}看成多维空间上的点Vi,点Vi越接近原点O则学生数据ai越正常.

(4)

消错决策的使用,可对所采集的学生数据进行识别与分类,区分数据是否异常;通过对数据的分析实现了学生单个时间点内的异常行为检测.

2.2 离群偏离度计算

通常学生的异常行为仅通过某个时间段内的一个异常点来显示是远远不够的.为此,该文接着从学生的一天活动记录出发,通过固定时间段的计时定位,得到学生一天的移动数据,通过计算离群总体偏离度,检测学生是否真的存在异常行为.

偏离度指实际的数据与目标数据相差的绝对值占目标数据的比重,在经济学中已得到了广泛的应用[8],但在异常检测中使用相对较少,周帅等[9]证明了偏离度可在安全分析中起到决定作用,因此离群偏离度可以更好地反映学生的异常行为,离群偏离度的具体算法如下:

第一步:已知学生b在时间T的经纬度坐标为bT(Xb,Yb) ,通过历史数据统计出该时间内正常数据的中心为NCT(XNC,YNC),通过消错决策方法识别学生b的经纬度坐标是否在正常数据集中,若在,则认定该学生在当前时刻处于正常范围,离群偏离度值为0;若不在,则进入第二步;

第二步:已知当前时间T的合理数据点RDP(Reasonable Data Point)是离学生b最近的历史合理数据点,其坐标为RDP(XRDP,YRDP),计算bT的离群点偏离度ρbT,计算公式如下:

(5)

第三步:计算该学生一天内的总体离群偏离度ρb*,计算公式如下:

(6)

其中ωbT为阈值,l为当天学生经纬度坐标处于正常数据集的次数.此种阈值计算方法不仅保证了对正常数据的考虑,还提高了严重离群点的重视度,保证了总体离群偏离度的准确性.

将识别方法与离群偏离度计算相结合,不仅实现了对学生单一时间点的异常行为检测,还可以实现对学生全天候的、范围更广的、更为合适的综合异常行为进行检测.

3 实验

该实验通过采集“哈尔滨师范大学智慧校园APP”学生行为轨迹位置坐标.采集方式主要是基于射频识别技术(RFID)和标签采集.采用RFID的原因主要包括:可同时读取多个RFID标签、使用寿命长,应用范围广、具有较高的安全性、数据的记忆容量很大等优点,因此,学校将RFID阅读器安装在每栋建筑物中的教室内,电子标签粘贴至学生饭卡背面,学生每次进入教室、寝室和食堂以后即可实现一次信息的采集.

通过大量数据采集与分析,可知大一新生每天早上6点30分需在校体育场晨练,且体育场具体坐标如图1所示,现随机采取计算机一班10名在校学生于2016年9月23日早上6点45分的具体坐标,如图2所示.

图1 体育场

图2 学生数据

图1中可以看出体育场经、纬度范围分别为126.565500~126.565750和45.8711 00~45.871250,图2为管理员后台数据库,经观察大一学生由于都在学校经纬度前几位完全一致,为便于计算先选取最后四位进行消错决策计算.

3.1 学生单一时间点异常行为检测

根据公式(1)和环比评分法求得各数据的极限损失值为t1*=0.89、t2*=0.74、t3*=0.31、t4*=0.82、t5*=1、t6*=0.96、t7*=0.77、t8*=0.37、t9*=1、t10*=0.67,经公式(2)可知学号为2016040019和2016040031的同学存在异常行为,可能没来上体育课,其余8名同学目前在体育场上课.根据公式(3)和(4)求得学生异常行为出错值为kd1*=0.74、kd2*=0.26,可能异常序列和离心距见表2.

表2 异常序列与离心距

综上,该文提出的消错决策,不仅可以判断学生在某一时间点是否存在异常行为,还可以通过离心距的大小判断部分学生是否存在有异常行为的可能性;总体离群偏离度的计算,将消错决策中产生的单独时间点检测连接成一段时间,最终实现了对学生综合行为的异常检测,两者结合,便于学校管理人员及时作出决策,避免了校园悲剧的发生,保证了校园学生的安全.

3.2 学生综合行为异常检测

单一的检测某一时刻学生的异常行为是远远不够的,还需从总体出发,观察学生的一天生活轨迹,实现学生综合行为的异常检测.为此,通过智慧校园系统历史数据的采集与分析,学号为2015040008同学在周一的正常活动坐标范围记录如图3中红色显示区域,然而通过手机的实时定位,发现该同学在10月10日6:00-18:00的活动曲线如图3中蓝色圆点,与之对应的当天学生具体后台数据信息如图3所示.

图3 某一同学行为显示

图4中分别显示的是学生当前时间的经纬度坐标、正常记录范围中心点的经纬度坐标和离学生当前坐标最近的经纬度坐标.通过历史数据的记录和消错决策的计算,可以辨别当前时间学生是否处于合理的记录范围内,若不处于合理记录范围内,计算机会自动找出当前时间离学生坐标最近的经纬度坐标,加以显示.经观察,表3中显示该生只有8个时间处于正常记录范围内,与图3完全吻合.通过公式(5)和(6),算出学生在异常时间的离群偏离度和总体偏离度,见表3.

图4 2015040008学生具体信息

离群偏离度ρ*越大,说明该学生的活动轨迹与历史记录的活动轨迹差距越大,越有可能是异常行为,这时候,学校应该采取一定的策略保证学生的生命安全,如及时派辅导员与学生沟通、校园心理咨询室进行备案等,根据ρ*的值对学生的可能偏离程度进行分级描述,各等级与ρ*值的对应关系见表4.

表4 学生偏离程度分级描述

综上,该文提出的消错决策,不仅可以判断学生在某一时间点是否存在异常行为,还可以通过离心距的大小判断部分学生是否存在有异常行为的可能性;总体离群偏离度的计算,将消错决策中产生的单独时间点检测连接成一段时间,最终实现了对学生综合行为的异常检测,两者结合,便于学校管理人员及时作出决策,避免了校园悲剧的发生,保证了校园学生的安全.

4 结束语

该文从智慧校园的校园安全问题入手,侧重对学生异常行为的检测,做到了防患于未然.在实验中对大一新生在体育场晨练的检测,实验结果显示该方法不仅可以判断学生是否存在异常行为,还可以通过专家分析,辨别一部分可能存在异常趋势的同学;其次,通过历史数据的收集、消错决策方法的计算和离群偏离度的计算,实现了对某一学生一段时间内的异常行为的综合检测,评价标准更加合理.但实验方法中仍存在一定的不足,在阈值选择中对部分轻微偏离点的考虑不够充分,离群偏离度计算方法较为理想化,下一步将考虑如何使用更加科学的离群偏离度计算方法并选取更加合理的阈值,使实验更加合理.

猜你喜欢

经纬度离群决策
一种基于邻域粒度熵的离群点检测算法
为可持续决策提供依据
决策为什么失误了
基于经纬度范围的多点任务打包算法
一种相似度剪枝的离群点检测算法
自制中学实验操作型经纬测量仪
候鸟
澳洲位移大,需调经纬度
离群数据挖掘在发现房产销售潜在客户中的应用
关于抗美援朝出兵决策的几点认识