基于伪彩色图像模型学生行为健康程度的研究
2014-07-07安琳武学师
安琳,武学师
(1.邯郸学院图书馆,河北邯郸056005;
2.河北工程大学教育技术中心,河北邯郸056038)
基于伪彩色图像模型学生行为健康程度的研究
安琳1,武学师2
(1.邯郸学院图书馆,河北邯郸056005;
2.河北工程大学教育技术中心,河北邯郸056038)
以学生为研究对象,提出学生健康环境的限定假设,并在此合理假设的前提下,对学生的成绩、饮食、出入宿舍、参加集体活动等的行为数据进行分析,并受伪彩色图像技术的启发,提出了学生行为的伪彩色图像模型,分析了它的特点.
行为;健康程度;伪彩色图像模型
当前在校学生行为的健康程度越来越引人关注.探讨学生行为健康程度不能从一些突发的事件上入手,如具有问题行为和危害社会性等[1]行为,应该利用平时的一些机制来进行,以便防患于未然.本文试图从学生日常行为的一些数据中去探索挖掘,建立相应的模型,研究其行为的健康程度,以便更好地反映学生的心理健康状况,并给相关的部门提供决策参考依据.
1 学生健康行为环境限定的假设
研究学生行为的特点,就必须对学生所处的生活环境进行分析、简化.一个学生所处的环境往往是一个比较固定的环境,其大部分的时间是在校园中度过的,如果做这样一个假设:既假设学生在校园外的其他表现所占的比重很小,并且其行为是可以通过在校园内的一些行为反映出来的,那么就可以将学生的生活领域进行限定,如图1所示,图中学生行为的环境被局限在校内,即排除了校外行为的影响,构成了一个封闭式的环境.这样,理论上通过研究学生在学校的听课、自习、饮食、上机、图书馆、宿舍等一些数据便能从一定的层面上反映学生的基本行为,而通过这些基本行为数据的分析,可以建立一种模型,通过该模型来判断学生的行为的健康程度.学生健康行为环境的这个假设基本上是合理的,因为假如一个学生的行为环境不符合这种假设,那么他的很多行为便在学校的相关环境下没有这些行为数据,有理由认为其行为健康存在一些问题.例如经常不在学校的食堂中进餐、经常缺课、经常不回宿舍等行为.
图1 学生健康行为环境限定Fig.1Iimited environment for student health behaviors
一个学生的很多行为是可以用数据来反映的.如学生在考试科目中的成绩,老师对学生的评价,学生在参加体育活动、集体活动中的记录,学生每天在食堂消费的流水数据,学生进出图书馆进行阅读图书,以及图书的借阅情况,学生进出宿舍的时间、学生在校园网吧的上网情况等等的这些数据都可以作为一个学生行为反映的数据,而且这些数据的获取上已经不存在困难了.如可以通过RFID技术对这些数据进行记录[2],数字化校园的建设使得这些数据的获取成为现实.图书馆门禁、学生公寓门禁等自动记录了学生出入这些建筑的事实,由于这些数据中很大一部分的获取是自动的,因此如果能构筑一种恰当地反映学生行为的模型,那么本课题研究的意义便十分重大了,因为它能准实时地反映学生当前的行为健康的程度,从而提供预警机制.
2 学生行为数据的分析以及相关模型的构建
将学生的行为进行抽象化,认为学生的行为是由一系列的属性所组成的,如图2所示,各个属性所代表的含义是不同的.通过对学生行为的各个属性进行分析,并对各个属性之间的关系进行研究,从而得出学生行为健康程度的评价机制.
图2 学生行为数据的组成Fig.2Composition of students'behavioral data
对学生的诸多数据进行分条细化,并分别建立子模型.
2.1 学生成绩
学生的各科目的成绩是学生在学校生活中的一个重要数据,是学生完成学业所必不可少的要素.我们认为:学生的各科目的成绩可以反映其用功的程度以及其智商的程度.根据学生入学以来的成绩的记录情况,认为成绩是建立在学生智商上的一种努力.通常的情况下,学生的成绩将会是一个稳定的变量,其成绩模型可以用两种因子来表示.一种是学生成绩在班级中的排名x;一种是将学生所在班级的平均成绩作为一个相应的权值,以学生的该次考试中的成绩除以班级的平均成绩作为成绩的等效变量y,这样将减少考试卷面考题难度等因子的影响.这两种因子的系数加权和cx+dy(其中c,d为加权系数),将成为评价学生成绩健康程度的模型结果.可以用均值和方差来体现统计特性.学生成绩的均值的阶段性的上升或下降以及成绩模型结果的波动的剧烈程度都可以反映其学习方面的行为状况.另外由于学生行为表现的课堂观察是一种教师行为系统[3],所以还可以通过相应教师的评价对学生的成绩进行一些修正.
2.2 学生的考勤情况
学生的考勤情况记录了学生迟到、早退、缺课的情况.这个数据反映学生的行为是否正常.因为次数的变量具有连续性,建立模型时就要考虑连续缺课和间断缺课的区别,并给连续缺课的行为加上一个严重一点的权值.我们在建立模型时采用了连续加权的模型,基本原理如图3所示.图3是学生的考勤情况,是一个二进制序列(我们没有将学生请假的情况与缺勤情况加以区分),1表示学生正常上课,0表示学生缺课.整个缺勤的情况是发现第一次缺勤时,如果前面没有缺勤,则简单地认为此次缺勤的权值为a,如果紧接着缺勤,则权值变为了a·b,a·b2,….系数a和b为加权系数.图3中学生的考勤缺勤情况的结果为a+a+a+ab+ab2+a.通过适当地选择ɑ,b就能较好地将学生的考勤状况说明出来.
读书时如果对典故不了解,就难以读懂作者要表达的真正含义。以下10个“洋典故”,是读外国文学的必备常识。
图3 学生考勤的连续加权模型Fig.3The continuous weighted model ofstudent attendance
2.3 学生的饮食消费
学生的饮食消费情况可以反映学生的许多问题,如其经济水平和健康状况等.我们将学生在餐厅的消费流水作为依据,查看其每餐的消费包括用餐的次数和金额.一方面学生平均的用餐金额将基本上可以看成学生经济水平的一个指标(如是否贫困生);另一方面,学生在餐厅的消费是反映其生理功能的一个重要的指标,反映的是学生饮食的增加或减少,在排除物价波动的影响下,可以看成其生理变化的一个数据.
模型可以这样建立,将学生的早中晚三餐情况加以区分,并分别形成序列,排除学校餐厅三餐食品供应的情况以及饭价等情况的影响.这样学生早中晚三餐的情况形成三个数值序列,分别对每个序列考察其均值和方差来表明学生用餐的特征.方差越大说明学生的消费跳跃度越大,均方差小说明学生的用餐情况基本稳定.而这种数据和其不良社会行为[4]有很大关系.
2.4 学生进出宿舍情况
学生进出宿舍的情况是学生行为的一个重要数据.学生进出宿舍的时间和次数都是其行为正常与否的一种判断依据.由于这些数据和时间有着很大的相关性,我们将学生进出宿舍的时间进行分段划分,认为在某些时间段内的进出是较正常的,而将其他时间段进出宿舍的行为看成具有不正常因素的行为,并赋予不健康权值较大的因子.而进出宿舍的边界数据,即每天第一次进出宿舍和最后的一次进出宿舍情况,更具有判断的意义.如可以根据最后一次看其是否为进,如果为出,则表明没有入住宿舍,行为具有异常特征.所有这些将形成两种行为,一种是除去最后一次外的进出频繁度;另外一种是最后一次进出宿舍的情况,无进出记录,则可视为一种异常,当然学生可能一直呆在宿舍,没有出去进餐和处理其他事宜,但是从道理上讲也算一种异常行为.学生进出宿舍的行为,尤其是无进出的记录行为数据,将视为有异常的关键数据.
2.5 学生进出图书馆的情况
学生在图书馆中的阅读情况、学生进出入图书馆的时间的数据,形成一个个的时间对,反映学生在图书馆逗留的时间.可以认为是学生其主动学习的一个数据.
学生参与的体育活动和集体活动可以看成其和周围同学相处的重要组成部分.可以通过参加活动的次数来表示,以次来作为单位.那么通过一段时间以来学生参与活动的次数来表明学生集体活动的频繁程度.学生参加集体活动的次数越多表明其参加集体活动的行为越健康.
2.7 学生的其他情况
诸如学生参加竞赛的获奖情况,学生的科研情况等,都是一种辅助行为数据,其模型和集体活动模型基本一致.
对学生的各个子行为数据进行建模后,要对学生的子行为数据进行模型处理,对它们的处理结果做归一化处理,并形成以0为代表最差情况,以1为代表最好的情况的处理指标.这样将有助于学生行为健康程度的总体模型的构建.
3 总体模型的构建—伪彩色图像模型
当将学生的各个子行为的数据建立模型后,从整体上探测学生行为的健康程度.设学生的各个数据在模型化处理后分别为p1,p2,p3,…,pn,其中n是学生行为的n个子行为模型化后的数据.要探测学生的行为健康程度,从本质上来看,是研究一个n维空间中点的情况,这时候点的坐标便为(p1,p2,p3,…,pn).因为进行了归一化的处理,并且以0代表各个模型中最差的情况,以1代表最好的情况.所以从数学意义上看来,学生健康的行为的判断标度是n维空间中的一个曲面,介于该曲面和原点的点认为是不健康的模型,反之则认为是健康的模型.这是一个确定性的模型,但是对外界的观察着来说,是十分抽象的,而且用多维空间中的曲面来作为判据也难以体现学生各个行为中的具体偏差.
受到数字图像处理中伪彩色技术的启发,我们对总体模型的构建有了新的思路.所谓的伪彩色图像的表现形式,其实是从计算机数字图像处理中的一种技术,其目的是为了提高人眼对图像细节的分辨能力[5].因为人眼对图像颜色的分辨能力特别强,并且图像的颜色也不仅是一个两极模型,它是一个多极模型,通过一些基本颜色因子的叠加形成了千差万别的颜色,人眼能区分这些千差万别的颜色,而人眼的这种特性正好和处理多维空间坐标的点的情况类似.基于这点的因素,我们将空间中点的坐标转变为平面彩色空间中的色彩,在某种变换意义上应该是可行的.我们采取了两个步骤,首先多维空间向三维空间的映射,然后三维空间和RGB体系的对应.
彩色图像中的RGB体系,可以看成一种三维的空间在平面图像中的显示.而学生的行为数据中具有多个的行为因子可以按照相关程度划分为三种类型,并相应建立一种映射关系,以便对应RGB体系中的分量.这样便巧妙地将学生的情况通过变换形成了以伪彩色表示的模型.
如图4所示,将学生的行为数据按照相关度进行归类,图中的归类一、归类二和归类三既是从学生的行为数据中分划出来的.
这样把学生行为数据进行了归类,属于同一个行为类中的数据,再建立相应的代数模型.这样便能将很多的学生行为数据大体上分为三类,并能分别在这些类中建立图像分量的模型,这些类将最终对应彩色图像的三个分量,即R分量,G分量和B分量.如图中归类一以学生文化成绩为基准类,和它相似的一些数据可以归到这个类中,这个类最后将形成伪图像R分量的数据,而该分类中的很多数据可以采用代数加权和的形式实现图像R分量的模型,代数加权和的系数可以经过一些试验进行选择,具体的分类可以进行试探性的尝试.经过这种建模可以使得学生的多重属性向伪彩色模型转换成为可能.
图4 学生行为的分类与伪彩色图像空间的对应关系Fig.4Correspondence between student behavior classification and pseudo-color image space
之所以选用伪彩色图像来做模型,是因为伪彩色图像包含了巨大的信息量,并不是一般的数学模型可以简单替换的.如由于伪彩色图像既能反映像素的颜色信息又能反映其亮度信息,因此学生的总体健康行为便能从这两种信息上反映出来.由于学生的行为健康评价是多重的,而这些信息同样可以从最终学生的伪图像所呈现出的色彩所反映出来.如一个学生只注重学习,其他的集体活动等都不积极参与,那么他的图像将是暗红色的.换言之,如果一个学生是均衡发展的,那么他的伪彩色图像信息将基本上成灰度的形式,不带有其他的色彩.一个学生的彩色图像的亮度越高说明其总评价是高的,亮度越暗说明其总评价是差的.这样模型的亮度信息是其总体行为健康程度的一种评价,模型的颜色是行为不均衡而造成的色彩.如当学生的各个行为均衡时,学生所对应的颜色是成灰度变化的.灰度越浅(亮度越高),说明学生的行为状况越好,即越健康;灰度越黑(亮度越低)说明学生的总体行为较差,是应该关注的.而学生的行为颜色显示为某一种颜色时,说明学生的行为中有一些偏向,也同样应该引起关注.因此这样模型能十分直观地反映学生的行为健康状况了.
另外,由于班级环境中不同维度对学生行为问题的影响不同[6].所以可以将一个班中的学生的彩色信息按照一个学生一个块图(类似于位图的原理)形成一幅图像,从而可以直观地观察出一个班级整体的学生行为的健康情况.
4 结语
学生行为数据的研究是一门和学生心理健康有关的数据挖掘的机制.从纷繁的行为记录中发现出一些不正常的端倪,并能及时加以纠正将对学生和学校都起到良好的作用.伪彩色图像的学生行为健康程度的模型,不仅能体现其总体行为的健康程度,也能体现其各个子行为的健康程度,因此能较全面地反映学生的情况.
[1]刘苏,陈学军.城郊中学初中生问题行为调查[J].科教文汇,2010(3):31-45.
[2]徐维.RFID在学生行为分析系统中的应用[J].孝感学院学报,2010,33(S1):5-7.
[3]袁树厚.基于形成性评价的学生行为表现之课堂观察研究[J].长春理工大学学报:社会科学版,2010,23(6):136-138.
[4]章燕,陶芳标,黄韩辉,等.医学生不良体重控制行为与健康危害行为关系[J].中国公共卫生,2010(2):129-131.
[5]周长发.精通Visual C++图像处理编程[M].北京:电子工业出版社,2006:192-193.
[6]王甲娜,刘利,王烈,等.多层线性模型在班级环境与学生行为问题研究中的应用[J].中国卫生统计,2010(1):59-61.
责任编辑:黄澜
Study of the Health Level of Student Behavior Based on the Pseudo-Color Image Model
AN Lin1,WU Xueshi2
(1.Library,Handan College,Handan 056005,China;2.Educational Technology Center,Hebei Engineering University,Handan 056038,China)
Tɑking students ɑs subjects,ɑ heɑlthy environment of students were ɑssumed ɑnd limited,ɑnd on this premise of reɑsonɑble ɑssumptions,students’ɑchivement,diet,ɑccess to dormitories,pɑrticipɑtion in public ɑctivities ɑnd other behɑviorɑl dɑtɑ were ɑnɑlyzed.The pseudo-color imɑge model of students’behɑvior wɑs proposed bɑsed on the pseudo-col⁃or imɑge technology,ɑnd its chɑrɑcteristics were ɑnɑlyzed.
behɑvior;heɑlth level;pseudo-color imɑge model
TP 399
A
1674-4942(2014)03-0259-04
2014-04-10