基于PSO-SVM的大学生手机依赖分析系统
2017-05-09徐炜君原大明刘东升
徐炜君,原大明,刘东升
(东北石油大学 秦皇岛分校,河北 秦皇岛066004)
XU Wei-jun,YUAN Da-ming,LIU Dong-sheng
(Northeast Petroleum University at Qinhuangdao,Qinhuangdao 066004,china)
基于PSO-SVM的大学生手机依赖分析系统
徐炜君,原大明,刘东升
(东北石油大学 秦皇岛分校,河北 秦皇岛066004)
针对手机依赖给大学生造成的生理、心理及社会功能损害问题,将支持向量机(SVM)和粒子群(PSO)优化算法结合,利用PSO优化SVM的核函数参数γ和惩罚因子C,设计了一种大学生手机依赖分析系统。系统通过手机APP发布和回收手机成瘾指数量表问卷,用得到基础数据训练PSOSVM进而得到手机依赖分类模型,模型可以实时地对采集的问卷进行分类判断,避免了问卷的发放、收集和数据录入分析等繁琐的工作。系统还可以对分类的结果进行统计分析,便于掌握学生的最新动态。实验结果表明,本系统的分类准确率高达97.561%,而且系统可以自动的进行手机依赖者的筛选和统计分析,系统的分析结果可信可靠。
支持向量机;粒子群优化;大学生手机依赖;手机成瘾指数量表;手机APP
随着互联网技术的发展及手机等新媒体技术的异军突起。智能手机已经成为人们日常生活的重要组成部分。人们不仅利用手机进行即时通信,还用它来网上冲浪,进行社会交往、网络游戏、购物、阅读、导航等活动。手机给人们的日常生活提供了许多便利和丰富多彩的体验,但是它同时也带来了许多消极的影响,其中影响最大的一个就是手机依赖问题[1]。
在众多手机用户中,大学生群体使用手机较为频繁,他们更能充分利用智能手机的功能,对手机依赖程度高于其他群体,离开手机就会出现群体规范的脱离和心理层面的焦虑不安。相对于其他群体,大学生群体对手机的使用行为更值得深入地探讨和研究[2]。探究大学生手机依赖行为,对培养大学生合理使用手机、健全道德人格尤为重要。
文中以手机成瘾指数量表作为问卷调查的依据,采用手机APP发布和回收该问卷,对采集到的数据利用粒子群 (PSO)优化参数的支持向量机(SVM)建立分类模型,并在该模型的基础上设计手机依赖分析系统,对分类数据进行统计分析以便于教学管理者和教师及时掌握学生的动态并采取应对措施。
1 手机依赖的概念及其危害
1.1 手机依赖的概念
手机依赖是由于对手机的过度使用而产生的一种依赖行为,因而对手机依赖的界定,首先要强调对手机的过度使用,其次要强调这种过度使用所带来的后果。对手机使用者而言,这种后果可能是身体上的,也可能是心理上的,还有可能是社会方面的。同时,它既可能是正面的如满足感,也有可能是负面的如身体的伤害等[3]。
1.2 手机依赖的危害
目前手机依赖的危害在大学生中是有目共睹的。手机依赖会给大学生的生理、心理及社会功能造成很大的损害。
手机依赖会导致大学生的记忆力、系统思维能力和理解能力的萎缩,使学生缺乏主动思考的积极性,并且其情绪变得焦虑、沮丧,进而会影响其价值观和人生观的正确确立[4]。
通过手机这种虚拟介质所建立和维持的人际圈,使用得当有助于消除青少年暂时的孤独感,但使用过度则会使得他们逐渐疏远现实生活中的家庭和朋友。久而久之,这种对手机的过度依赖反而引起更大的孤独感、抑郁、焦虑等一系列心理不适,并对青少年的生活方式造成重要影响[5]。
2 研究方法及系统设计
鉴于手机依赖现象的发展及其危害的日益严重。目前有关手机依赖及其相关问题已引起研究者的普遍关注。有的通过编制量表对手机依赖者进行筛选及现状分析;有的从个体的动机因素去分析对手机依赖的影响;还有从个体的人格特征进行探索。
目前研究手机依赖问题常用的方法主要是通过调查问卷的方式得到基础数据,然后在此数据的基础上通过统计分析的方法对数据进行分析处理,进而从社会学和心理学的角度分析手机依赖所带来的危害及其解决办法。
文中在调查问卷的基础上,通过工程的方法建立手机依赖分析系统,对被调查的大学生作出是否为手机依赖者的判断并作出统计分析。通过该系统,学校和老师可以及时的掌握学生的动态,进而采取相应的应对措施。
2.1 研究方法
本系统以香港中文大学梁永炽教授编制的手机成瘾指数量表(Mobile Phone Addiction Index,MPAI)作为调查问卷,利用手机APP软件发布该问卷并要求本校学生作答和提交问卷,提交后的数据存入后台数据库中供手机依赖分类模型使用。
手机依赖分析系统的核心是利用PSO优化参数的支持向量机(SVM)建立的分类模型,该模型可以做出参与问卷者是否为手机依赖者的判断,系统再将分类结果进行更深入的统计分析,教学管理者和参与者便可以根据此分析结果采取相应的应对措施。
系统的结构框图如图1所示,主要由手机APP、服务器、手机依赖分类模型及分类结果统计分析4个部分组成。
图1 系统结构框图
2.2 手机APP设计
本系统的手机APP主要用来发布和回收手机依赖调查问卷,调查问卷以香港中文大学梁永炽教授编制的手机成瘾指数量表 (Mobile Phone Addiction Index,MPAI)作为调查问卷的基础进行编制。该APP用JAVA开发,通过JDBC(Java Data Base Connectivity,JDBC)与后台服务器中的MySQL数据库进行数据交互,手机APP界面如图2所示。
2.3 建模算法
1)支持向量机(SVM)
支持向量机 (Support Vector Machine,SVM)由Vapnik[6]于1995年首次提出,它是一种有监督的学习过程[7-8],通常用来进行分类[9](Support Vector Classification,SVC) 及回归预测分析[10](Support VectorRegression,SVR)。SVC的线性二分类问题定义为:对于给定的集合(x1,y1),(x2,y2),…,(xn,yn)∈Rn×R,其中xi∈Rn,yn∈{-1,1},i=1,…,n。根据集合,在n维实值空间(Rn)上找出一个实值函数g(xi),使得指示函数f(xi)满足式(1)的条件:
图2 APP调查问卷界面
式中ε为选取的阈值,-1代表一种类型,+1代表另一种类型。
而对于非线性分类问题,支持向量机需要用核函数将低维空间的线性不可分映射到高维空间来实现线性可分[11-12]。核函数的类型有多种,常用的核函数有多项式、高斯及RBF核函数。由于RBF核函数具有较强的插值能力、收敛域宽、参数少等优点[13],文中在SVM中使用RBF核函数,其表达式为:
式中:γ>0是RBF的参数。
在实际的应用中,RBF的参数γ直接影响其分类性能,而选择合适的惩罚因子C可以使学习机的置信范围及经验风险具有最佳的比例。为了解决支持向量机的参数选取的盲目性,本文利用粒子群优化算法(PSO)对SVM的参数进行优化,提出了基于PSO-SVM的手机依赖分类模型。
2)粒子群(PSO)对SVM参数的优化
PSO算法是 Kennedy[14]等人模拟鸟群的飞行捕食行为而提出的一种高效多维的并行寻优算法。本研究采用PSO算法来寻找SVM参数组(C、γ)的最优参数组合,即采用速度、位置搜索模型来寻找最优参数组合。设群体中的每个粒子由2维参数向量(C,γ)组成,第i个粒子在2维解空间的位置为ui=(ui1,ui2)T,其速度为vi=(vi1,vi2)T。本次迭代的个体极值为p,全局极值为g。在每次迭代中,粒子跟踪个体极值、全局极值和自己前一次迭代的状态来调整本次迭代的位置和速度,迭代公式为[15]:
其中:vi(t)、vi(t+1)、ui(t)、ui(t+1)分别是第 i个粒子在本次和下一次迭代的速度和位置;c1、c2是学习因子,其初始值本文分别取 1.5和 1.7;r1、r2是[0,1]之间的随机数;ω是权重因子,为加快收敛速度,其值根据式(5)随着算法的迭代进行自动调节。
其中:ωmax、ωmin∈[0,1]分别为最大和最小权重因子;t为当前迭代次数;tmax为总的迭代次数[16]。
3 分类模型数据的选取和预处理
在MySQL数据库的调查问卷数据中,随机抽取100份调查问卷数据,以手机成瘾指数量表(MPAI)的判定原则为基础依据对这100个参与者进行人工预判,预判的结果存入对应的问卷数据中形成样本集。由于样本集中的数据具有不同的数据类型,所以需要对每个样本数据的各个分量按照式(6)进行归一化预处理,将所有数据均归一化到 [0,1]的范围内。
其中:yi(j)为分量,yimax(j)和yimin(j)分别为第j个分量的最大和最小值,xi(j)为归一化后的分量,i=1,2,…n,n为样本数;j=1,2,…,m,m为样本属性数。
手机依赖分类系统以该100组归一化后的数据对PSO-SVM进行优化和训练,进而建立手机依赖分类模型,模型建立好后就可以实时地对采集到的问卷数据进行分类判断。
4 运行实例及结果分析
为了验证本分析系统的有效性和可靠性,随机选取本校学生的82个问卷作分析,该系统的分类准确率可以达到97.561%(80/82),其PSO优化后的最优参数是C=0.8,γ=1.0。分类结果的统计分析如表1所示。运行结果表明,本系统可以自动的进行手机依赖者的筛选和统计分析,系统的分析结果可信、可靠。
5 结 论
文中提出的基于PSO-SVM的大学生手机依赖分析系统,通过手机APP发布和回收手机成瘾指数量表问卷,避免了问卷的发放、收集和数据录入分析等繁琐的工作。系统设计具有一定的灵活性:系统可随着调查问卷的变化来改变分类策略和统计分析的结构。将支持向量机SVM[17-18]和粒子群PSO优化算法结合,使系统的分类准确率高达97.561%。系统分类结果的统计分析功能,便于掌握学生的最新动态。运行结果表明,本系统可以自动的进行手机依赖者的筛选和统计分析,系统的分析结果可信可靠。
表1 分类结果统计分析表
[1]张云,茆意宏.大学生移动阅读沉迷现象与阅读引导[J].图书情报工作,2014,58(17):36-40.
[2]董海军,杨荣辉.大学生手机依赖与需求的实证分析[J].中国青年研究,2014(4):15-19.
[3]贾悦.国外手机依赖研究综述 [J].北京邮电大学学报:社会科学版,2015(3):74-79.
[4]逄方圆,宗宇.新环境下手机依赖对大学生的危害分析及应对策略[J].统计与管理,2014(7):94-95.
[5]贺金波,陈昌润,鲍远纯,等.青少年手机依赖的测量、危害和发生机制[J].中国临床心理学杂志,2012,20(6):822-825.
[6]Vapnik V N.The nature of statistical learning theory[M].New York:Springer,1995.
[7]张伟,李泓仪,兰书梅,等.GA-SVM对上证综指走势的预测研究[J].东北师大学报:自然科学版,2012(1):55-59.
[8]田宇驰,胡亮.基于SVM的一种医疗数据分析模型[J].东北师大学报:自然科学版,2015,47(1): 77-82.
[9]毕安琪,王士同.基于SVC和SVR约束组合的迁移学习分类算法[J].控制与决策,2014,(29):1021-1026.
[10]傅成红,张阳.基于参数优化的SVR城市群交通需求预测方法[J].系统工程,2016,(34):114-120.
[11]李克靖,孙凤梅,石乔林.一种基于SVM的多特征参数清浊音判决算法[J].电子设计工程,2016,24(5):184-186.
[12]唐喆,曹旭东.网页分类中特征选择方法的研究[J].电子设计工程,2016,24(5):120-122.
[13]舒坚,汤津,刘琳岚,等.基于模糊支持向量回归机的WSNs链路质量预测 [J].计算机研究与发展,2015,52(8):1842-1851.
[14]Kennedy J, Eberhart R. Particle swarm optimization [C]// Neural Networks, 1995. Proceedings.,IEEE International Conference on. IEEE,1995:1942-1948 vol.4.
[15]李红连,唐炬.基于PSO-SVR的同步发电机励磁电流预测[J].西北农林科技大学学报:自然科学版,2013,41(6):188-194.
[16]齐乃明,孙小雷,董程,等.航迹预测的多无人机任务规划方法 [J].哈尔滨工业大学学报,2016(4):32-36.
[17]刘白林,陈国一,邹会云.类间距节点优化DDAGSVM算法在多故障诊断中的应用[J].西安工业大学学报,2014(5):369-373.
[18]茅嫣蕾,魏赟,贾佳.一种基于KKT条件和壳向量的SVM增量学习算法[J].电子科技,2016(2):38-40.
A college students’mobile phone dependence analysis system based on PSO-SVM
Aiming at the problem of the physiology,psychological and social function damage caused by mobile phone dependence,a mobile phone dependence analysis system for college students is designed. The system combined support vector machine(SVM)with particle swarm optimization(PSO)algorithm,using PSO to optimize the SVM kernel function parameters γ and penalty factor C.The system distributesand takesback the MPAIquestionnairesthrough mobile phone APP, using the questionnaires'data to train PSO-SVM and then gets the phone dependence classification model,the model can be used to classify the collected questionnaires in real time and can avoid tedious work of distribution,collection and data entry of the questionnaire.The system can also carry on statistical analysis to the result of classification,easy to grasp the situation of students.The experimental results show that the classification accuracy of the system is as high as 97.561%,and the system can automatically carry out screening and statistical analysis of the mobile phone dependence,the results of the system can be trusted and reliable.
support vector machine;particle swarm optimization;college students mobile phone dependence;mobile phone addiction index;APP
TN957.52
:A
:1674-6236(2017)01-0013-04
XU Wei-jun,YUAN Da-ming,LIU Dong-sheng
(Northeast Petroleum University at Qinhuangdao,Qinhuangdao 066004,china)
2016-04-22稿件编号:201604220
河北省高教会2015年度高等教育科学研究课题(GJXH2015-310)
徐炜君(1981—),男,陕西富平人,硕士,讲师。研究方向:自动控制、风电预测及人工智能等。