基于关联规则的职业定位推理算法研究
2019-10-11金晖谭文斌
金晖 谭文斌
摘 要:为解决准大学生和在校大学生职业定位不清晰的问题,文章提出了一种基于关联规则的职业定位推理算法。通过对大学生个人性格特征、兴趣爱好、特长及知识结构的职业定位推理计算,推理出准大学生和在校大学生可能的职业方向,有效实现了对用户职业定位的推理,有助于准大学生和在校大学生及时找到自己的职业定位,明确发展方向。
关键词:职业定位;关联规则;性格特征;数据挖掘
当前,随着大学生人数的逐年增加,大学生的就业形势也变得日趋严峻,每年的应届大学毕业生人数超过700万。本文对此作了大量的调查和研究[1-5],调查结果显示,超过20%的大学生没有自己的职业规划,16%的大学生不清楚自己适合做什么工作、将来能做什么工作,7%的大学生在虚度光阴,对就业前景感到迷茫。对此,本文依托大数据分析技术,提出了基于关联规则的职业定位推理算法,构建了推理模型,拟通过对大学生个人性格特征、兴趣爱好、特长以及知识结构等数据的分析,推理出适合该大学生的职业发展方向。
近年来,在基于关联规则的数据挖掘方面,部分学者对此作了研究。王玲[6]提出了基于多维时态的关联规则推理算法,实现了对时间序列的定量预测。亓文娟[7]提出了基于Apriori算法的航空设备故障关联分析方法,以助于航空设备故障分析。刘莉萍[8]对增量式关联规则挖掘算法进行了研究,提出了提取频繁项集的方法。陈秀秀[9]对基于Spark的并行关联规则挖掘算法进行了分类和综述,对并行关联规则等算法的优缺点和适用范围进行了总结,以上研究为本文的研究工作提供了参考。
1 职业定位推理算法的相关定义
基于上述分析,本文将重新构建评论语句的相似度计算模型,为便于描述,本文对相关概念作如下定义。
定义1:个人性格特征和兴趣集合Charac={CN,N=1,2,3,…},CN表示集合C中第N个特征。
定义2:职业集合Prof={PM,M=1,2,3,…},PM表示集合P中第M个职业。
定义3:设定集合X和集合Y,x属于X中的元素,y属于Y中的元素,X集合是由CN及其推理出来的结果集组成,Y集合是由PM及其推理出来的结果集组成。
定义4:规则集合R={RK,K=1,2,3,…},RK表示集合R中第K个规则,用表达式表示为XKYK。
定义5:最小支持度为S,表示集合X中的x和集合Y中的y同時存在的记录数Count(x∪y)占记录总数N的比例。通过该参数来反映所推理规则的有用性,其计算公式如式(1)所示:
S=Support(x→y)=Count(x∪y)/N (1)
定义6:置信度Conf,表示集合X中的x和集合Y中的y同时存在的记录数Count(x∪y)与集合X的总数Count(X)之比,其计算公式为:
Conf=Confidence(x→y)=Count(x∪y)/Count(X) (2)
定义7:固定推理路径集合I={IM,M=1,2,3,…},IM表示集合I中第M个固定规则,该规则集合中的元素满足任意一个规则都具备满足最小支持度S和最小置信度Conf,该规则为人工添加,通过查阅资料和统计数据获得。
基于上述定义,对用户输入的特征及兴趣集合C,将进行职业定位算法运算,以得到职业PM。
2 算法描述
职业定位推理算法首先根据用户输入的性格和兴趣特征描述,将其与规则库里面的规则进行匹配,推理出可能的职业定位方向,现将职业定位推理算法描述如下。
(1)读取用户个人性格特征和兴趣数据集,得到集合C。
(2)根据步骤(1)中得到的数据集合,与集合R和I中的关联规则进行匹配和推理,得出用户可能的职业方向,以供用户选择。
(3)根据步骤(2)中得到的可能职业方向,梳理出为实现该目标所需要的知识和技能,以告知用户实现各目标的有效路径。
基于以上描述,算法流程如下:
算法:职业定位算法
Input:个人性格特征和兴趣集合Charac
Output:可能的职业方向
DEFINE MID_SET
SCANF Charac={CN,N=1,2,3,…} //用户输入特征描述
FOR CN OR Characsubset IN Charac:
FOR i IN R∪I: //其中R={RK,K=1,2,3,…},I={IM,M=1,2,3,…}
IF i Matched CN:
MID_SET ADD i
ENDIF
ENDFOR
ENDFOR
FOR m in MID_SET:
EXTRACT END of m INTO RESULT_SET
ENDFOR
Output RESULT_SET
END
通过对用户性格特征和兴趣数据集的推理,实现对用户职业方向的定位。
3 算法实例
当用户输入{待遇好、时间自由、喜欢编程、工作强度较大、数学较好}信息后,根据用户输入进行推理,得到的结果如图1所示,得出用户可能的职业是技术工程师中的软件开发工作。
4 结语
本文对关联规则算法进行了改进,通过查阅资料和统计数据获得部分固定规则,共同组成了关联规则集合,在此基础上,构建了职业定位算法。通过对用户输入的数据进行推理,查找出用户可能的职业方向,有效实现了对用户职业定位的推理,有助于准大学生和在校大学生及时找到自己的职业定位,明确发展方向。
[参考文献]
[1]刘芷含.大学生就业压力与主观幸福感:双向中介效应[EB/OL].(2019-04-16)[2019-06-25].https://doi.org/10.16128/j.cnki.1005-3611.2019.02.034.
[2]张树峰.当前大学生就业问题:外部环境变化与就业选择理性[J].科教文汇,2019(4):7-8.
[3]李斯.新形势下高校大学生创业孵化基地服务体系研究[J].河北软件职业技术学院学报,2019(1):30-32.
[4]贺娜.供给侧改革视角下大学生就业竞争力提升对策研究[J].黑河学刊,2019(2):12-14.
[5]吴长城.“95后”高校毕业生就业压力研究[J].信阳农林学院学报,2019(1):145-148.
[6]王玲,孟建瑶,李俊飞,等.基于多维时态关联规则的演化模糊推理预测算法[J].自动化学报,2018(8):1446-1459.
[7]亓文娟.增量式关联规则挖掘算法的研究[J].安阳工学院学报,2018(6):47-49.
[8]刘莉萍,章新友,牛晓录,等.基于Spark的并行关联规则挖掘算法研究综述[EB/OL].(2019-04-16)[2019-06-25].http://kns.cnki.net/kcms/detail/11.2127.TP.20190128.1804.009.html.
[9]陳秀秀,刘凯,马双涛,等.基于Apriori算法的航空设备故障关联分析[J].山东师范大学学报(自然科学版),2019(1):48-53.
Research on reasoning algorithms of professional location based on association rules
Jin Hui, Tan Wenbin*
(Tongren University, Tongren 554300, China)
Abstract:In order to solve the problem of unclear career orientation of prospective and college students, a reasoning algorithm for career orientation based on association rules is proposed in this paper. By reasoning and calculating the career orientation of college students personality characteristics, hobbies, specialties and knowledge structure, the possible career orientation of prospective college students and college students can be inferred, and the reasoning of users career orientation can be effectively realized. It is helpful for prospective college students and college students to find their own career orientation in time and make clear the direction of development.
Key words:career orientation; association rules; personality characteristics; data mining