APP下载

基于贝叶斯与FCM的金融教学资源库构建与推送研究

2016-05-17张笑言

长沙民政职业技术学院学报 2016年3期
关键词:贝叶斯资源库聚类

张笑言

(1.湖南大众传媒职业技术学院管理学院,湖南长沙410100;2.中南大学,湖南长沙410001)

基于贝叶斯与FCM的金融教学资源库构建与推送研究

张笑言1,2

(1.湖南大众传媒职业技术学院管理学院,湖南长沙410100;2.中南大学,湖南长沙410001)

随着互联网和信息技术的快速发展,有必要建立完善的金融教学资源库,促进资源交流和社会服务。针对目前国内金融类教学资源零散、低效的情况,研究大数据背景下基于贝叶斯模型的金融教学资源的构建与推送。通过分析金融教学资源的内容,利用模糊C均值聚类算法 (FCM)分析教学资源间的关联关系,构建教学资源网络,并用实例验证了该模型对资源库的管理水平和用户的检索效率的有效性。

贝叶斯模型;模糊C均值聚类;金融教学资源库;推送系统;大数据

一、引言

现代社会强调大学特别是职业学院的社会服务和资源共享功能。随着互联网和信息科技的发展,越来越多的大学将自己的教学资源,如电子课件、教学视频等放在网上共享,甚至还出现了专门为大众提供网络学习的课程。金融专业作为经济管理类的老牌专业,随着我国金融市场的不断开放与发展,不仅在大学里受到广泛亲睐,社会上对金融知识的需求也日益强烈。国外很多世界知名大学已经把金融的相关教学资源放在互联网上供公众学习,如美国西南大学的投资学入门、哥伦比亚大学的房地产金融学、耶鲁大学的金融理论等,全球领先的开放课程平台提供者Coursera免费提供金融工程与风险管理、企业金融学概论等课程,学生可以在线学习、写作业和考试,甚至还可拿到相应的证书。我国近年来在金融教学资源的共享上也做出了一些尝试,如北京交通大学的网上公开课“金融与生活”,武汉理工大学公开课“改变世界的电子支付”,以湖南省大专院校为依托的“世界大学城”等。但随着金融教学资源越来越多,来源越来越广,人们很难从中快速检索到自己所需要的资源,往往耗费大量时间却没有找到自己需要的资源。

目前国内已有不少关于教学资源库建设的研究,如朱维巍[1]分析了高职院校教学资源库网络化建设和应用的现状与问题,并在此基础上提出了几点建议。方东傅[2]就高职共享型专业教学资源库的体系架构、资源库网络信息资源建设、实验实训资源共享平台建设等方面进行探讨。大部分文献主要定性为对资源库的架构进行探讨,实践指导意义不大,也有一些学者从数据库等技术角度探讨了资源库的构建,如梁斌、巫于斌[3]设计了知识管理工具开发模型图,同时,探讨了知识管理工具在网络教学中的应用。徐佳宁[4]从服务目标、信息组织原则、资源采集、本地化技术、数据库结构、网站框架等方面探讨高校教学信息资源平台的构建策略和实现方法。然而,这些研究中缺少对教学资源进行整合优化和推送的研究,基于金融方面的教学资源库建设和推送研究更是寥寥无几。因此,本文通过分析金融相关教学资源的内容和特点,利用模糊C均值理论(FCM)和贝叶斯模型研究金融教学资源的知识推送模型和面向推送的资源库的构建,让用户能快速、准确、高效地找到其需要的资源。

二、金融教学资源库构建

1、金融教学资源库的内容

金融资源库的内容应包括:(1)课程教学类资源,包括课程大纲教案、多媒体课件、电子教材参考书等;(2)素材工具类资源,包括换算表、应用软件、工具书等;(3)习题试题类资源,包括与教材配套习题、试题库等;(4)实训实践类资源,包括实训计划要求、顶岗实习指导、考核要求等;(5)研究论文类资源,包括期刊论文、学位论文、教学心得等。(6)多媒体案例资源,包括文字型和多媒体案例、讨论要求等[4]。

2、资源的融合与资源网络构建

金融教学资源库汇集了全国多家学校上百位教师的教学资源,且不断处于更新中,这就要求将不同来源的资源进行整合,找出资源之间的相互关系,构建资源网络。本文通过模糊C均值聚类,实现资源融合和网络的构建。

FCM算法是一种柔性的模糊划分,划分区域之间互相重叠,数据是否隶属于某一聚类是由隶属程度决定的,隶属程度在0到1之间[5]。从形式上看,假设有N组数据,其中n代表数据个数,h代表每个数据的维度,FCM就是把这n组数据划分到C个聚类中,隶属度为uij∈[0,1],代表第i组数对聚类j的隶属度。隶属度的计算采用目前最广泛使用的模糊加权目标函数J作为优化约束:

其中V为聚类中心向量,代表欧氏距离。运用迭代方法不断寻找最佳聚类中心,直到目标函数J达到指定数值或迭代次数完成。

这样我们就可以得到一个隶属矩阵U=[uij]。通过模糊聚类,将相似程度高的资源融合在一起,并利用隶属度构建资源网络。聚类数的选取是FCM的关键问题,一般评价函数[6]对其进行判别。使评价函数最小的聚类结果所对应的聚类数作为最优聚类数,评价函数为公式(2)。

以上获得的聚类结果,用欧氏距离计算各资源间的距离,即关联关系,就构成了资源网络[7],用于存储和快速搜索相关资源。

三、金融教学资源推送系统

1、推送系统构建

为了实现金融教学资源的快速有效推送,首先需要对用户的资源需求进行分解。用户由于不同的目的对教学资源有所需求,该需求又可以分解为若干子需求。不同的用户,根据其知识构成、所处行业等的不同,同样的目标所需的资源内容层次也是不一样的。在金融教学资源推送系统中,用户输入查询目的,系统根据用户的自身情况推送出最适合的教学资源。知识推送可以采用基于语境框架的文本相似度模型[8],但该方法检索准确率低,不适用于模糊性大的需求检索。利用案例推理进行知识推送适用于检索本体差异性小的情况[9],而教学资源本身差异性大,很难计算出它们之间的相似度。鉴于大部分教学资源都是在互联网平台呈现和实现交互式服务,本文利用大数据预测推理思想,从互联网已有的金融教学资源检索使用数据利用贝叶斯方法建模,分析用户信息与教学资源间的相关关系,从而达到快速准确推送的目的。具体推送系统如图1所示。该系统包括6个模块:资源存放模块、资源管理模块、资源检索模块、资源推送模块、资源需求模块和推送任务模块。

图1 金融教学资源推送系统框架构建

2.大数据背景下基于贝叶斯分类模型的资源推送规则

随着互联网的发展和数据存储处理能力的提高,利用网上的海量数据进行商业管理、学术研究等已经成为大势所趋。利用大数据,不用分析出数据间的因果关系,只要找到它们之间的相关关系,就能进行预测,且一般来说数据越多预测效果越好[10]。本文利用贝叶斯分类模型求解资源推送规则。

贝叶斯分类算法首先将用户信息I转化为特征向量,其中代表用户的某一个属性或需求。设相应的概率向量为,表示每一特征向量对应的概率。将教学资源也转换成特征向量和相应的概率。当某一用户信息I出现时需要资源Ri的概率可表示为:

其中,为信息I发生的概率,表示资源Ri被检索到的先验概率,为Ri被检索时信息I发生的条件概率。上述公式都关键在于如何计算,本文利用贝叶斯多项式模型求解。

四、应用实例

以某网站推出的公开课中与金融有关的课程验证本文提出的数据库构建和推送模型的有效性。在网站首页搜索关键词—“金融”,共搜索出37门课程,提取出课程相关属性,包括关键词、课时、学校和时间,如表1所示。另外,根据网站内部资料,得到100,000用户的个人信息和所学习的课程,根据相关数据可以预测某一用户适合的教学资源。

表1 金融课程属性

1、数据预处理

由于表1中课程的大部分属性为文本型数据,需要首先对数据进行处理。对于“关键词”这个文本属性,由于里面包含很多符号型数据,且数目不等,可以将每一个关键词作为一个属性,将其转化为0-1型数据,“学校”可相应转化为整数型数据“1,2,3,4,……”或单字符型数据“a,b,c,d……”。整理后的数据如表2所示:

表2 调整后的课程资源属性

图2课程资源网络与聚类

2、课程资源推送规则验证

利用贝叶斯方法用户根据个人信息预测其金融教学资源需求。采用100,000个用户的资料,其中90,000组资料为训练数据,10,000组资料为测试数据。预测结果显示预测误差为18.7%。将贝叶斯预测方法与神经网络方法[11]、线性回归法和案例推理法[12]进行比较,比较结果如表3所示。

表3 预测误差比较

由表3可见,本文所提的贝叶斯方法在预测的准确率上要明显优于其他预测方法。但本方法主要适用于数据量很大的情况,运行速度快,准确率高,对于基于网络的金融资源库来说是合适的预测方法。利用该方法可以较快、准确地预测用户的教学资源需求,为其推送适合的资源,提高资源库的查询速度和利用效率。

五、总结

本文结合金融教学资源特点,提出基于贝叶斯模型的资源推送模型和基于FCM的资源融合和网络构建机制,注重金融教学资源的开放性、扩展性和更新性,用数据挖掘方法找出资源间的关联关系,有效实现资源融合,使其能快速有效地推送给需要的用户手中。本文利用先进的数据分析方法构建金融教学资源的推送系统,使资源库的构建维护从仅凭“经验”转为“经验加系统支持”的模式,使其更自动化与智能化,提高构建和维护的效率。

[1]朱维巍.高职院校教学资源库网络化建设与应用研究[J].中国职业技术教育,2011,(11):68-72.

[2]方东傅.高职共享型专业教学资源库建设策略的研究[J].实验室研究与探索,2007,26(6):157-159.

[3]梁斌,巫玉斌.网络教学资源库系统中知识管理工具的设计与应用[J].中国远程教育,2007,(2):71-75.

[4]徐佳宁.面向对象的学科教学资源平台的构建研究[J].现代情报,2007,27(3):192-194.

[5]Ceylan,R.,Y.?zbay.Comparison of FCM,PCA and WT techniques for classification ECG arrhythmias using artificial neural network[J].Expert Systems with Applications,2007,33(2):286-295.

[6]Xie,X.L.,G.Beni.A validity measure for fuzzy clustering[J].Pattern Analysis and Machine Intelligence,IEEE Transactions on,1991, 13(8):841-847.

[7]曹霞,刘国巍,付向梅等.基于网络视角的知识整合过程机理及仿真[J].科学学研究,2012,30(6):886-894.

[8]赵杨.基于语义网格的数字图书馆知识推送服务系统研究[J].情报科学,2008,25(12):1869-1873.

[9]蒋翠清,李斌生,陆文星.基于实例库的机械产品协同设计知识推送研究[J].机械设计与制造,2012,(1):257-259.

[10]Junqué de Fortuny,E.,D.Martens,F.Provost.Predictive Modeling With Big Data:Is Bigger Really Better?[J].Big Data,2013,1(4):215-226.

[11]张德丰.MATLAB神经网络编程[M].北京:化学工业出版社, 2011.

[12]韩敏,王心哲,李洋等.基于贝叶斯粗糙集和混合专家模型的CBR系统[J].控制与决策,2013,28(1):157-158.

G40-057

A

1671-5136(2016)03-0118-03

2016-09-12

本文为湖南大众传媒职业技术学院教研教改课题《高职金融类教学资源库整合与推广研究》(项目编号:14JY15)的阶段性研究成果。

张笑言(1984—),女,湖南长沙人,湖南大众传媒职业技术学院讲师、中南大学商学院在读博士。研究方向:金融投资、信息系统与决策支持技术、现代成本管理。

猜你喜欢

贝叶斯资源库聚类
健身气功开放课程资源库建设研究
基于K-means聚类的车-地无线通信场强研究
贵州●石斛种质资源库
基于共享资源库的混合式教学考核模式研究
基于高斯混合聚类的阵列干涉SAR三维成像
高中历史信息化教育资源库应用探索
基于贝叶斯估计的轨道占用识别方法
基于Spark平台的K-means聚类算法改进及并行化实现
基于互信息的贝叶斯网络结构学习
一种基于贝叶斯压缩感知的说话人识别方法