基于马尔科夫模型的电子商务课程远程教学方法
2022-07-12王雷
王雷
(台州职业技术学院, 经贸学院(电子商务学院), 浙江, 台州 318000)
0 引言
身处全球经济一体化环境,电子商务已变成人类生活中不可缺少的部分,是推进社会与企业持续进步的必经之路。电子商务是一个融合计算机科学、管理学及市场营销学等多个学科的综合性专业[1-2]。现阶段电子商务的快速发展,造成人才资源的紧缺,这也是阻碍电子商务进一步发展的关键要素。为培育素质过硬的电子商务专业人才,每个高校均设立了电子商务专业课程。电子商务课程是和该领域活动有关的课程总和[3],包含电子商务实务、网络营销等内容,拥有综合性、实践性等多种特征[4]。目前在国外的电子商务远程教学中,均侧重电子商务管理方面,且学时较短,对学生学习内容的巩固效果不佳。在我国很多教师还是采用灌输式教学策略实施电子商务课程教学,这不但降低了学生的学习积极性,也让电子商务教学改革之路愈发艰巨。
针对以上教学中出现的实际问题,融合计算机网络,提出了一种基于马尔科夫模型的电子商务课程远程教学方法,运用马尔科夫模型完成远程教学语音识别处理,提升教师传递教学内容准确性,采用统一建模语言,并利用ASP.NET技术,组建电子商务课程远程教学平台,通过实例分析表明所提方法可靠性。
1 基于马尔科夫模型的远程教学语音识别
远程教学模式无法让师生面对面进行课程交流,为此本文设计基于马尔科夫模型的电子商务课程远程教学语音识别方法,通过语音识别处理,让远程教学内容表述更加清晰明确,提升教学质量。
预处理语音信号主要包含以下内容:预加重是一个极其关键的前处理技术,语音信号频谱高频区域能量较低,极易受到干扰现象的影响,解析语音信号之前,运用数字传输函数来增强高频范围,过程为
H(z)=1-0.95×z-1
(1)
式中,H(z)是数字z的传输函数。
语音信号呈现出短时稳定的形态特征,分段处理持续的语音信号。为确保特征向量系数平滑性,帧和帧之间会有某些样本被重复利用。与此同时,为减少语音帧截断效用,加窗处理语音数据,这里使用海明窗算法完成计算,得到:
w(n)=0.54-0.46×cos(2π/(N-1))
(2)
其中,w(n)表示加窗处理后的语音数据,N表示语音数据总量。
短时能量均值是语音信号在此帧内的能量平均值[5],具有分割无声有声之间的边界、连字间的边界等作用,记作:
(3)
使用马尔科夫模型实现电子商务课程远程教学语音识别。马尔科夫模型为一个五元组(S,A,V,B,π),S表示状态数据集,V表示符号输出集,π为一个原始形态概率分布,A代表形态转移概率分布矩阵,B是形态符号发射的概率分布矩阵。
通过马尔科夫模型相关定理可知,该模型就是一个双重随机流程。马尔科夫族模型是马尔科夫模型中的一种表达形式,设定X={X1,X2,…,Xm}代表m维随机矢量,分量Xi与有限状态集合数量相同。马尔可夫族模型需要符合如下约束条件。
第一,各个分量Xi均为一个ni阶马尔科夫链,记作:
P(xi,t|xi,1,…,xt-1)=P(xi,t|xi,t-ni+1,…,xi,t-1)
(4)
第二,分量处于时段t时产生某个状态的概率仅和此分量在时段t过往状态及时段t其余分量的实时状态有关,描述成:
P(xi,t|x1,1,…,x1,t,…,xi,1,…,xi-1,…,xm,1,…,xm,t)=
P(xi,t|xi,t-ni+1,…,x1,t-1|x1,t)·P(x1,t|xi,t)…P(xm,t|xi,t)
(5)
第三,需要满足条件独立性原则:
P(xi,t-ni+1,…,xi,t-1,x1,t…,xi-1,t,xi+1,t,…,xm,t|xi,t)=
P(xi,t-ni+1,…,xi,t-1|x1,t)·P(x1,t|xi,t)…P(xm,t|xi,t)
(6)
第一个约束条件证明马尔科夫族模型是一种多种随机流程;第二个约束条件可以明确马尔科夫族模型多重随机流程之间的耦合关联,运用此特征可以化简模型运算复杂度;第三个约束条件表明某个分量处于时段t时,此变量在时段t之前的ni-1个值和其余分量在时段t之前的值为互相独立的,也就是马尔科夫族模型使用条件独立性假设替代了马尔科夫模型内的独立性假设。立足统计学理论,相对条件独立假设与独立性假设是过度假设,和语音相关内容不太贴切。所以本文使用马尔科夫族模型来模拟真实的语言物理过程。
在持续不断的电子商务课程远程教学中,不同教师处于不同语言环境下讲话语速差别较大,和正常语速差别较多通常会造成语音识别错误,较快的语速会大幅增长语音识别错误率,较慢的语速会导致插入错误。当前对语音识别问题的分析关键是根据某个策略获得识别语音的语速权衡原则,再凭借语速快慢更新转换几率,在语速较慢的情况下增加形态自转变的几率,调节各个语音单元的连续时长,适应教师授课的不同语速。
段长表述语音的时间长度,构建一个基于段长分布的马尔科夫族模型,挑选不同的语音段长度,授课时的讲话速率改变情况即为段长的变化幅度起伏情况,与此同时,语速改变对段长的影响是共同增多与共同减少的,也就是语速较慢时,上个语音单元要大于段长均值,下一个语音单元段长大于上个语音单元。同时,处于很短的时段,教师的说话速率会较为平稳,也就是一个短的时间中此种语速对段长的影响是大致相等的,这样就利用上一个语音单元段长的平均值误差来评估下一个语音单元段长的改变走向。
语音识别模型一般将音子当作识别单位,倘若音子模型具备的形态有L个类型,描述成sl,在时段n时的形态为xn,yn是形态xn的观测特征,在形态xn持续停留的段长为τn,将语音识别相关概率记作:
al=asl=P(xn=sl)
ai,j=asi,sj=P(xn+1=sj|xn=si)
bl(yn)=bsl(yn)=P(yn|xn=sl)
(7)
(8)
语音识别就是通过观测序列计算最优的形态序列S,获得最优的词序列,也就是识别过程中最有可能出现的词序列,词序列计算过程为
(9)
假设Γ是相对于词序列W可能形态序列S的数据集,得到如下公式:
(10)
倘若T1、Ti,1均为段长分割点,同时O表示一个M阶马尔科夫链,则拥有下列不等式关系:
(11)
条件概率P(τn+1=τi,j|τn=τi,j-1,wi)的推导过程使用邻近2个语音单元之间的段长数据,这样就能得到马尔科夫族模型的段长二元概率[6]。也可以采用邻近的r个语音单元之间的段长数据,对应获取的结果就是段长r元概率。
因为语音数据的稀疏特性,条件概率P(τn+1=τi,j|τn=τi,j-1,wi)可以取趋近值P(τn+1=τi,j|τn=τi,j-1)或利用平滑计算模式得到,将条件概率表述成:
P(τn+1=τi,j|τn=τi,j-1,wi)≈(1-λwi)·
P(τn+1=τi,j|τn=τi,j-1i)+λwiP(τn+1=τi,j|τn=τi,j-1,wi)
(12)
式中,λw表示平滑参变量,0<λw<1,τi,j是形态段长,也可以当作半音节及音节的时间长度。在本文方法中,形态i的停留概率ai,j是一个常数,模型处于形态i后在此形态持续停留的时长τ要顺从几何分布规律,如式(13)所示,以此得到更加优秀的语音识别精度。
(13)
2 基于统一建模语言的电子商务课程远程教学平台开发
2.1 平台设计思路
面向电子商务课程远程教学的核心需求,设计一个基于统一建模语言的电子商务课程远程教学平台。本文平台创建理念满足电子商务课程教学规律,以心理学相关内容为基础,充分分析学生认知水平及特点[7],提高学生学习积极性。平台设计风格简洁明了,在操作实用性方面得到极大提升。
通过上述设计思路分析,划分系统内包含如下角色:平台管理员、学习人员。用户经过功能选择,可以找到不同的功能页面,平台设计主要顺序如图1所示。
图1 平台设计顺序
即便用户类型较多,且不同的用户具备自身的功能权限与事务,但训练平台软件类目标的构成可以分成用户页面包、事务处理包和后台信息处理包,将三者的关联表示为图2。
图2 软件包之间的关联
统一建模语言处于编码阶段时,运用Visual Studio.Net当作前端研发工具[8],SQL Server是平台数据库完成编程任务。编码过程中,会挖掘出平台的潜在缺陷与隐患,使用Rational Rose逆向工程的功能来修正平台不足。
测试的根本目标是明确平台研发的错误。测试工作使用例描述作为基础,查看平台是否实现最初的设计需求,平台配置为真实的交付系统,包含文档与模型等子系统,测试、配置与统一建模语言之间的关联可参见图3。
图3 测试、配置与统一建模语言之间的关联示意图
2.2 电子商务课程远程教学平台实现
远程教学平台架构包含服务器/客户机(Client-Server,C/S)与浏览器/服务器(Browser/Server,B/S)两种架构。C/S架构在平台集成维护、操作页面一致性、平台拓展性、安全性等方面拥有显著局限性,而B/S为三层结构包含界面层、事务层与数据库层。数据库无法直接给各个客户机提供操作服务,而是运用Web服务器实现交互,完成对用户数据服务的即时性与动态性,在用户机内无需设置应用程序,将应用程序架设于事务层所处的计算机内,信息均储存于数据库服务器内,这样的结构设计更具安全性。本文平台构建于Web架构中,采用ASP.NET开发技术,将ASP.NET开发技术的编译流程记作图4。
图4 ASP.NET开发技术编译流程
平台设计包含软件与硬件两个平台。硬件包含网络结构、网络连接与局域网至广域网的接入,软件包含网络协议、操作子系统、平台制作工具与数据库软件,这里采用Windows NT的软硬件开发工具。
统一建模语言对平台的环境支撑应当拥有如下功能:画图、目标存储、产生代码、导航、集成及模型互换。基于以上开发环境建设,将电子商务课程远程教学平台整体结构表示成图5。
图5 远程教学平台结构
管理板块中,平台可以自动管理全部用户资料,同时追踪用户对远程教学资料的使用状况,组织在线考试与疑难问题解答,利用成绩管理子板块明确学生的真实学习状态,给学生正确的学习指导,完成学生对电子商务课程的自主学习。
教学板块包含电子商务实验教学、电子教案和实验软件模拟教学3个子版块,很好地弥补了传统教学方式不足,让学生身临其境地感受电子商务的真实交互状态,增强学生的课程掌握能力。
学生学习板块使用选择题与问答题对学生进行知识检测,利用评分体系快速明确学生成绩,让学生自行规划学习进度,并提供对应的教程资源,拓宽学生视野。
术语查找板块让学生运用搜索功能实现准确的电子商务术语查找,还能利用模糊查找快速有效地查看生僻术语,提升自身学习速率。
系统演示功能板块可以使用Flash技术对教学、学生学习与名词术语查找进行生动演示,可以提高系统全局教学质量,让师生更加快速地了解平台的操作步骤与技巧,完成电子商务远程教学预期目标。
3 实验结果与分析
为了证明所提方法的有效性,选择某高校电子商务专业的35名学生作为实验目标,进行为期一个月的远程教学,列举若干因素与课程问题,对学生进行电子商务课程远程教学问卷调查,将学生问卷评估指标分为良、优、差,计算出相应分数。研究采集的数据使用SPSS 12.0 for windows与statistics完成统计处理,将问卷调查后的结果表示为表1。
表1 电子商务课程远程教学问卷调查结果
从表1可知,电子商务专业学生对本文方法的教学效果拥有极高的评价,证明所提方法能够根据电子商务专业的学生特点与需求制定极具针对性的教学内容,并且本文采用了马尔科夫模型的电子商务课程远程教学语音识别方法,可以保证授课教师所讲内容有效地传递给学生,让学生得到更好的交互体验同时,也培养了学生的自主学习能力。
为了更进一步地展现方法的可靠性,对比传统教学与远程教学模式,从出勤率、小测成绩、月考成绩、小组讨论积极性等几方面进行仿真实验,每5天为一个周期,实验结果如图6~图8所示。
由图6~图8可知,与电子商务课程传统教学模式相比,本文方法的远程教学模式获得了更加优秀的学习效果,显著提升了学生的考核成绩,与问卷调查结果基本相同,表明本文方法拥有优秀的实用性,为电子商务课程教学的深入改革发挥重要作用。
图6 出勤率情况对比
图7 小测成绩与月考成绩的教学情况对比
图8 小组讨论积极性对比
4 总结
针对传统电子商务课程灌输式教学弊端,提出基于马尔科夫模型的电子商务课程远程教学方法。所提方法能够从根本上扭转学生对电子商务课程的刻板印象,加强师生间的互动性,有效提升学生考核成绩。接下来会在方法上引入更细致的多媒体文件分类查找业务,进一步提高平台用户体验感。