APP下载

新工科背景下数据挖掘课程综合性实验设计

2020-04-03卫志华孔思尹丁志军赵才荣

计算机教育 2020年3期
关键词:工科数据挖掘情感

卫志华,孔思尹,丁志军,赵才荣

(同济大学 电子与信息工程学院,上海 201804)

0 引 言

21 世纪信息技术的发展使得万物互联成为可能,标志着全面互联时代的到来。互联网时代全球数据量爆炸性增长,数据和互联网的深度融合形成新的行业创新点不仅带来了新的经济增长点,也使得数据挖掘技术产生的价值受到越来越广泛的关注。目前国内高校人才培养仍然呈现出重基础理论轻实践的现状[1],没有真正建立以应用为目标和主线的课程体系和教材体系[2]。面对新一轮科技革命和产业革命的历史性交汇带来的新机遇以及国家产业发展的新形态,传统从事数据分析和应用的人才已经难以适应互联网时代的新要求[3-4],产业界迫切需要新兴工科人才的支持。在新工科背景下,数据挖掘课程实验应当以解决工业界实际问题为导向,摒弃传统的以单一理论和算法为主的设计,增强学生综合利用所学知识解决实际问题的能力,从而达到新型工科人才的培养标准。根据新工科背景下大数据人才的培养要求,结合数据挖掘课程挑战性[5]实验的定位,重新设计综合实验的内容、教学和评价体系。

1 实验方案设计

综合实验的设计应贯彻“以学生为本,以能力培养为核心”[1]的教学理念,从学生的兴趣和互联网实际应用场景出发,选择微博评论或话题的情感分析作为主题,由学生选择他们关注的热门评论或话题作为切入点,形成完整的从数据采集、存储到分析并评价结果的流程。在实验过程中始终遵循新工科人才的培养标准,在提升学生学习和思考等硬实力的同时,也要兼顾学生沟通和表达能力等软实力的提升。综上,实验方案的总体设计见表1。

2 实验内容设计

实验内容设计需要兼顾完成度和挑战性,循序渐进,在提升学生自信心的同时,进一步挖掘学生的潜力。在完成度方面,将综合性实验细化、拆分成3 个小实验,引导学生思考并解决此类综合性问题。在挑战性方面,为每个小实验都设置不同的进阶难度,并设置相应的分数值以及加分项,以激励学生从不同的视角进一步探索该问题,举一反三。微博评论或话题的情感分析实验内容简要总结见表2。

表1 综合实验方案总体设计

表2 微博评论或话题的情感分析(代码部分共50 分,最高加10 分)

实验3 是整个实验的核心部分,按照不同的粒度对文本的情感做出分析,难度也有所不同。学生可结合自身情况选择不同的分析粒度,采取不同的方式来完成数据分析,并尝试改进算法,提升实验的准确率。由于不同的方式均有不同的优缺点和实现难度,挑战也有所不同,因此在设计时把该部分单独提出来,只进行进一步纵向区分实验难度和挑战性。该部分加分项的设计主要是考查学生对问题进行迭代思考和解决的过程,不设立具体的加分点,鼓励学生自由探索和尝试。加分项遵循性能提升的准则,加分的多少则视学生思考的深度和广度而定。词语级别的情感分析仅考虑文本中单个词语的情感强度,以基于词典的情感分析为例,主要统计文本中情感词强度以及计算近似情感词强度,其实验内容简要总结如图1 所示。

图1 词语级别的情感分析实验内容

句子级别的情感分析除考虑单个词语情感强度外还需要考虑词语之间的关系,以基于word2vec 的情感分析为例,主要就是通过词向量进一步细化程度副词修饰下的情感词强度,其实验内容简要总结如图2 所示。

篇章级别的情感分析需要确定一个整体情绪的方向性,综合考虑词语之间、句子之间的情感强度,以基于LSTM 情感分析为例,进一步考虑句子之间的情感关系,其实验内容简要总结如图3 所示。

图2 句子级别的情感分析实验内容

图3 篇章级别的情感分析实验内容

基于词典的情感分析鼓励学生从词语的层面出发,思考和改进情感词典构建、新词发现、语义相似度评估等[6];基于word2vec 的情感分析鼓励学生从句子层面出发,利用情感特征聚类、多特征融合、多种分类方式相辅助等[7]机器学习的方式去完善和改进分析结果;基于LSTM 的情感分析则鼓励学生从篇章角度出发,采用层次化、Attention 机制以及Bi-LSTM 等[8]深度学习的方式去优化网络。三者的目的都是为了抛砖引玉,引导学生深入思考并发现创新点。

3 教学手段设计

学生在综合性实验中的收获很大程度上依赖教学手段,传统教学模式主要是“听中学”,学生很容易出现“一听就懂,一用就错”的情况,因此新工科背景下教学方式也应当进行相应改革,培养学生解决实际问题的能力,真正实现“做中学”。此外,还可引入公共竞赛机制,即学生采用同样的数据集完成对比实验,并将结果指标作为评分依据之一,激励学生进一步探索解决问题的新方式。

在教学过程中,教师的职能从传统的理论逐点讲解转变为抛出问题、引导思考、答疑解惑,应当充分发挥学生的主观能动性,促使学生能够通过查阅资料、做实验、与教师和同学讨论等多种方式自主探索并解决问题[9]。在完成基础性实验的过程中,将实验内容进行拆解,并给予一定的参考思路,培养学生对综合性复杂问题进行拆分和解决的能力。在完成挑战性实验的过程中,用加分的方式鼓励学生对实验结果做进一步的思考和分析,探索现有方案存在的问题和可改进的措施,迭代更新实验方案,培养学生创新性思考和解决问题的能力。教学实施方案如图4 所示。

4 评价方式设计

在实验评价过程中遵循多角度、全方位评价准则,细化实验评价指标,在对学生进行横向比较的同时兼顾纵向评估。细化实验评价指标是指尽量做到每一步骤评分都有迹可循,在代码实现方面强调学生的动手能力,表现为列出每一个完成项和挑战项可得的相应分数;在报告和PPT 方面强调学生的思考和表达能力,阐明相应的思路和观点即可得到对应的分数。对学生进行横向比较是指在同样的实验条件下,对同一小组成员综合实验的完成情况作对比,作为整体实验难度和指标进一步调整的依据,避免出现实验太简单没有挑战性或者是太难令学生丧失信心的情况。对学生进行纵向比较则是根据学生个人能力和努力程度对分数进行微调,学生成长环境和个人经历有很大的差异,知识和能力的积累也有所不同,恰当的鼓励和肯定能够更好地促进学生的提升。综上,实验整体结果评价方式见表3。

图4 教学手段实施方案

5 结 语

教师在授课过程中,强调以“学生为主,教师为辅”,启发引导学生完成探索和实践,进一步提高学生能力。首先,在选题方面考虑学生的兴趣和互联网中的真实场景,定为微博评论或话题的情感分析;其次,在实验内容方面考虑学生的完成度和挑战度,将综合实验拆分成一系列由易到难的小实验;然后,在实验教学方法方面,考虑培养学生的自主性和解决实际问题的能力,用提供参考资料的方式取代完整的实验指导书;最后,在实验评价方面,考虑学生的纵向和横向对比,采用实验报告、性能指标、答辩等成绩的加权平均作为最终成绩。该综合性实验以数据挖掘课程为切入点,积极发挥教师的鼓励、启发和引导作用,并且充分考虑了学生的主观能动性,与新工科背景下计算机人才的培养标准相契合,提升了学生几方面的能力:①培养学生灵活运用数据挖掘课程中所学的各种算法和模型的能力;②在启发式教学过程中提高学生对复杂的综合性问题进行拆分和逐步解决的能力;③在提升学生基于实验方案正确编写实验代码能力的同时,拓宽了学生的视野,使学生了解并在一定程度上掌握数据挖掘的各类工具;④培养学生查阅并利用参考资料的能力,在学习其他文献的分析方法中针对自己的实验作出独立思考和分析,探索并改进方案的缺陷;⑤提高学生沟通、表达以及团队协作的能力,在解决问题时做到事半功倍。

表3 实验结果评价方式

挑战性综合实验在课程的教学过程中反馈良好,整体上学生表示通过综合性实验能够逐步提升分析和解决问题的能力,所学知识能够真正与课本中的理论结合起来并运用在职业生涯中,但两极分化现象仍然存在,有的学生在迭代分析改进过程中能创新性地提出文献中没有的思路和解决方式,有的学生却因为种种原因连最低要求都不能完成。因此,在教学过程中,教师在认识到差距不能避免的同时,应该尽量为学生提供帮助,避免学生因为求助无门而导致学习困难、任务无法完成的情况。

猜你喜欢

工科数据挖掘情感
“新工科”和OBE模式下的车辆工程实践课改革
改进支持向量机在特征数据挖掘中的智能应用
新工科背景下计算机专业创新创业人才培养探究
新工科背景下项目推动式教学模式的探索
探讨人工智能与数据挖掘发展趋势
基于事故数据挖掘的AEB路口测试场景
情感
《悦读·家》开播激发爱国爱家情感共鸣
诗歌与情感的断想
台上