浅谈评论信息挖掘在在线教育领域的缺失*
2020-11-29桂安然
桂安然,赵 晋
(1.同济大学 经济与管理学院,上海201800;2.同济大学 职业技术教育学院,上海200092)
随着5G 时代的到来,许多平台网站都累积了大量的数据,在线教育平台也不例外。但同时,在线教育平台也面临着一个问题,即只是“教育数据量大”,而不知道如何对收集到的这些数据进行处理、利用,从而获得“教育大数据”。在学术界的研究中也存在着同样的问题,大数据浪潮之下学术界对于在线评价的信息挖掘主要集中在电商购物领域,而非在线教育。比如在线课程的评论就是一个很好的例子,之前的学习者在学习过这些课程后,会产生大量和课程相关的评论信息,潜在的学习者通常会花大量的时间来阅读在线评论,辅助自己制订课程选择决策。
然而,在线教育平台的运营者却未对在线课程评论的价值产生足够的重视,未对可能随意撰写的评论进行回应或者删除,这些都严重地干扰了后来学习者甄别信息,从而导致在线教育平台在一定程度上会失去该学习者或者降低学习者的使用黏度。
对于评论信息在在线教育领域的利用主要可以从以下几个方面实现:在线学习者初步选定自己要进行在线课程学习的平台,比如中国境内的“网易云课堂”或海外学习网站“可汗学院”“Coursera”等;学习者在众多在线课程中初步选择五六门同质化较高的课程;借助网络爬虫技术获取这些在线课程的真实课后评论,所谓真实课后评论,就是人工去除一些与课程明显无关的灌水评论、明显能识别出是在线教育提供者以红包或者减价等方式诱导在线学习者写下的非真实评论,此后再使用强规则关联算法、情感分析等自然语言处理方法对在线课程评论进行分析;建立综合评价模型对这五六门同质化较高的课程进行一个全面的评价,最终选择出适合学习者需求的课程。
值得注意的是,整个评论信息挖掘过程都是动态的,并不仅仅只是适用于某一次在线教育课程的描述或评价。每进行一次在线教育评论的信息挖掘,系统都可以记住本次信息挖掘的结果,并根据学习者接受课程选择之后的真实学习体验之后的反馈进行信息挖掘的修正,以使信息挖掘的准确度更高、个性化程度更深。
1 在线教育评论的重要性
伟大教育家孔子曾言“因材施教”,对在线教育评论的研究有助于实现大数据背景下的精准个性化学习路径挖掘研究。在线教育课程的评论中包含了十分丰富的课程相关信息,比如教授某门英语课程的教师发音是否标准、某门课程的难度设置是否适合目标学习者等,借助自然语言处理技术都可以对课程进行精准的数学化描述,再结合学习者自身对于课程的期待、侧重点为学习者制订一个独一无二的学习方案。
同时,国务院所发布的《促进大数据发展行动纲要》中也明确提出要“探索发挥大数据对变革教育方式、促进教育公平、提升教育质量的支撑作用”,在学习者常用的在线学习平台上都累积了大量的评论数据,只有将这些评论利用起来,才能真正地发挥大数据对教育方式变革的重要作用,发挥出大数据在教育管理和学习空间的重要作用[1]。
大量关于在线评论的文献通过实证研究表明,在线商品的评论信息被消费者作为制订商品购买决策的重要参考,而在线学习资源作为一种特殊的商品也无一例外。如何实现教育公平是教育改革领域长期以来探讨的重要话题,20 年以前,让一个四川省凉山州大山里的学生接受北京小学生所学习的内容一般是不可能实现的,而现在通过在网上观看许多骨干教师分享在MOOC 平台等上传的课程,教育公平的实现也有了更多可能。而学习者如何才能从大量的在线课程中甄别出教学质量高、课程完整、针对性较强的课程,往往需要借助阅读其他学习者留下的评论进行判断。
2 在线评论在其他领域的应用
目前对于在线评论的研究主要集中在手机购买推荐、物流服务影响因素分析等领域[2-3]。针对电商网购平台的许多售货者会以发放红包,优惠价格等方式诱导消费者在购买物品后写下“非真实好评”的情况,演克武等人[4]以酒店在线预订平台作为研究对象,从网站的监管是否得力、制定的酒店评价标准是否全面且合理、评论发表者的个人特性三个方面进行研究,为打击不良网络匿名评论、虚假评论提出相应的对策,从而提高线上销售的可靠性。彭世豪[5]则将对于在线评论的挖掘拓展到了图书编辑选材领域,主要是利用统计学上常用的K-means 聚类方法来对在线售卖图书的评论进行挖掘,构建出了一个文学类图书特征自定义词库,供编辑参考。王少兵等人[6]在对旅游网站的景点评论进行情感分析时创新性地结合了领域本体构建技术,为游客的出游制定个性化的推荐策略。
这些研究都对本文研究在线课程的评论有着重要启示作用。以携程网、蚂蜂窝等旅游网站的相关评论为例,首先对于提供的旅游方案而言,它和在线学习课程都属于非实体商品,所售出的东西不仅与商品本身特性有关,和历史评价者等因素也有关系;其次教育的本质是集体的事情,即使是要为学生提供个性化的学习方案,也应该在共性中找不同,集体学习有利于促进个体的相互学习。而这些旅行出游方案也巧妙地将先前写下评论的群体智慧融入到了个人的偏好之中。
在线课程的评论所包含的信息可以为后续学习者的学习提供决策参考,越来越多的科技企业、人工智能巨头等也开始逐渐在智慧教育领域发力,但可以看到目前仍没有商用的大型系统对在线学习课程的评论进行分析,构造出一个基于在线学习课程评论的描述模型,从而帮助在线学习者在有限的学习时间里提高自己的学习效率,倒逼在线教育平台优化服务、提高管理效率。
3 在线评论有用性的相关研究
在线评论一直被视作“网络口碑”,因为其“一传十、十传百”的传播效率受到了广泛的关注。一方面,消费者无论是在网络上购买服务时还是购买产品时,都希望寻找到已经获得此种服务或者产品的用户的意见和真实购物分享;另一方面,传统口碑所具备的较大影响力,在网络空间中也依旧有所体现[7]。周燕等人[8]发现,在线评论的存在形式是决定其有用性的一个非常关键的因素。常见的评论形式有文字文本,字数从几个字到三十多个字不等;消费者可以通过点亮不同维度的星星颗数来表明自己对当前产品的态度,通常星星数越多代表满意程度越高。
随着国家对教育信息化工作的不断推进,在线教育受到不同领域的关注也越来越多。2013 年是中国在线教育的元年,从业界逐渐形成共同认知以来,大量的资本注入、技术的涌入、在线教育从业者的加入、赛道的不断细分共同推动着在线教育取得巨大发展。比如2017 年中国融资金额榜首是专注于在线幼儿教育的VIPKID 英语。但是当前的在线教育仍然是较为简单的模式,更多是将线下课堂所教授的线下课程原封不动地搬运到了网络之上,这些课程没有根据在线教育学习者的需求和在线教育的特点进行精心的设计和内容开发,也没有对学习者的意见给予足够的重视,对在线课程评论这一重要反馈缺少必要的关注,也就因此缺少了一个根据学习者的个性化需求推荐课程、提高学习者的学习效率、从而倒逼在线教育不断提高自己所提供课程的质量、壮大企业的发展。而学术上,若能将评论信息挖掘的实证研究拓宽到在线教育领域,必定也能推动着评论信息挖掘技术不断完善,不管是社会价值还是教育意义层面,研究评论信息挖掘在在线教育领域的运用都是势在必行的。