APP下载

基于多维多源用户特征的特殊教育资源个性化推荐服务研究

2022-12-13王新美

教育传播与技术 2022年6期
关键词:特教群组资源库

王新美

上海市电化教育馆

一、 引言

随着“互联网+”、大数据等信息技术的快速发展,信息量呈几何级数爆发式增长。互联网每天都以指数级增长的速度输出数据,面对海量资源,各类互联网用户可以获取更加丰富、便捷的信息和资源。但是,想要准确地捕捉与获取符合自身个性化需求的信息和资源,却需要不断地投入更多的时间和精力,“信息过载”“信息迷航”的问题日益突出。在教育领域,上述问题同样存在。

上海市特殊教育资源库(以下简称“特教资源库”)自2010年上线以来,收录了国内外特教发展文件、最新研究成果、教学示范视频、康复技巧演示、教辅具使用方法、精品课程资源、教育评估等丰富资源,资源数量及种类日趋丰富。为进一步发挥资源的使用效益,自2017年以来,特教资源库重点推进资源的使用交流机制研究,开展一系列的资源及应用案例征集活动,不断提高广大教师共建共享特教资源的积极性。上述做法有一定的促进作用,但随着资源的日益膨胀,以传统搜索引擎为主导的资源被动检索及推送模式很难满足用户的个性化资源需求,优质特教资源的“掩埋”效应日趋凸显,很难从根本上提升特教资源的使用效益。

因此,如何顺应用户的个性化资源需求,针对用户的个体差异,从复杂、海量的资源中搜索、定位并推荐用户所需的教育资源,并不断提升个性化推荐的准确性和智能性,是目前亟待解决的关键问题。

在此背景下,个性化推荐服务应运而生。它在一定程度上有效解决了用户的“信息迷航”困境,实现了从“人找资源”的信息被动检索模式到“资源找人”的信息主动服务的转变,弥补了搜索系统的不足[1]。本文深入研究和借鉴个性化推荐领域的应用实践,对多维多源的用户特征进行有效提取,分析特教资源与用户需求之间的内在联系,构建了特教资源的个性化推荐服务框架,为大数据和人工智能背景下开展特殊教育资源个性化推荐服务与满足用户个性化资源需求提供参考。

二、 教育资源个性化推荐服务研究现状

个性化推荐是推荐系统根据用户的特征,如兴趣、爱好、职业特点等,主动向用户推送适合其需要或其可能感兴趣的信息资源的一种推荐技术[2]。

“个性化推荐”的概念最早出现于20世纪90年代。国内关于个性化推荐的研究始于2000年。随着研究的不断深入,个性化推荐服务现在已广泛应用于电子商务、新闻传媒等领域,应用成效已十分显著。教育领域的应用研究,近几年呈上升趋势。国内基于教育资源的个性化推荐研究,一部分侧重于对用户的学习行为和个性特征进行分析,从而构建个性化推荐系统。例如,牟智佳等对学习者的个性特征进行分析,构建了学习者模型,采用混合式推荐算法用于电子书包学习系统的个性化资源推荐[3]。李浩君等通过基于MIFS的特征选择模型和学习者—学习资源二部图关联模型,同时基于深度神经网络模型,深度挖掘学习者的个性化偏好,设计了深度学习视角下的个性化学习资源推荐方法[4]。另一部分研究侧重于对个性化推荐算法的研究和优化,以缓解推荐算法中存在的数据稀疏、冷启动等问题,从而提高个性化推荐的质量和精准度。例如,蔡强等提出基于标签和协同过滤的个性化资源推荐算法,将标签作为体现用户兴趣偏好和资源特征的信息来提升推荐的准确性[5];周朴雄等提出运用BP神经网络方法来预测不同情境下的用户对资源类别的偏好,同时结合协同过滤算法来实现精准的个性化信息推荐[6]。

通过分析上述研究成果,可知教育领域的个性化推荐已经有了一定的发展,但大多集中于将各类算法和应用平台引入个性化推荐服务,缺乏对用户特征及在学习系统或资源平台内产生的行为记录信息的深入挖掘和分析,从而导致对用户的特征和兴趣研究不够,对用户的兴趣偏好和潜在需求分析不深,资源个性化推荐服务不够精准等问题。本研究将在借鉴互信息和贝叶斯网络概念的基础上,对用户特征及兴趣进行深入分析和挖掘,构建更加精准的用户模型,从而探索构建基于多维多源数据的个性化资源推荐服务框架,为大数据背景下资源的个性化推荐服务提供参考。

三、 特教资源库特征分析

(一) 特教资源库特征层级结构

用户及资源特征模型作为个性化推荐服务的重要组成部分,对于个性化服务的质量至关重要。个性化推荐服务的准确性依赖于用户及资源特征的提取,对特征提取越充分,推荐效果越好;但过量的冗余和无关特征,又会影响推荐的效率。因此,需要选择合适的特征选择策略,对含有大量数据的特征集进行预处理,降低特征维度,提高推荐服务的质量。

在一网通办、信息系统整合等工作的推进下,特教资源库现已接入上海智慧教育平台(https://www.sh.smartedu.cn),通过上海市基础教育统一身份认证实现用户管理和授权。不仅可以获取用户在特教资源库中的特征信息,也可以获取用户在其他学习系统、资源平台上的特征信息。用户特征呈现出多维性和多源性,特征数据丰富且杂乱,需要进行有效特征选择,来构建用户及资源特征模型。

用户特征从语义上讲是一种模糊的、不可计算的概念,而且用户的兴趣偏好会随着时间的推移而发生改变,因此具有很强的不确定性。而贝叶斯网络是对不确定性知识概率关系的描述,它可以发现随机变量之间潜在的内在关系,而且以图形化的形式来表述变量之间的关系,可用清晰的逻辑框架来解决不确定性问题。

贝叶斯网络虽然可对用户特征的描述实现计算性,但是它忽略了事物之间语义上的联系。将互信息引入贝叶斯网络用户建模,将随机词语之间的互信息作为贝叶斯网络条件概率计算依据的方法来构建用户模型,可有效地优化推荐服务的质量。

特教资源库底层数据库中包含用户开展资源浏览、下载、评论及用户间交流活动所产生的各类行为数据。将各类数据进行语义关联可以表征成用户的特征信息,从而为用户个性化地推荐资源。基于以上理论,本文构建了特教资源库中用户及资源的特征层级结构,如图1所示。

图1 特教资源库特征层级结构图

对特教资源库中的特征数据进行降维、归类,可分为特教资源特征库、评估测量特征库、互动交流特征库和元数据特征库四大类。其中,元数据特征库中包含用户个人信息(姓名、年龄等基础信息,学历、专业等受教育经历信息,任职单位、任教学科、任职年限等职业经历信息,特教岗位培训、在职培训等培训信息)、资源信息(标题、关键词、资源类型、所属领域、残疾类别、媒体格式等属性信息,点击量、下载数、收藏数、评分等交互信息)和用户行为信息(检索记录、访问时间、浏览时长、收藏记录、下载记录等)。同时,其他三类特征库中也包含了用户的各类行为特征。其中,特教资源特征库包含主题包交互记录、文档交互记录和视频交互记录;评估测量特征库包含评估过程记录、评估档案记录和评估工具记录;互动交流特征库包含用户好友关系、讨论交流记录和活动记录。元数据特征库与其他特征库互联互通,它负责将其他特征库中的相关信息进行汇总并基于特定的规则和算法对特征信息建立关联。

(二) 用户特征模型

在建立特教资源库特征层级结构及特征关联数据后,借鉴互信息和贝叶斯网络思想来构建个性化的用户特征模型(图2)。

图2 用户特征模型

用户特征模型依次为用户层、用户初始特征集、用户扩展特征集和推荐资源/活动集。用户初始特征集是基于历史特征记录提取的用户特征。用户扩展特征集是通过基于互信息的贝叶斯网络扩展得到的用户特征。每一个特征都是用户模型中的一个节点,每个特征节点与用户有直接或间接的关联。节点之间通过一定的条件概率关系构成贝叶斯网络,无词义相关节点间的语义关联关系,又通过互信息来表示。两种方式结合,可以对用户特征进行有效更新及潜在兴趣挖掘,汇聚成更为全面且准确的用户特征集。精准的用户特征模型是提升个性化推荐服务质量的前提保障。

四、 特教资源个性化推荐服务框架

(一) 个性化资源推荐框架

个性化资源推荐的本质是对用户个体/群体特征、资源特征进行匹配,从而求出差异最小值,进而推荐资源序列的过程。个性化资源推荐框架如图3所示。

图3 个性化资源推荐框架

传统的推荐系统往往是在已经充分获取用户历史数据及资源特征信息的前提下,主要针对用户和资源的评分或者交互数据,构建静态且独立的特征数据,设计并调试好特定的推荐模型,为其提供个性化推荐。此类模式由于特征数据稀疏,导致对用户特征的概况能力不足,且只能持续为用户推荐特定主题的资源。然而,在实际应用场景中,用户与推荐系统之间会发生持续且密切的交互行为,推荐系统的目标是在保证推荐质量的前提下,为用户推荐多样、新颖,以及符合用户潜在需求的资源。

(二) 特教资源个性化推荐服务框架

在对特教资源库用户及资源特征进行梳理和构建并充分挖掘用户特征的基础上,本文构建了特教资源的个性化推荐服务框架(图4),主要包括数据基础层、数据处理层、数据挖掘层和数据应用层。

图4 特教资源个性化推荐服务框架

数据基础层主要采集来自特教资源库、上海智慧教育平台其他子应用中的用户个人信息和交互信息。数据基础层整合、贯通整个服务框架的基础信息数据,是数据采集中枢。

数据处理层是将用户的个人信息、行为信息,资源的属性信息、交互信息等进行整合、分析、处理,形成特征集群,并通过特征配置库对不同的特征信息依据权重进行排序,获得用户及资源模型的有序特征集合。

数据挖掘层是个性化推荐服务框架的核心,主要是利用已建立的用户及资源模型,利用聚类、关联分析等算法,对用户及用户群组的特征进行聚合分析,并通过相似度计算,进行用户及资源/活动的特征匹配,通过评价函数对推荐结果进行过滤和排序,最终生成个性化推荐结果序列。推荐结果序列包括资源推荐集(文本、音视频和主题包推荐等)、活动推荐集(话题、兴趣主题、好友推荐等)和评估推荐集(评估档案、方法、工具推荐等)。

数据应用层是将推荐结果序列推送给用户,并收集和分析用户反馈。通过用户对推荐结果的打分情况及问卷调查等形式收集用户的反馈信息。推荐效果评估模块获取反馈信息后,从用户满意度、推荐准确度、覆盖率、多样性和新颖性五个维度对推荐质量进行评估。根据评估结果,完善和优化数据采集、处理流程,不断提升用户及资源特征集群的精准度。

五、 基于用户群组的特教资源个性化推荐服务流程

在特教资源个性化推荐服务的服务过程中,由于用户对资源的需求是动态变化的,特教资源库要确保个性化推荐服务的质量,需要实时更新并即时采集动态变化的各类特征数据,完成用户对特教资源需求的精准描述与分析。虽然用户个体的需求变化较大,但是用户群组的属性特征及对特教资源的需求变化幅度相对较小。因此,可依据相似用户群组的属性特征及对资源的偏好信息,针对用户群组开展特教资源个性化推荐服务,服务流程主要包括群组划分及特征生成、个性化推荐和动态更新三个阶段。具体实现流程描述如图5所示。

图5 基于用户群组的特教资源个性化推荐服务流程

第一,根据用户特征库,获取初始特征和扩展特征,构建用户模型。

第二,对用户进行聚类分析,根据用户特征,进行相似度计算,对用户进行群组划分。

第三,采用群组偏好融合策略,对群组的特征进行表述,生成用户群组特征库。

第四,根据资源特征库与群组特征库,进行用户群组及资源特征匹配,生成基于群组的结果推荐集。

第五,获取群组用户对推荐结果的反馈,评估反馈效果,根据评估结果更新特征集群的相关信息和数据。

六、 结语

个性化推荐服务给用户带来了极大的便利,在一定程度上解决了用户信息过载与快速获取个性化资源之间的矛盾。实现个性化推荐的前提和关键便是对用户特征的精准描述。本文结合贝叶斯网络和互信息思想,对特教资源库的用户和资源特征层级结构进行重构,构建了能够全面而有效地挖掘用户兴趣偏好的特征模型,并设计了特教资源库的个性化推荐服务框架和基于用户群组的个性化推荐服务流程。但就个性化推荐服务在教育资源领域的发展现状而言,仍然面临诸多挑战。如何科学、全面地描述用户及群组的相似性和差异性,如何选择合理的推荐算法以实现资源的精准推荐等,都是亟须解决的问题。因此,在后续的研究中,仍需深入分析用户及群组特征数据的有效提取和表述,在实际应用中不断完善和优化个性化推荐服务框架,为特教资源个性化推荐服务的设计和实现提供支持和参考。

猜你喜欢

特教群组资源库
“南京特教师范招待所”饭盆
一只普通的食堂饭盆与一段独特的特教历史
健身气功开放课程资源库建设研究
做好特教学校班主任工作的几点思考
贵州●石斛种质资源库
关系图特征在敏感群组挖掘中的应用研究
同样的阳光雨露——特教教师践行者
高中历史信息化教育资源库应用探索
福建基础教育教学资源库建设研究——以福建基础教育网资源库为例
基于统计模型的空间群组目标空间位置计算研究