APP下载

在线学习平台资源画像的模型构建研究

2022-08-03朱静怡安徽商贸职业技术学院信息与人工智能学院

安徽科技 2022年7期
关键词:画像标签学习者

文/朱静怡(安徽商贸职业技术学院信息与人工智能学院)

一、引言

随着计算机的快速发展,我们已经从云计算和大数据时代发展到人工智能时代。碎片化学习、移动学习和线上学习越来越流行,线上平台发展达到前所未有的高度,人们在移动学习和在线学习环境中,不仅使用线上平台中的资源,同时也创造和共享了大量的数字化资源,产生了大量的以资源为中心的行为数据。如何根据用户的需求,为用户提供精准的数字化资源服务,已经成为学者们关注的前沿和热点。随着各地在线学习平台的快速发展和应用,参加线上学习的人数逐年增多,但是线上学习流失率高、效果不佳的问题越来越突出。于是,如何为在线用户提供其当前需求最迫切的数字化资源服务,成为当前研究的重点方向。本文通过学习和借鉴前人研究的经验,并通过分析和深入挖掘线上平台资源的特征及线上用户的行为属性信息和资源结果属性等数据信息,提出了一种资源画像和用户画像构建方法,并研究了两者之间的关联,为在线用户提供个性化资源推荐,为在线平台数字化资源信息建设的研究与应用提供一种新的思路和尝试。

二、研究现状

随着信息技术的不断发展和大数据、人工智能的兴起,用户画像逐渐成为人们研究的热点,并取得了一定的研究成果。黎小林等[1]通过在线平台推送用户画像增加用户对于平台品牌的依恋感;崔春生等[2]在用户画像的基础上,引入用户的情景信息,达到高质量个性化地推荐旅游产品的目的;陈丹等[3]从知识服务、阅读推广、场景推荐、主动定制等方面构建用户画像,为用户提供个性化的智慧服务;董宁[4]通过绘制群组用户画像,提高了图书馆精准服务体系;张羽萍[5]从标签的类型出发,构建用户和资源的标签系统,从而实现画像的精准定位;余文辉等[6]通过电力大数据构建客户立体画像,实现对电力企业客户细分,提高了电能利用率及服务质量;高扬等[7]从基本属性、研究兴趣、学术影响力三个维度构建智能制造领域杰出人才用户画像,展示了该领域人才的显著特征,为人才管理部门和产业布局提供了决策支持。

通过对相关文献的梳理可以看出,目前用户画像研究主要在电子商务、营销学、图书馆学、教育学等领域,大多针对用户进行画像,对于资源画像的研究较少,因此,笔者尝试在吸收和借鉴前人经验和结果的基础上,通过抓取在线平台学习日志和线上学习资源,分析资源特征和学习者行为属性特征,提出一种构建资源画像的方法,为数字化资源建设和资源推送提供参考,为该领域的相关研究提供理论支撑。

三、构建资源画像和用户画像标签体系

1.资源画像标签体系

资源画像就是对资源信息的标签化。首先构建资源画像需要建立资源画像标准标签体系,全方位、多层次抽象出资源的基本属性。而建立资源画像标签体系,需要采集和处理数据。由于数据的存储方式不同,采集数据大致分为两种方法:一是人工手动归纳并标注资源的标签,二是使用人工智能算法进行半人工方式提取。标签体系是否完善,决定了资源画像构建是否精准。每一个标签都反映了具体资源的具体特征,且该标签具有一定的群体性。从原始数据采集、处理到生成标签,然后通过计算机对采集到的数据进行筛选和预处理,最后通过聚类算法、机器学习对资源特征进行分类。

2.资源画像标签体系的建立

(1)基于资源基本属性的分析:本文从三个维度分析资源的基本属性,分别是资源的归属学科类别,如工科、理科、文科、艺术、经济学等12 个大类;资源的呈现形式,如视频、音频及PPT、图片、文本形式等;资源的知识类型,如通过陈述性知识描述资源信息的具体事实和现象,或者通过程序性知识描述利用技能、算法等解决实际问题的方法。

(2)基于行为属性的分析:基于行为属性的分析计算,需要在大量的用户登录平台使用资料的基础上进行计算,如果平台用户较少,计算分析结果将会出现偏差,随着SPOC 平台的广泛应用,平台后台产生了大量的用户行为数据,因此,基于行为属性的资源价值分析计算就变得很有意义。分析的维度越多,准确度越高。

因此,资源画像的标签体系大致分2 个层级,分别为资源的基本属性和行为属性(表1)。

表1 资源画像的标签体系

3.在线用户画像标签体系的建立

构建在线用户画像的前提是构建用户画像标签体系,即对在线用户相关信息进行标签化,建立在线用户标准标签体系,从而立体地、全面地描述用户画像的基本内容。首先是采集和处理在线用户数据,由于在线学习用户和普通用户不同,采集数据时可以通过机器算法进行数据采集,然后基于半人工方式标注用户标签。在线用户画像构建是否精准,取决于标签指标体系是否完善。用户特征是通过具体单个标签来体现的。因此,每一个标签都要具有一定的群体性,能够体现出事物的某一个特征和属性。标签可以是数字,也可以是字符或者汉字等,从采集、处理、生成业务标签到通过机器算法对标签进行分类,都可以通过计算机来完成。

在线用户标签体系可以通过在线用户行为特征和用户需求属性进行划分。用户行为特征主要包含用户账号、评分、评论和分享等,需求属性主要包括资源创建人、资源类型、资源时长、资源评分等。

4.构建资源画像和用户画像

(1)资源画像的设计。资源画像的设计主要就是对资源标签化。本文从两个维度实现资源标签化,一个是资源本身的基本属性,另外一个是资源的行为属性。本文从这两个维度抽象资源模型构建资源画像。资源的原始特征可以通过资源画像最大化地体现出来,为个性化资源推荐提供了数据支持。如图1 所示。

图1 资源画像

(2)用户画像的设计。在线学习用户画像是对用户的形式化描述。可以通过用户的行为特征属性和用户需求特征属性两个维度对用户进行形式化描述。通过易词云软件对用户进行画像,字体越大表示该标签越重要,在标签体系中占据的地位越重要。同理,字体越小表示该标签处于非核心地位,在整个标签体系中作用较小。

5.用户画像与资源画像之间的关系

随着计算机人工智能的迅猛发展,社会化标签系统因操作简单、快捷等优点,成为越来越深受喜爱的标签推荐系统。本文采用社会化标签系统构建用户画像与资源画像之间的映射关系,以便于给用户推荐当前最需要的资源。社会化标签系统既可以推荐标签给用户,又可以生成大量含有价值的数据,从而形成了3种不同类型的集合,构成“用户—资源—标签”三维模型。在该模型中,数据之间通常遵循着F={用户、资源,标签1,标签2……标签n},n 代表向用户分配给不同资源的标签的数量。用户与资源组成一组矩阵,资源与标签组成一组矩阵,用户与标签组成一组矩阵。在具体某一组矩阵中,如果用户选择了某一个资源,则给该资源赋值1,否则对该资源赋值0,同理,类推其他矩阵。本文借助社会化标签系统模型构建资源画像与用户画像之间的关系,如图2 所示。

图2 资源画像与用户画像的关系

四、基于在线学习者的资源推荐

1.基于学习者的资源推荐

利用关联规则、聚类分析、神经网络算法等计算用户集M={行为属性,个性化需求属性}、资源集V={基本属性,行为属性}的自定义标签和标签集T={行为、需求、特征、内容}的核心标签的相似度,将自定义标签聚集到相关度最大的聚类中心的所属类中。直到用户集和资源集中的自定义标签和标签集中的核心标签的相关度均小于阈值时,停止聚类。将剩下的标签再相互进行聚类分析,并加入到标签库中,重新计算自定义标签和标准库标签的相似度,得到新的标准聚类。从而实现用户画像与资源画像之间的关联。

基于学习者的资源推荐模型就是利用用户画像和资源画像之间的关联,通过用户画像实现了对在线用户群体的分类,将具有相同需求的在线用户群体通过整合的形式划分为同一类。资源主要是各种学习平台以数字化形式呈现信息集合,包括视频、音频、文本、PPT、评论等,通过资源画像将这些资源整合起来。通过两者之间的关联实现对用户进行个性化资源推荐和群体推荐服务。

2.推荐效果

(1)实验数据。实验数据来源于笔者的智慧课堂教学平台,主要是2019 年以来的在线学生数据和资源数据。在线学生数据文件主要包括学生基本属性,如姓名、学号、专业、性别、二级学院等,以及学生行为属性,如学生观看时长、登录次数等;资源数据文件主要包括资源的ID 号、资源类型、资源热度、资源观看次数、资源评分、资源分享、学习达标度等相关信息。经过对原始数据的筛选、加工和处理,共计有数据413267 条、学生12127 名、学习资源24976 个,用户的评论数据为848812 条。然后对这些数据进行归类和统计分析。

(2)实验步骤。采用基于用户画像和资源画像的矩阵分解模型进行特征提取和优化,将资源特征、资源基本属性、资源健康度、资源热度、学习达标度等进行拼接得到资源的特征向量。然后根据资源与学习者的交互特征进行建模,最后根据模型再对学习者的学习偏好进行预测计算,将学习者最感兴趣的N 个资源推荐给学习者。

(3)评价结果。本研究通过访谈法和问卷调查形式对学习资源推荐效果进行评价。首先调查使用安徽大学智慧课堂的相关学生,大部分学生认为该模型推荐的资源是自己当前最感兴趣的资源,能够清晰地呈现学习资源的大部分特征,如资源热度、资源健康度及学习达标度等,方便了选择相关课程和资源进行学习,节约了时间。其次随机选取100 位参与智慧课堂在线学习的学生进行问卷调查,通过调查发现,该资源画像推荐模型推荐的资源能够让学生实时掌握自己的学习状态和学习行为,并及时调整个人学习资源从而达到更好的学习效果。

五、应用情景

1.为在线用户提供个性化资源推荐

传统的在线学习平台,主要关注在线用户的画像研究,对在线资源画像研究不够,很多时候推荐的在线资源并非用户需求的资源,造成在线学习者流失率高、在线学习效率低下等现象。线上学习不同于传统的线下教学模式,线上资源鱼龙混杂,诱惑较多。因此,根据资源画像和用户画像的关联,可以实时了解在线用户的学习进度和学习情况,进而实时地推荐给用户当前最需要的资源供用户学习,从而提高学习效率,减少在线用户流失率。

2.为教育管理者提供决策支持和资源建设

通过在线用户文件和在线资源文件构建用户画像和资源画像,然后对在线资源评价和达标率进行分析,整合成在线用户学习发展报告,可以为教育管理者了解学生学习情况和在线资源建设情况提供决策支持,为教师建设线上资源提供参考,进而实时调整线上授课资源和内容,同时可以为线上用户进行差异化教学和过程性评价。因此,学校可以对部分线上用户进行预警和针对性干预。

六、结语

本文研究了资源画像构建的可行性和流程,并根据资源属性和在线学习者行为构建资源推荐模型,最后对推荐模型进行验证,取得了一定的效果。以期在教育信息化2.0 时代,为在线学习者提供个性化资源推荐,为在线学习者提供更好的服务。也希望有更多的学者来研究资源画像在教育领域中的应用,以应对教育信息化带来的挑战。[本文系安徽省课程思政示范课程 “计算机应用基础”(项目编号:2020szsfkc0367)和安徽商贸职业技术学院自然科学重点项目“多源异构数据融合的网络安全态势评估研究” (项编号:2022KZZ01)的研究成果。 ]

猜你喜欢

画像标签学习者
威猛的画像
在线学习环境下学习者画像构建研究
画像
十二星座是什么类型的学习者
情感过滤假说在对外汉语教学中的应用
非正式学习环境下基于移动终端的学习者模型研究
不害怕撕掉标签的人,都活出了真正的漂亮
画像
让衣柜摆脱“杂乱无章”的标签
科学家的标签