APP下载

基于个性化自适应学习的网络混合式信息推荐

2021-11-17邵孟良

计算机仿真 2021年4期
关键词:学习者个性化模型

邵孟良,张 森

(广州大学华软软件学院,广东 广州 510990)

1 引言

推荐方法是对用户喜好、浏览记录等特征进行综合分析的同时实行的个性化推荐,属于发现特定类型信息应用技术,为不同用户实时精确地提供所需信息内容,并根据反馈信息对推荐结果进行改进。信息推荐与信息检索原理相同,均是网络信息服务一部分。但传统推荐方法通常存在下述缺陷:推荐个性不明显,无法准确按照用户真实需求推荐所需信息;自动化程度水平不高,用户想要得到相关信息,需利用关键词与所属类别逐层搜索;无法长时间保存用户浏览数据;缺少对推荐工具与数据维护与管理。

为改善上述缺陷,目前相关研究人员提出如下解决方法。文献[1]提出融合用户社会地位与矩阵分解的推荐方法。利用社交网络中用户之间存在信任关系,对传统方法进行改进。通过整体网络信息与用户评分情况推导社交网络结构;采用Page Rank方法对用户在特定领域中的社会地位进行分析;在融合社会地位信息基础上引入矩阵分解推荐方法。文献[2]针对传统推荐方法忽略时间序列信息内在因素,导致推荐质量不高,提出基于循环神经网络的推荐方法。利用循环神经网络对时间序列处理的特点,提出R-RNN方法,通过两个不同类型记忆网络分别对用户与信息状态进行潜在挖掘,获取长时间历史状态累计,用户与其喜好信息积累为最后评分,结合评分结果将不同信息推荐给用户。两种传统方法均在一定程度上提高了信息推荐准确性,但存在相似用户局限性问题,无法将关注同类消息间的关联性。

论文通过个性化自适应学习方式[3]进一步研究网络混合式信息推荐。对自适应学习模块进行分析,对自适应特征挖掘,减少用户属性维数;其次将基本内容推荐方式与协同过滤算法相结合,对具有相同喜好的用户分类,达到个性化推荐目的。通过实验表明,所提方法的平均绝对误差与均方根误差都较低,满足用户个性化推荐要求。

2 基于自适应学习的个性化混合式信息特征挖掘

自适应学习模块主要分为知识学习、测试、策略决策与数据维护4部分,如图1所示。

图1 自适应学习模块示意图

自适应学习最终目标是培养自主学习能力,但针对培养自主学习能力方面,依然缺乏有效策略。个性化自适应学习促进自主学习培养,实现理解自身心理机制,影响学习动机、丰富认知策略,改善学习者对于知识主动掌握[4]。在此种模式下,确定学习起点、内容与学习策略选择称为重点环节。学习者应结合自身特点与已有基础设定学习方向,并利用最佳学习方法及工具达到学习目的。

结合认知能力、学习特点等个体特性呈现出数字化学习内容。学习者自身认知能力[5]反映出学习内容中知识基础,学习过程是在原始基础上自我充实过程。若学习诊断结果与历史记录显示当前认知能力不高,则需要加强学习内容,使难易程度与认知能力相互适应;若诊断结果相反,则为学习者提供更多扩展知识,对知识进行巩固与强化。

学习风格是学习中情感与认知行为,能够反映出学习者对某种媒体资源的喜好。如图2所示。

图2 基于学习风格的媒体资源自适应呈现

图2呈现出了不同类型学习者是学习方式偏好,结合此信息为学习者提供想要的媒体信息,满足认知习惯,最大程度激发学习潜力,能帮助学习者进行自我调节,实现学习效率提高。

针对个性化自适应学习,本文提出新的个性挖掘方法,其基本流程包括:

2)结合个性特征和学习过程中的变化,构建个性特征矢量,并利用该矢量的空间距离进行聚类处理。

需要处理数据类型主要包括:学习者基础信息、掌握知识程度、学习者性格特征、原始学习动机、学习风格、日志信息等,利用此数据建立一个属性矩阵,如下所示

(1)

矩阵中,xij代表第j个对象的第i个属性,它乘以加权系数kij描述属性重要程度。通过聚类挖掘方法,把数据分成不同类别。

3)分析学习者的日志信息、交流情况与学习进度,从中提取学习倾向与学习风格等数据[6]。

日志文件中记载学习者大量信息,是感知学习者动态信息重要方式,日志文件排列规律性较强,体现出资源请求顺序,挖掘这些顺序,获取请求先后关系。

4)行为方式与个性特征关联规则的研究:对上述两个步骤中获得向量集合做模糊关联分析,获取一定置信度下行为方式与个性特征存在关联规则。重点包括:在模糊集基础上进行关联分析,集合关联规则置信度,调整属性权重[7]。

5)个性特征获取与自适应学习方法形成:利用上述关联规则,推理模糊者行为模式,获取详细个性特征。通过个性聚类结果对不同类型学习者进行分类。根据查询规则库,使用模糊规则形式表示个性特征、建模与反思等9种学习方法存在的联系,形成自适应学习策略。过程如图3所示。

图3 自适应学习策略实现示意图

如图3所示,对已知数据挖掘方法有机结合,经过逐层挖掘后获得学习者学习方式与知识点,达到混合式信息特征挖掘目的。

3 网络混合式信息推荐

3.1 领域知识模型构建

领域知识模型是关于学习领域的知识,属于自适应学习的核心,包括课程教育、学习资源、教学方法、训练方法等内容,结构如下图所示。在建立模型前总结不同要素之间存在关联,对其属性进行分析与语义标注[8]。将问题与知识点当作搜索的关键词,通过语义搜索等技术寻找与其相关有关材料,构建问题、知识点和试题材料之间联系。

图4 领域模型结构示意图

3.2 学习者模型特征表示

1)学习风格

结合Felder学习风格表,将学习风格利用一个四元组进行表示

L=(〈F1,Y1〉,〈F2,Y2〉,〈F3,Y3〉)

(2)

式中,Fi代表风格种类,Y的取值是0或1。

学习风格与识别对象相似度的计算公式为

(3)

3.3 信息推荐的实现

3.3.1 建立用户模型

针对训练集合中的文本做分词、去除停用词等操作,利用TF-IDF构建文档有关矢量空间模型[9]。通过LDA建立主体模型,不仅能满足降维要求,能避免利用其它特征选取方式造成性能受损缺陷。

LDA可以对词语之间语义关联问题进行考虑,改善分辨能力。本文对TF-IDF进行改进,由于词语顺序不同,在文章中起到支持作用也不同。因此做出如下假设:题目中词语重要性强于内容部分,结合词语位置赋予不同权重比例,题目中的词权重放大5倍,而内容里的权重保持不变。

考虑不同因素带来的影响,将用户u浏览信息的集合记作Du={du1,du2,…,dum},设置浏览信息时间为t,当前时间为tcur,因此dui中所有特征词的权值系数为

μi=e-α(ti-tcur)

(4)

3.3.2 内容推荐结果输出

此推荐重点将学习者浏览过信息作为基础,获得信息主要内。经过分析,推荐与此内容相关信息,可以实现精确推荐[10]。详细步骤如下:

1)利用上述构建的用户主体模型,获得学习者兴趣的主题分布情况;

2)获取所有信息的主题矢量;

3)结合目标学习者的主题分布情况,在知识库中,选取和这些主题相近信息,并将学习者的兴趣分布和推荐目标进行相似度匹配[11],相似度计算公式如下

(5)

式中,Rud代表推荐过程中信息d和用户u的相似性,N为主题数量,U与D分别为学习者与信息内容的主题矢量。

3.3.3 协同过滤推荐

协同过滤算法重点分析学习者自身特性,寻找和该学习者相似其他用户。通过推荐与此学习者相近其他学习者浏览信息,实现协同过滤网络信息推荐。

本文将基于内容推荐与协同过滤相结合,实现混合式信息推荐。通过对所有用户建立单独主题模型,计算模型之间的相似程度,得到相似用户群。具体步骤如下:

1)通过LDA模型得到学习者喜好主题的分布特征,其将文本内容进行量化处理;

2)对学习者之间的余弦相似度进行计算,结果越接近1,说明两个学习者的特征越相似;

3)获取单独用户的候选推荐集合

假设N表示学习者u的相似用户个数,Lk则代表相似学习者k的浏览记录,M为所需要形成的推荐集合大小。结合计算结果选取相似度最高的前N个用户,并构建如下近邻学习者向量:(Su,1,Su,2,…,Su,n)并对其进行归一化处理,令目标学习者的临近(Wu,1,Wu,2,…,Su,n)用户向量长度为1,此时获得的向量集合为:(Wn,1,Wn,2,…,Wn,n),此向量集合中的元素表示将任意一个学习者的历史记录推荐给其他学习者u的权值。

在实际推荐过程中,上述两种方法相结合,充分显示多种推荐方法优势,在一定程度上改善使用单一方法缺陷,能获得准确推荐结果。从本质上讲混合式信息推荐属于方法调度与推荐结果权值分配的流程。

混合式信息推荐的形式主要包括加权混合、交叉混合与分级混合等[12],本文通过交叉混合推荐方式,利用两种方法的偏好不同,将这两种推荐结果进行交叉显示,获取学习者推荐结果。

4 实验结果与分析

为评估本文推荐方法性能,此次实验将与文献[1]方法、文献[2]方法进行对比。以平均绝对误差(MAE)均方根误差(RMSE)作为评价指标。

MAE代表方法产生的预测值和真实值存在的平均误差,正负不抵消,可以真实体现预测值误差的实际情况。RMSE为预测值和真实值的平方与观察次数n的平方根,该评价指标对极大或极小误差非常敏感,可以准确反映预测精度与离散程度。两个指标的定义如下

(6)

(7)

式中,rij、xij为别为预测值和真实值。

此次实验中,主要参数设置如下:λU=λZ=λV=0.01,λa=0.01,最大迭代次数为100,任意选择实验数据的10%当作测试集,90%当作训练集,向量维度选择5维与10维,在此情况下进行对比实验。实验结果如表1所示。

表1 实验结果对比表

由表1可知在不同维度下,所提方法在平均绝对误差与均方根误差上均低于其它两种对比方法。

为进一步验证所提方法的应用性能,选取相似信息资源点击率为评估指标。在信息推荐的过程中,其本质就是减少用户的不相关内容点击量,即用户的点击信息相似度越大,说明推荐结果越好,推荐内容符合用户要求。。本次实验采用文献[1]方法和文献[2]方法作为对照实验组。具体实验结果如图5。

图5 不同方法的相似信息资源点击率对比

根据图5实验数据可知,在70次实验迭代过程中,传统文献[1]方法和文献[2]方法的相似信息资源点击率偏低,均处于低于60%水平。说明传统方法下用户喜好相似信息推荐效果不理想,用户无法获取更多兴趣信息。而所提方法在实验过程中始终保持较高的相似信息点击率,最高可达80%,说明所提方法应用效果更优,能够加强用户兴趣信息的推荐。

5 结论

为解决传统推荐方法误差较大、相似信息点击率偏低问题,本文在个性化自适应学习基础上对网络混合式信息推荐进行研究。通过对自适应学习的分析,挖掘自适应特征,约减属性数据,保留重要的属性维数;构建领域知识模型,将学习者基本信息可视化;将基于内容的推荐与过滤算法相结合,实现混合式信息推荐。仿真结果证明:所提方法能大幅度提高相似信息资源点击率,降低平均绝对误差与均方根误差,大幅度提高推荐方法性能,根据用户喜好实现个性化推荐,真实体现学习者知识水平与喜好变化,对学习者的特征刻画更加准确,提高推荐质量。

猜你喜欢

学习者个性化模型
适用于BDS-3 PPP的随机模型
在线学习环境下学习者画像构建研究
自制空间站模型
坚持个性化的写作
十二星座是什么类型的学习者
情感过滤假说在对外汉语教学中的应用
非正式学习环境下基于移动终端的学习者模型研究
模型小览(二)
离散型随机变量分布列的两法则和三模型
同桌宝贝