APP下载

基于灰色关联预测与信任云混合算法的方案推荐

2020-05-08耿秀丽

计算机集成制造系统 2020年4期
关键词:关联度灰色信任

耿秀丽,杨 珍

(上海理工大学 管理学院,上海 200093)

0 引言

随着市场竞争愈加激烈,迅速发展的企业日益增多,顾客对产品或服务的要求也更加多元化、个性化。由于信息不对称、专业知识欠缺等原因,顾客难以在众多企业提供的多个方案中选择适合自己的方案,方案的个性推荐成为增强企业竞争力的关键因素。针对产品方案推荐的研究较少,但商品/服务的推荐已有了一定的研究。例如,文献[1-3]利用协同过滤、隐语义模型和线性回归技术将Web服务推荐给目标用户;文献[4-5]分别采用贝叶斯网络和用户偏好方法实现对用户的商品推荐。协同过滤作为推荐技术的常用方法,被广泛应用于各类推荐系统,如图书推荐系统、电子商务和社交网络等推荐系统。而常用的协同过滤算法存在数据稀疏性、冷启动和用户偏好不一等问题,已有文献针对其中的某一问题给予了解决方案。如文献[6]为减轻稀疏性对推荐结果的影响,采用矩阵聚类降维技术,引入偏好方差找出用户最近邻并推荐;文献[7]针对冷启动问题,提出采用时间权重计算的方式约束用户对项目的偏爱程度,并利用用户—项目—属性三部图关系,为新用户推荐目标项目;文献[8]针对电子商务中推荐算法对目标用户定位不准确等问题,提出利用用户兴趣偏好性挖掘相似目标用户,准确定位并推荐。文献[6-8]中的方法考虑了3类问题中的其中一类问题,不能有效地实现产品/服务的推荐。

本文综合考虑上述文献中的推荐问题,提出了采用灰色关联与信任云结合的混合推荐算法。信任云是在云模型基础上融入了用户信任度,增加方案推荐的可信度。而实际上云模型不仅适用于方案推荐过程,在方案评价中也得到广泛的应用,如文献[9-10]都采用云模型定量化方案评价信息,通过云优化的算法对方案进行分析;文献[11]针对方案评价方法未考虑定性指标中不定因素,提出利用云模型弥补层次分析法,通过云发生器实现指标的有效量化,再对方案进行评价以及优选。综上所述,云模型在方案评价中,将信息指标量化转换为数值,可以增加方案的可行性。

针对某些用户对产品或服务的评分较少而导致的数据稀疏性问题,已有研究采用余弦、皮尔森相似度将数据聚类,并预测填充空缺数据,减轻稀疏性对推荐结果的影响。但是个性化推荐算法中,余弦、皮尔森相似度因数据量剧增难以对数据快速聚类,而灰色关联度既不受限于数据量的影响,又能考虑用户项目评分的不定因素,在不减少非近邻数据的损失的情况下,能够计算项目评分的相似性,预测空缺的评分数据,弥补稀疏性。因此,本文提出采用灰色关联度代替传统推荐算法中的相似度,用于预测方案评分数据,弥补稀疏性。

针对新用户在数据库中无记录,难以推荐合适项目的问题,即冷启动问题,文献[12]引入用户—标签以及项目—标签的加权相似度,对目标新用户相应的项目评分进行预测以及推荐;文献[13]提出运用粒来描述用户和产品,构建粒关联规则的指标,挖掘出用户和产品间的关联规则,并对新用户进行推荐;文献[14]提出采用动态潜在因素模型与用户属性相结合的方法,并随用户和推荐者间的交互关系,模型自动调整其系数并合理地推荐;文献[15]通过用户项目间的评分相似度,利用最近邻预测新用户的评分,解决冷启动问题。上述关于冷启动的解决方案,都是基于已有项目、标签、用户间相似度的改进,来预测最近邻集并给予推荐,在一定程度上可以减轻冷启动问题,但未考虑到用户主观信任的模糊性和不确定性问题。因此,本文提出将信任度引入云模型中,构建信任云,利用信任云相似度与用户特征相似度的综合值,来预测目标方案评分,减轻冷启动问题。

信任模型是为解决用户、项目间关系的信任模糊性和不确定性提出的,信任模型因应用范围的不同,构建方式有所不同。如文献[16]通过改进推荐属性的相似度,与服务推荐构建行为构成可信联盟;文献[17]通过信任模型筛选恶意评价的用户,得到信任度高的用户集以及候选服务集。由于云模型本身的不确定性和模糊性,学者们提出信任云模型,如文献[18]着重研究一维主观信任云,文献[19]提出多维信任云的模型,既能解决主观信任云的不确定性,又能提供更准确的信任数据。考虑到信任云能够解决用户主观不确性问题,本文提出建立信任云模型,得到方案推荐信任度,来处理用户主观性问题。考虑方案匹配过程中,用户兴趣不一问题,引入新旧用户兴趣特征相似度,既能减轻新用户引起的冷启动问题,又能解决兴趣相异的问题,如文献[19]利用兴趣信任度有效地解决面向新用户的冷启动问题。

综上所述,本文将方案推荐过程分为3个部分:①主要通过灰色关联相似度预测空缺的评分数据,弥补数据稀疏性;②通过建立信任云,求出用户间的信任相似度;③根据用户兴趣特征的相似度,与信任相似度加权得到综合相似度,获取最近邻集并匹配最优方案推荐给目标用户。

1 基于灰色关联预测弥补数据稀疏性

灰色关联分析是灰色系统理论的重要组成部分,主要研究系统内部因素间的关联程度[14]。灰色关联分析不同于传统的推荐方法,可以减少非近邻数据的信息损失,弥补稀疏性,提高预测精度。考虑数据稀疏性导致推荐不准确的问题,提出采用灰色关联预测空缺数据,弥补稀疏性。灰色关联分析利用少量的已知信息或者隐含信息,融入系统的不定因素,挖掘系统间各因素的特征,建立因素之间的关系模型。本文基于用户项目的协同过滤算法,利用灰色关联分析计算用户—项目间评分的关联度,得到项目间的灰色关联度,并用来预测用户对其他项目的评分。本文采用的灰色关联度计算过程如下。

将每个用户i对方案S={s1,s2,s3,…,sn}的评分rij表示为一个序列,则待估矩阵如下所示:

X0(i)={X0(1),X0(2),X0(3),…,

X0(m)},i=1,2,3,…,m。

(1)

为了计算各序列的关联度,首先将序列值进行标准化,即将每个序列值除以该序列值总和,从而得到数据标准值。

(2)

式中:X0(i)表示第i个用户所评分项目的评分均值,counti表示第i个用户已经评分的项目数量,A表示第i个用户已评分的项目编号。被比较的序列值表示如式(3)所示:

Xj(i)=(Xj(1),Xj(2),…,Xj(m))。

(3)

式中:X0(k)和Xj(k)都是表示对应向量的第k个元素的值,则两者间的灰色关联系数表示为:

ξj(k)=

(4)

(5)

本文在给用户推荐方案之前,考虑数据稀疏性对推荐结果的影响,基于已有数据采用灰色关联算法来预测并填充空缺数据。在协同过滤推荐算法中,评分矩阵R=(rij)m×n,评分项目对应的灰色关联度为:

τ=(γ1,γ2,…,γj),j=1,2,3,…,n。

(6)

根据评分项目s的近邻集合N(s),预测目标用户i对s的评分,计算公式如下所示:

pred(i,s)=X0(i)+γj×(rij-X0(i))。

(7)

2 基于云模型的方案匹配

通过灰色关联度以及预测公式对数据稀疏性的弥补,得到完整的用户方案评分数据。但在推荐方案的过程中,由于人为主观性因素等影响,比如有些用户偏好某种方案,就会将分值打高,而有些用户对某种方案有偏见,就会将分打的特别低,这样会对最终的相似性方案匹配结果,与实际推荐结果偏差较大。因此,本文综合考虑多方面的因素,比如,方案推荐的信任度,方案推荐的频率,用户兴趣度等来约束推荐结果的精度。以下是云模型相关定义,信任云的构建过程,以及与用户信任云与用户兴趣的综合方案匹配过程的描述。

2.1 云模型的相关定义

云模型是李德毅院士[20]提出的处理定性描述和定量概念间不确定性的转换模型,通过结合自然语言中的模糊性和随机性,实现定性语言与定量数值间的转换,为研究数据挖掘过程中不确定信息的处理提供了新方法。本文考虑到用户方案评分信息的主观性和模糊性,提出采用云模型实现定性定量数据的转换,云模型相关定义如下。

定义1[18]设U是一个用数值表示的定量论域,C是U上的定性概念。若定量值x∈U是定性概念C上的一次随机实现,x对C的确定度μ(x)∈[0,1],是有稳定倾向的随机数:μ:U→[0,1],∀x∈U:x→μ(x),则x在论域U上的分布称为云(Cloud),记为云C(x);每个x称为一个云滴(Drop)。

(8)

(9)

(10)

输入:表示定性概念的三个特征值(Ex,En,He);

输出:云滴Drop(x1,μ(x1)),Drop(x2,μ(x2)),…,Drop(xN,μ(xN))。

“情然而心为之择谓之虑。心虑而能为之动谓之伪。虑积焉,能习焉而后成谓之伪。”欲之满足的必然通过心活动,经由思虑而非单纯的欲的活动即为“伪”。“伪”经由实践而积累的“正利”“正义”的经验就成为了荀子所称道的“礼”。因“好利而恶害”为桀、纣所同然之性,故心的思虑活动就成为礼之制作的关键,而圣人(君子)之心的思虑又在其中处于中心地位。

步骤4带有确定度μ(xc)的xc称为数域中的一个云滴。

步骤5重复步骤1~步骤4,直到产生要求的N个云滴(xc,μ(xc))(c=1,2,3,…,N)。

论域U可以是一维或者多维的形式,云是在隶属度μ(x)的任意一次实现的随机变量,由无次序性的云滴组成,实现了定性概念在数量上的转变,反映了概念特征。云滴不是简单的模糊或随机,而是具有隶属度约束的随机变量,隶属度表示云滴能够代表定性概念的程度,云滴出现概率与云滴确定度成正比,符合人们的主观理解。而云模型的核心处理过程主要分两种,正向云发生器和逆向云发生器。本文采用正向云算法,将定性描述的整体向量C(Ex,En,He),转换为描述个体定量数值的云滴。以云(0.5,0.05,0.01)的3个特征值及n=1 000为输入值,通过正向云发生器输出云图,如图1所示。

图1中:期望Ex表示云滴在论域空间分布的期望值,即最能代表定性概念的点;熵En表示定性概念的不确定量,反映云的离散程度;超熵He是熵的熵,描述云的厚度。

2.2 方案信任云的构建

信任关系主要分为直接信任和间接信任,由主观经验可以分成若干个等级的信任度,具有模糊性和随机性。而云模型中的云可以将定性和定量之间的关系进行转换,提出采用云模型将用户方案的定量数据转换成云滴,形成信任云。下面介绍方案的信任度及信任云的相关概念。

定义3[18]信任是指对推荐者的诚信,能力以及可靠性的认可程度,表现出主观概念,具有模糊随机性。由于信任程度不同,将其划分为几个等级,即信任等级。每个信任等级可以赋予不同的实数值q(q∈[0,1]),如0代表不信任,1代表信任,q称为信任度。

定义4信任度空间是等级的集合,每个等级表示为一个信任度,将等级映射到信任空间上。信任空间上的模型可以设置为如下分段函数:

(11)

定义5信任云是用云模型将若干个定性概念转换为若干个云滴,将信任度空间为T=[0,1]表示为云的定量论域,x∈T是指定性概念上的一次定量信任评价,x是由论域上的隶属度μ(x)决定的具有稳定倾向的随机数。信任云的定性表示是由3个数字特征构成的元组C(Ex,En,He),Ex表示信任云在空间上分布的期望,En是信任云的熵,反映了信任概念的云滴的离散程度,He表示超熵,即熵的熵,由熵的随机模型性决定。

以某用户为例,与其他用户的方案信任云相似度分别为φ1,φ2,φ3,…,φs,将这些相似度的平均值作为某用户最终的相似度x,而x在f(x)中的某个区间内,该区间的信任度对应的权重可以用该区间的中间值作为权重。

2.3 基于用户兴趣和信任度的方案匹配模型

为用户推荐方案前,方案选择不仅考虑信任云推荐的相似度,还会考虑用户兴趣等原因。如果某个用户偏好某项方案,导致推荐结果与实际情况偏差太多,则推荐结果不精确。考虑到上述问题,在方案匹配前引入用户兴趣度,约束用户方案的推荐效率。用户兴趣值的获取是以用户需求、兴趣或者偏好为基础,得到评分值。因此,在用户兴趣的方案匹配之前,需要建立用户兴趣模型。对于新用户,主要通过用户的咨询情况得到兴趣度,对于旧用户,主要通过实际反馈的信息,并将其转化用户的兴趣分值。根据专家的评分,将用户兴趣相似度以及对应的权重定义如表1所示。

表1 用户兴趣度表

对于某一方案,用户A在内容上对用户B感兴趣的方案信息相似,则推断用户A对此方案也感兴趣。本文的用户兴趣特征用f={f1,f2,f3,…,fq}表示,其中fk,k=1,2,3,…,q是一种特征值,每个用户U={u1,u2,u3,…,up},其中ut表示用户,t=1,2,3,…,p,用户对特征评分用rtk表示。针对余弦相似性未考虑用户评分标准的不同,即用户偏向打高分还是低分的问题,修正的余弦相似性通过减去用户对项目的评分均值来改善余弦相似性存在的缺陷,提出采用修正的余弦相似度给予解决,对用户兴趣特征的相关性进行计算,如公式(12)所示:

(12)

sim′=(1-w)θφ+w×sim(u,v)。

(13)

式中:w表示为表1中对应的相似度权重,sim′表示信任云与用户兴趣特征的综合相似度。为了避免用户评分的主观性,本文引入了用户兴趣特征值,即将用户对方案特征的偏好程度,根据专家给的评分等级进行量化,并给予不同的权重值,用户方案匹配以及推荐的步骤:

步骤1建立用户—兴趣特征,用户—方案间的关系矩阵,针对用户评分的稀疏性,采用灰色关联度进行预测并填充空缺数据。

步骤2对用户推荐方案的方式,一方面考虑旧用户的推荐,即在新用户和旧用户之间产生信任关系,通过信任云的相似度进行方案匹配;另一方面,考虑新用户的兴趣特征相似度,找寻最近邻用户的方案。

步骤3将基于信任云的用户相似度与用户特征相似度加权求和,得到综合相似度。通过相似度进行方案匹配并排序,选择相似性大的用户对应方案给予推荐。

3 案例分析

某汽车企业想要提高销售效率,希望给用户推荐相关产品的购买方案。通过整理以往顾客购买产品历史记录信息,本文用户对象是各种企业,企业里人群种类的不同,购买产品的需求也就不一样。本文选取10个用户U={u1,u2,u3,…,u10},以及相关产品类型分为轿车(s1),SUV(s2),MPV(s3),跑车(s4),皮卡(s5),集卡(s6),微面(s7)7类;用户对产品的兴趣特征,其实是产品功能以及非功能特征,包括变速箱(f1),制动性能(f2),燃油经济性(f3),安全性(f4),轮胎性能(f5),汽车通过性(f6),售后服务(f7),动力性(f8),汽车噪音(f8)。如表2所示为已有用户对汽车的评分,表中1~6分别表示对方案的满意度,依次是非常差、差、一般、还行、好、非常好;表3是汽车特征以及对应的量化分值;表4是用户对兴趣特征的评分,其中u11表示新用户。

表2 用户对汽车的评分(填充前)

表3 汽车特征表

表4 用户的兴趣特征的评分

续表4

首先,采用灰色关联度,预测表2和表4的空缺数据,以式(4)和式(5)来计算相似度。如表2中用户u5对汽车s3的评分可以用式(4)计算相关系数,其中ρ=0.5,u2和u1的灰色关联系数ξ1=1或0.47,根据式(5)得到关联度γ1≈0.73。同理可得,u2和u3的灰色关联度γ2≈0.78,依次类推,u2与u4,u5,u6,u7,u8,u9的关联度为γ3≈0.67,γ4≈0.78,γ5≈0.67,γ6≈0.78,γ7≈0.75,γ8≈0.83,γ9≈0.78。因此,选取用户u9对产品s的评分相关度,根据式(7)得到预测的分值,pred(u2,s5)≈4.58。同理,u5对s3的预测评分,通过式(4)和(5)计算,得到u9与u5的关联度最大为0.83,预测值pred(u5,s3)≈3.85;u9对s2的预测评分,利用式(4)和(5)计算得到,u8与u9的关联度最大为0.83,预测值pred(u9,s2)≈4.81,将表2数据填充完整后的结果如表5所示。

表5 用户对汽车的评分(填充后)

表4的数据填充方式,也是采用式(4)~式(6)进行计算,得到u5和u2的灰色关联度为0.83,pred(u2,f5)≈3.46,同理,得到u6与u4的灰色关联度为0.83,pred(u4,f7)≈2.93,表3的填充后的数据如表6所示。

表6 用户的兴趣特征的评分(填充后)

其次,根据专家打分建立方案信任云,如图2所示。本文将云的方案信任云与图2中的信任云进行匹配,得出相似度φ,相似度的大小决定信任依赖度θ所属区间。为了求出与信任云的相似度,需要将表5的方案评分缩小10倍,得到表7的单位化的结果,利用云模型的正向云发生器,每个用户对应的信任云特征值C(Ex,En,He),与信任云的相似度,信任度如下表8所示。

表7 用户对汽车的评分(单位化)

表8 信任云特征值

为约束方案信任云以及用户评分的主观性,以及解决冷启动问题,即对新用户难以推荐方案的情况下,本文基于用户兴趣评分,如表6所示,即根据调查新用户的兴趣特征,与已有的旧用户兴趣特征相匹配,得到兴趣相似度,如表9所示,根据与表8的信任云相似度加权综合,得到新相似度并推荐。

表9 用户特征相似度

以新用户u11为例,采用公式(13)计算与其他用户的综合相似度,并进行匹配,其中的权重值参考表1,求得u11与用户的相似度如表10所示。

表10 新用户相似度

由表10可以看出u11和用户的综合相似度,明显与u5和u9以及u10的相似度最高,因此,将用户u5、u9和u10对应方案给予推荐。

4 结果对比分析

本文采用灰色关联度与信任云的混合算法,为企业用户推荐合适的汽车方案。首先利用灰色关联度,对稀疏的评分数据进行预测填充,弥补稀疏性;其次根据已有方案评分数据,计算用户的信任云相似度;获取用户兴趣值,计算用户兴趣特征的相似度;最后采用信任云与用户兴趣的综合相似度,匹配与新用户合适的方案并给予推荐。由于本文整体方法执行过程比较繁琐,未将其与其他推荐算法进行比较。在同等数量用户的评分数据中,采用所提方法的第2个步骤,即方案匹配算法,与其他推荐算法进行比较。其中,方案匹配算法考虑用户特征各异,与传统信任云的计算方式不同,输入用户特征相似度和信任度的加权综合值,输出方案推荐结果。本文通过比较不同算法的执行时间,来突出方案匹配算法的优势。在配置Win10系统,RAM 2 GB,Inter CORE i5,MATLAB 9.0平台下,将本文采用的方案匹配算法与基于灰色关联的协调过滤推荐方法,以及基于项目的协同过滤方案匹配推荐算法以及基于信任云的方案匹配推荐方法进行对比,结果如图3所示。

如图3可知,基于同等数量的用户对应的评分数据中,本文采用的方案匹配算法与其他推荐算法相比,方案匹配算法的执行时间最低,效率最高。基于灰色关联的推荐效率仅次于方案匹配算法,而信任云在匹配前的相似度计算比较繁琐,因此基于信任云的推荐算法执行时间较长。由此得出,上述4种算法相对比中,本文采用的方案匹配算法执行速度最快,推荐效率明显最高。

5 结束语

产品或服务都是当今制造业重点研究方向,甚至产品与服务的结合也是制造业的发展趋势。因此,要想提供好的产品或服务,就要配置出满足顾客需求的产品或服务方案,推荐给新客户,从而提高企业效益。如何准确定位用户需求,将合适的配置方案推荐给新用户,推荐方法显得尤为重要。而传统推荐方法存在的数据稀疏,冷启动等问题,造成推荐结果不准确。因此,本文提出灰色关联预测与信任云的综合算法,对海量产品数据进行挖掘并推荐方案。即通过灰色关联预测空缺数据,减轻数据稀疏性,通过信任云和用户兴趣特征的综合相似度解决冷启动以及推荐效率等问题,其主要特点如下:

(1)考虑到评分数据稀疏性以及基于余弦,皮尔森相似度的聚类会随着数据量变化影响推荐结果的精确性,提出采用灰色关联预测,计算方案评分的相似度,以填充空缺数据。相对于传统推荐算法而言,灰色关联预测减少了非近邻的信息损失,减轻稀疏性。

(2)考虑冷启动问题,本文考虑用户兴趣特征相似度和基于信任云的用户相似度,计算加权的综合相似度,进行方案匹配并推荐给新用户。

最后,通过汽车方案推荐的案例,验证了所提方法的有效性。但是本文灰色关联相似度并未进行优化,因此,下一步考虑对灰色关联度进行改进,并用于方案推荐。

猜你喜欢

关联度灰色信任
浅灰色的小猪
中国制造业产业关联度分析
中国制造业产业关联度分析
沉香挥发性成分与其抗肿瘤活性的灰色关联度分析
灰色时代
她、它的灰色时髦观
嘤嘤嘤,人与人的信任在哪里……
感觉
信任
广义区间灰数关联度模型