互联网金融理财产品混合智能推荐策略的研究
2019-09-10项慨朱倩倩张帅徐玲贺靖文张崟滢
项慨 朱倩倩 张帅 徐玲 贺靖文 张崟滢
摘 要:随着互联网与金融的相互渗透,互联网金融理财产品已逐步渗入人们的生活。本文采用基于内容推荐、基于个性化情境的协同过滤推荐构建了一个混合推荐模型,引入两次排名,从第一次排名过的TOP-N商品中,按照同类型产品收益率高低进行二次排名作为最终推荐结果。使互联网金融理财产品由被动由消费者选择转为主动出击,智能推荐,从而达到用户与互联网金融企业的双赢的局面。
关键词:互联网金融理财产品;推荐技术;智能推荐;混合推荐
一、引言
近年来,互联网金融发展迅速,根据CNNIC2018年7月发布的《第42次中国互联网络发展状况统计报告》,我国互联网理财使用率由2017年末的16.7%提升至2018年6月的21.0%,互联网理财用户增加3974万,半年增长率30.9%;用户投资理财模式正由传统金融理财产品转向互联网理财产品,但是在互联网技术迅猛发展的条件下,信息过载问题严重,用户在大量互联网理财产品中甄别和选择合适的理财产品比以往困难,容易追求热门理财产品,大量优质却冷门的理财产品无人问津。以上不仅会导致用户购买互联网理财产品的积极性降低,而且由于盲目选择而导致的收益降低甚至损失也会降低用户对互联网理财产品的信任度,互联网理财公司利润受到影响。
随着用户多样化、个性化的需求不断增加,智能推荐策略已在智慧城市、广播电视媒体、电子商务以及智慧旅游等领域得到较好的研究与应用。现阶段针对互联网金融理财产品的智能推荐技术研究领域,国内学者王芮莹提出了互联网金融理财产品多粒度推荐模型,国内学者周莹提出了基于证券理财产品用户行为分析的个性化推荐系统,但现阶段针对互联网金融理财产品的智能推荐技术研究较少。国外在互联网金融理财产品的智能推荐技术研究比较成熟,且应用于实际的过程中。
二、常用推荐算法及比较
(一)基于内容推荐
基于内容推荐(CBF),通过分析用户浏览或者购买过的商品特征,得到用户兴趣偏好模型,依据模型匹配符合条件的商品,推荐与这些商品相似的商品,通过整合分析以及完善将其推荐给用户。CBF通常使用两种方法:
1. 基于特征。将待推荐商品的相关特性用向量空间、概率、矢量权重向量或者贝叶斯模型的方法定义。用到的学习方法主要有神经网络法、决策树法以及基于矢量表示法等。
2. 基于文本分类。在大规模的文本特征即单词和短语上建立有效的分类方法,对所有的文本分类。
优势:推荐结果直观;不需要领域知识;用户偏好模型可随用户资料改变而改变;无新项目和稀疏性问题;为特殊爱好用户推荐。
劣势:存在新用户冷启问题;无法提供新颖性推荐;无法对音乐、图像、视频等非结构化项目进行推荐。
(二)协同过滤推荐
协同过滤推荐(CF),使用最近邻技术,通过分析用户的历史购买评价数据得到用户之间的相似性,从而产生目标用户的最近邻居集,并利用最近邻居用户对待推荐商品的评价预测目标用户对这一商品的需求度,向用户推荐合适商品。CF分为:
1. 基于内存的协同过滤推荐。在系统运行的过程中将用户—项目评分数据调入内存然后进行协同过滤。有基于用户和基于项目的协同过滤推荐。
2. 基于模型的协同过滤推荐。根据用户兴趣数据库,用机器学习算法得到数学模型。主要有奇异值分解、聚类算法等技术。
优势:提供新颖性推荐;不需要领域知识;个性化、自动化程度高;处理非结构化对象;随时间推移性能高。
劣势:存在稀疏性、冷启动问题;可扩展问题;用户量规模大时推荐结果耗时。
(三)基于效用的智能推荐
首先为每个用户建立效用函数,然后计算待推荐商品集和用户需求的匹配度,通过比较用户购买该商品后可能得到的效用作出推荐。
优势:考虑非产品属性,用户偏好敏感。
劣势:每位用户需要创建效用函数;静态推荐。
(四)基于知识的智能推荐
首先分析目标用户的兴趣爱好,得到用户需求,从而为用户提供推荐。目前流行的基于知识的智能推荐可分为如下三类:
1. 基于案例推理的推薦(CBR)。
2. 数据库知识发现(KDD)。
3. 基于知识推理(KR)。
优势:考虑非产品属性。劣势:知识难以获取;静态推荐。
(五)混合推荐
通过整合两种以上智能推荐技术弥补或者避免单独推荐技术的不足,以取得质量更高的推荐结果。通过简单的线性拟合或改进等措施,能给企业带来利益,用户黏性得到增加,用户对智能服务的满意度也得到提高。
三、互联网金融理财产品智能推荐
(一)用户建模与更新
1. 用户建模
(1)收集用户信息
用户隐示输入信息,包括用户打开互联网理财产品页面的频率以及浏览时间,用户是否对某一理财产品有收藏或者分享的行为,通过服务器保存的用户日志进行记录和使用。用户显示输入信息,收集用户对理财产品或关键词的搜索信息以及各种形式的调查报告。用户基本信息,包括用户的注册信息及之后填写的基本信息,且为了保证推荐算法的实时性,基本信息每隔一段时间都应该通过一种方法进行主动或者被动更新。
(2)建立用户模型
基于布尔或者加权关键词向量构建用户模型。
2. 用户模型更新
如果用户产生了新的行为,要对用户行为的合法性进行判断,根据用户行为的分类来决定是否需要采集用户的行为,然后再次构建适合用户的模型。更新不能太过频繁,但也不能隔太久才更新。
(二)推荐算法
1. 基于向量空间模型的内容推荐。首先对资源进行特征提取,然后比较内容之间的相似度,有针对的为用户推荐。经常使用的算法为K最近邻算法,通过向量空间模型计算所有项目个体的相似度,找到空间上与之最相近的K个项目。具体步骤如下:
提取特征词,并赋予不同的权重。构建项目相似度模型。生成相关度矩阵。根据相关度矩阵选取相关度最高的N个资源。
以上为传统算法,基于引导用户多样化投资、分散风险的目的,仅仅推荐多类型的理财产品还不够。当生成N个推荐结果中的同类型理财产品有多个时,应当把同类型的多个理财产品按照一定时间内的收益率细分为低、中、高三个等级(负收益率为低收益率等级),分别按比率取三个等级前M个产品作为最终的推荐结果展示给用户。
2. 基于用户的协同推荐。首先创建用户项目评分矩阵,根据评分矩阵计算用户间的相似性。然后构建邻居模型M,从邻居模型M中读取与目标用户u最为相似的k个邻居用户作为兴趣相投的邻居用户Neb(u,k)。最后为目标用户u推荐邻居用户知道并且喜欢的而目标用户u未知的N个项目。具体步骤如下:
(1)相似性度量
首先对各种符号作如下约定:Rm×n=[r1,r2,…ri…rm]为用户评分矩阵,其中ri=[ri1,ri2,…rin]。T为用户u的评分向量,表示下表中的第i行,rj代表用户v的评分向量。Tu、Tv分别表示用户u和用户v评过分的项目集合。■分别表示用户u、v对所有项目的平均打分。■表示所有用户对项目i的平均打分。用户集合为U,项目集合为I。
因此,在理财产品智能推荐算法中可以采用修正后的余弦相似度或皮尔逊相似度去度量用户相似性。
修正后的余弦相似度:
皮尔逊相似度:
(2)确定最近邻居
在得到用户与目标用户的相似性后,选择合适的相似性阀值,选取相似性大于阀值的作为邻居用户,或者选择N个相似性最大的用户作为邻居用户。
(3)产生推荐
用户对目标项目i的预测评分:
加权后用户对目标项目i的预测评分:
由于协同过滤推荐存在数据稀疏性问题,用户只对很少一部分项目有评分。需要先对项目进行处理,一般可以用聚类或者矩阵填充的方法解决。对于互联网金融理财产品的智能推荐,可以采用矩阵填充的方法,使用平均值对缺省值进行填充,将稀疏矩阵转换为密集矩阵。
3. 在基于协同过滤的基础上加入个性化情境。个性化情境分为两类:用户情境和环境情境,但本文不涉及环境情境。用户情境由用户基本信息组合,包括性别,年龄,职业,受教育程度,家庭月收入,家庭总资产净值,期望投资期限,投资态度,用n元组Cu表示,具体描述如下:
其中,性别由集合Sex表示,由2种性别构成,即男、女;年龄由集合Age表示,由6个年龄段构成,即18岁以下,18-25,26-50,51-60,61-64,65岁以上;职业由集合Occupation表示,由8大类职业构成,即政府机关,事业单位,国企,私企,金融机构,学生,退休人员,其他;受教育程度由集合Education表示,由4种受教育程度构成,即初中及以下,高中,大专或本科,硕士、博士及更高;家庭月收入由集合Income表示,由6种收入情况构成,即均待业暂未收入,2000以下,2000-6000,6000-10000,10000-20000,20000以上;家庭总资产净值由集合TotalAssets表示,由5种资产净值表示,即15万元及以下,15万元-50万元,50万元-100万元,100万元-1000万元,1000万元以上;期望投资期限由集合Term表示,由4种期望表示,即随时取出,6个月以内,6个月到一年,一年以上;投资态度由集合Attitude表示,由4种投资态度构成,即厌恶风险,保守投资,寻求资金的较高收益和成长,希望赚取高回报,能接受为期较长期间的负面波动包括本金损失。
在对情境信息进行描述之后,接下来对用户进行聚类分析,将用户群体划分成多个不同用户集合,使同一集合内的用户相似度较高(具有相似情境),不同集合间的用户相似度低(情境相差较大)。设用户集合为■,对于任意用户Ui其情境定义Ci如下:■;利用相异度矩阵来描述情境数据之间的差异,情境相异度d(Ci,Cj)的计算方式如下:■。
其中,情境由L个混合变量组成,■和■为指示函数,如果Ci或者Cj中的第v个变量的度量值缺失,那么■=0,否则■=1;如果Ci和Cj中的第v個变量的度量值相同,那么■=1,否则■=0。d(Ci,Cj)越接近1,则说明Ci和Cj相似度越大,反之,说明Ci和Cj相似度越小。根据实际情况,当d(Ci,Cj)的值在一定范围内时,认为Cj是Ci的一个相似聚落。
4. 基于个性化情境加入评分的协同推荐。即使Cj是Ci的一个相似聚落,仍需继续对同一聚落的用户进行划分。在现实生活中,用户通常会在网站上进行交互活动(评论,评分等行为),而这种交互活动会对其他用户的购买行为产生直接或间接的影响。下面阐述加入评分的算法并结合上述加入个性化情境的算法进行分析。
首先在通过上述加入个性化情境的协同推荐得到的相似聚落中建立一个用户-产品评分的关系矩阵。设用户集合为■,产品集合为■,用户-产品评分矩阵为R。评分由[0,0.1,1]三种组成,其中0表示未评,0.1表示差评,1表示好评。例如:Rij=0表示用户Ui对产品Ij未进行评价;Rij=0.1表示用户Ui对产品Ij差评,Rij=1表示用户Ui对产品Ij好评。
在Rij的基础上建立用户关系矩阵■,
M用于描述不同用户对相同产品进行评分的情况。Cpqj表示用户Up和Uq同时对产品Ij的评分情况。其中:
则设一函数■表示Up和Uq对所有产品评分相同的数量,另设一函数■表示Up和Uq共同参与评分的产品数,Cpqj表示用户Up和Uq是否同时对产品Ij进行评分。其中■,评分相异度为:■。
其中Md越接近1,表示Up和Uq对产品的评分情况越相近,表明两者对产品的喜好越相近;反之则表示两者对产品的喜好越相异。同样的,根据现实情况,Md将在一定差异范围内的用户认为是相似用户,再将Md和d(Ci,Cj)定为权重将目标用户的相似用户的喜好产品进行计算,得分前三的产品推荐给目标用户。
四、基于混合推荐的互联网理财产品智能推荐方案
(一)混合推荐技术主要组合策略
混合推荐技术的思想是将不同的推荐技术按照某种方法进行组合,以发挥各种推荐技术的优点,弥补其缺点,产生更优的推荐结果。不同组合策略的推荐效率不同,推荐结果也不同。目前常用组合策略有以下几种:
1. 加权混合法:首先采用多种推荐技术,然后分别得到对某一项目的预测评分,根据不同的权重相加,得出推荐结果。
2. 切换混合法:具体采用哪一种推荐技术取决于当时的需求和实际情况,根据应用场合不同切换不同推荐技术。
3. 流水混合法:一种推荐技术的结果输出作为另一种推荐技术的输入继续推荐。
4. 特征组合法:组合来自不同推荐数据源的特征并被一种主要推荐算法所采用。
5. 交叉混合法:几种推荐方法同时进行,产生的结果是由各种方法所得结果的混合。
6. 分级混合法:一种推荐方法使用其他推荐方法构建的模型进行推荐。
(二)互联网金融理财产品混合推荐的组合策略
基于上述几种推荐方法的比较分析,互联网金融理财产品的混合推荐适合以下两种组合策略:
1. 交叉混合法。将基于内容推荐和基于用户的协同过滤推荐产生的结果按相应比例组合在一起,如果两个算法有共同的推荐结果,应该先合并并展示共同的推荐结果,如果存在冲突,还需要提供冲突解决方案。
2. 切换混合法。在没有足够的用户评分数据或是用户购买、浏览记录时,切换至基于知识的推荐;当有足够的用户评分数据或是用户购买、浏览记录时,切换至基于内容和基于用户的协同过滤推荐的交叉混合法。当需要突然时时在线更新时,也可以切换至基于知识的推荐。
(三)互联网金融理财产品混合推荐模型
1. 用戶数据模块。如果存在较多用户信息,则收集用户状态、属性数据。用户行为数据通过行为日志提取,经过数据预处理之后,与用户状态、属性数据一起表示为用户特征。
2. 物品特征模块根据用户特征向量,分别采用基于内容、基于知识、基于用户的协同过滤技术筛选出相关物品应该具备的特征。
3. 候选物品模块。根据相关的数据表,筛选出候选物品的集合,产生初始推荐物品。并将基于内容、基于知识、基于用户的协同过滤技术筛选出的物品分别存储在独立的单元。
4. 过滤模块。将独立单元中的物品分别过滤出已推荐和未推荐过的候选物品,基于互联网理财产品的特性,如果存在较多的已推荐过的物品,应该保留少部分已推荐过的物品。
5. 排名模块。在各独立单元的候选物品中,给准确性和覆盖度附以较高的权重,新颖度和多样性附以相对较低的权重分别对已推荐和未推荐的物品进行排名。
6. 同类型产品排名模块。在各独立单元的候选物品中,如果同类型产品有多个。取第一次排名靠前的n个候选物品,按产品类型分类,然后按同类型产品的收益率排名。如果同类型产品较少,则不予排名,直接取TOP-N产品。
7. 推荐结果模块。如果用户信息量较少或者计算复杂,则切换为基于知识的推荐算法,调取基于知识的经过过滤和两次排名的产品。如果用户信息量较多或者计算相对简单,切换为基于内容和基于用户的协同推荐混合模型,采取交叉混合方法,根据对应的权重,调取基于内容的经过过滤和两次排名的i个产品,调取基于用户的协同过滤经过过滤和两次排名的j个产品。
8. 更新与反馈。如果用户对推荐的结果长时间无行为状态,则修正推荐模型。如果用户的属性信息、状态信息、行为信息发生改变,需要以合适的时间更新用户模型。
五、总结与展望
本文在对比分析以往智能推荐算法优缺点的基础上,提出了基于内容、基于用户的协同推荐、基于知识三者于一体的混合推荐,引入切换混合、交叉混合两种混合策略,能在不同情形下动态切换。避免了推荐的理财产品过于同质化,信息过载问题普遍的今天,对于欠缺理财知识的新用户,通过智能推荐可以减轻用户选择的忧虑,对于积累了一定理财知识的用户,可以快速定位合适的产品,合适的推荐能减少用户流失率而为公司带来增值效益。
但由于专业知识限制,本文在算法上还有许多缺陷和不足之处,对于理财产品的特殊性考虑也较少。未来还需要在以下方面改进:未充分考虑理财产品和普通商品的差异;
对于推荐结果的评价,除了传统的评价方法,理财产品的推荐结果评价应该能够尽量避免结构化风险;需要构建一个适合理财产品的动态推荐系统。
参考文献:
[1] 郎鹏程.基于用户协同过滤推荐技术的研究与实现[D].宁夏:宁夏大学,2017.
[2] 王芮莹.互联网金融理财产品多粒度推荐模型研究[D].重庆:重庆工商大学,2018.
[3] 汪瑜彬.基于混合协同过滤的电影推荐系统的设计与实现[D].北京:北京工业大学,2016.
[4] 张春丽,张涛.基于用户社会关系推送理财产品的研究[J].电脑知识与技术,2016,(12).
[5] 张松兰.智能推荐算法研究综述[J].长春师范大学学报,2017,(36).
[6] 周莹.基于证券理财产品用户行为分析的个性化推荐研究[D].成都,电子科技大学,2014.
[7] 朱子江,刘东,刘寿强.基于用户行为的推荐算法研究[J].软件导刊,2017,(16).