APP下载

一种基于用户投资偏好与产品特征的P2P网贷个性化推荐算法

2017-06-01周琼曲晓威陈曦孙雨姚福宾翟睿峰

关键词:网贷聚类个性化

周琼,曲晓威,陈曦,孙雨,姚福宾,翟睿峰

(1.长春理工大学 计算机科学技术学院,长春 130022;2.长春市万易科技有限公司,长春 130000)

一种基于用户投资偏好与产品特征的P2P网贷个性化推荐算法

周琼1,曲晓威2,陈曦1,孙雨1,姚福宾1,翟睿峰1

(1.长春理工大学 计算机科学技术学院,长春 130022;2.长春市万易科技有限公司,长春 130000)

互联网金融的蓬勃发展,在将普惠金融的实惠带给投资者的同时,也因理财产品的多样化,给投资者带来了挑选适合自己的网贷产品的困扰。鉴于此,系统结合P2P网贷平台投资者的个人投资偏好和平台产品的特征,设计了一种基于用户账户持续时间、活跃度及投资偏好的P2P网贷个性化推荐算法,以节约投资者决策时间,加快平台资金筹集进度。

用户投资偏好;产品特征;P2P网贷;个性化推荐

互联网技术的日益成熟,带来了其应用领域的不断拓展,传统金融也搭互联网的快车产生了P2P网贷、第三方支付、众筹等网络金融模式,其中P2P贷在规模和交易量上都占据了突出优势。在P2P网贷快速发展的同时,互联网本身的信息过载问题也日益凸显。同时,由于P2P网贷平台与传统电子商务的消费特性不同,用户在选择产品时需要综合考虑投资收益率、风险等多方面因素,如何根据用户的投资偏好与产品特征,为其提供高质量的、个性化的推荐产品是P2P网贷平台需要解决的问题。

典型的推荐系统基于用户集合、商品集合以及用户对所购商品评价集合进行构建,推荐的目标是根据历史数据对未来的选择进行预测,辅助用户在尽可能少的时间内做出决策选择。在实际应用中,常将评价值按从高到底进行排序,把评价值高的k个商品推荐给用户。

本文结合对产品特征、用户基本特征与用户投资偏好进行分类,根据用户账户持续时间与活跃度,研究按照用户分类与投资偏好的P2P网贷个性化推荐算法。

1 推荐算法概述

推荐算法是通过历史行为,推测出未来可能的选择倾向的一种方法。目前有基于内容、关联规则、效用、协同过滤、知识、组合等多种互联网主流推荐算法,这些算法都是借助大数据相关技术对用户和项目/产品相关数据进行深入分析,挖掘用户行为模式和喜好,进而预测其未来的可能选择,为其提供个性化的推荐。个性化推荐算法通常包括学习和使用两个阶段,在学习过程中对原始数据进行挖掘分析并建立相应算法推荐模型,该模型可用于使用阶段行为预测,为用户提供个性化推荐。

2 产品分类

选取产品的"类型"、"年华收益率"、"期限"、"起投金额"等结构化信息进行特征提取,采用K均值聚类(K-Means Clustering)方法来对产品进行分类。

K均值聚类算法分类过程如下:

(1)从产品数据样本集中选取K(K=8,参照目前人工分类结果设定)个数据对象,并将这K个对象初始化为簇中心;

(2)计算剩下的样本到K个簇中心的欧式距离(见公式1),将样本划分到距离最小的簇;

(3)在聚类结果基础上,重新计算每个簇的中心;

(4)将中心以外的元素重新聚类;

(5)重复执行2-4,直至聚类稳定。

3 用户特征选取

将用户特征分为两类:个人基本信息和用户投资偏好。本算法选取的基本信息包括身份特征、工作特征、风险承受能力、平台登陆情况等注册时填报的信息和实时获取的动态信息,投资偏好信息包括投资产品特性、投资周期、参与活动情况等历史交易信息。个人基本信息用于对用户进行分类,投资偏好信息用于为老用户和活跃度较高的用户生产产品排序进行推荐。

4 用户投资兴趣模型构建

用户模型也称为用户画像,用户投资兴趣模型是在用户特征数据基础上进行构建的。

分析用户的投资偏好主要通过动态更新用户的投资日志记录获取,用户兴趣模型创建受限于日志收集时间与投资交易次数,越是交易次数多的活跃用户,推荐成功率越高;对于新用户或者投资次数较少的用户,按用户分类进行产品推荐。

分析用户投资日志记录,按N类产品投资次数大小进行排序,得到用户投资兴趣模型。

5 产生推荐

新产品上线,该类产品在用户投资兴趣模型中排序在前3,则将该产品推荐给用户;如产品投资所剩时间小于24小时,则向用户投资兴趣模型中排序在前5的用户进行推荐。

6 测试结果与分析

本文从吉林省某互联网金融平台2016年5-10月半年的数据中随机抽取了1300个产品与5000个用户的数据进行了算法推荐效果验证测试,产品采用K均值聚类方法进行分类,经过6次迭代得到了稳定的分类结果,迭代过程与结果如图1所示。

图1 产品聚类分类过程与结果

推荐产品与客服中心的人工推荐产品用户最终投资情况进行了对比分析,如表1所示。

从表1可以看出,网络推荐范围比线下推荐范围大,推荐成功率低,目前数值达70%以上即可满足算法要求,这一数值可以根据平台的要求通过调整对应参数阈值得到提高。

7 结论

本文提出了一种基于用户投资偏好与项目特征的互联网金融推荐算法。首先采用K均值聚类算法对产品进行分类,然后根据用户的投资偏好,对其投资产品类型进行排序,按照特定规则为其推荐对应产品。该算法推荐结果与平台线下推荐结果进行了成功率对比,自动推荐成功率略低于线下推荐成功率,在下一步研究中,将分析线下成功率高的因素,整理后结合到网络自动推荐算法中,增加算法的适用性。

表1 个性化推荐算法与人工推荐算法成功率对比

[1]赵凌云.面向服务的消费者行为分析及推荐模型研究[D].济南:山东师范大学,2014.

[2]刑春晓,高凤荣,战思南,等.适应用户兴趣变化的协同过滤推荐算法[J].计算机研究与发展,2007,44(2):296-301.

[3]张雨,张霞,丛枫,等.基于P2P网络的协同过滤推荐算法的研究与实现[J].小型微型计算机系统,2006,27(3):417-421.

[4]Bell R M,Koren Y.Improved neighborhood—based col⁃laborative filtering[C].KDD Cup’07,San Jose,Califor⁃nia,USA,August 12,2007:7-14.

[5]Adomavicius G,Tuzhilin A.Context-aware recom⁃mender systems[M].Recommender Systems Hand⁃book,US:Springer,2011:217-256.

[6]赵一瀚.基于用户行为的电子商务推荐算法研究[D].长春:吉林大学,2016.

A Kind of Personalized Recommendations Algorithm of P2P Lending According to the Customer Invest Hobby and Product Characteristic

ZHOU Qiong1,QU Xiaowei2,CHEN Xi1,SUN Yu1,YAO Fubin1,ZHAI Ruifeng1
(1.School of Computer Science and Technology,Changchun University of Science and Technolugy,Changchun 130022;2.Engineering Research Cente of Changchun Why-e Science and Technolugy Co.,Ltd.,Changchun 130000)

The booming development of Internet finance, brought the benefit of inclusive finance to investors, at the same time,also because of finance mangaing product of diversification,brought investor to choose the harassment of suiting own net loan product.Owing to this,this recommend system combines personal investment hobby of the P2 P net loan platform investor and the characteristic of the platform product and designs a kind of recommendation calculate way to lend totally winning of the platform by carrying out investor and net.

customer invest hobby;product characteristic;P2P lending;personalized recommendation

TP391

A

1672-9870(2017)02-0132-03

2017-01-14

2017吉林省科技计划重大科技成果转化项目

周琼(1993-),男,硕士研究生,E-mail:15755886S3@qq.com

猜你喜欢

网贷聚类个性化
坚持个性化的写作
基于K-means聚类的车-地无线通信场强研究
P2P网贷中的消费者权益保护
新闻的个性化写作
网贷平台未来亟需转型
网贷十年:迎来“去伪存真” 时代
基于高斯混合聚类的阵列干涉SAR三维成像
上汽大通:C2B个性化定制未来
基于Spark平台的K-means聚类算法改进及并行化实现
基于改进的遗传算法的模糊聚类算法