个性化推荐算法研究综述
2020-07-08刘子赫
刘子赫
摘 要:随着大数据技术的发展,推荐算法为人们享受网络便利提供了很多帮助。随着推荐算法的不断进步,个性化推荐算法逐渐受到了用户的青睐。本文介绍了个性化基本算法的其中三种:基于内容的推荐算法、构建知识网络、基于社交应用的个性化推荐。同时介绍了个性化推荐算法与其他技术的联系、运作流程和应用等,从实际出发,以解决实际问题为目的,阐述应用具体形式。此外,本文也阐述了亟待解决的难点和问题。
关键词:推荐算法;个性化;知识网络
中图分类号:TP391.3 文献标识码:A 文章编号:1671-2064(2020)06-0039-02
0引言
随着数据体量过载时代的到来,面对信息过载问题,如何在短时间得到具有针对性的数据已经是现代人主要面临的问题。本文介绍了个性化推荐基本算法和未来主要应用和应用形式、阶段优势和长远发展优势,结合生活实际和现有技术提出下一阶段发展趋势和具体应用,也针对数据使用者的角色进行了分析。
1个性化推荐算法介绍
1.1 基于内容的推荐算法
此算法是个性化推荐中最为重要的一种思想,简单直接,通过分析用户的历史行为记录和相关兴趣记录(如用户自身填写的兴趣),形成用户的兴趣偏好向量,再对已有的项目进行分类,分析项目的属性特征,提取出项目属性向量,通过计算用户兴趣偏好向量与项目自身向量进行相似度计算,得出用户对于此项目的接受可能性大小或者top-N推荐。
此算法简单直观,对于单个属性比较有效准确,个性化强不受任何干扰。但是缺点也比较明显,项目、用戶冷处理冷启动,复杂项目的属性提取和权重分配,数据过于稀疏无法处理计算[1]。
1.2 构建知识网络
利用现代大数据的关联性和人工构建的知识网络可以进行相关知识的推荐,利用这一方法收集用户的直接需求和可能出现的相关需求,这也是个性化推荐的重要组成部分和未来的发展趋势。比如在自学技能的领域,相关的知识点需要利用知识结构,既可以从问题入手,向四周延伸,学习相关的技能点和关键要素,还可以从已知点出发,进行更深层次的学习,在推荐的过程中,根据相关联的内容进行学习,有助于系统掌握整个知识框架。
此算法关联性强、推荐知识相近、接受程度高,有助于用户拓展相关兴趣。现阶段制约其发展的主要问题有:知识网络的构建、构建结构、优先推荐权重、范围有一定限制。尽管现阶段还有不足,未来一定可以引入AI,智能连接相关知识,不再需要人工特意维护和手动架构,发展前景比较广大[2]。
1.3 基于社交应用的个性化推荐
就目前来讲,手机中必不可缺的是相关的社交和娱乐app,相较于电脑,手机的及时性、快速性和短时性与pc端比较更适合个性化推荐算法应用,而且受众面更广有助于丰富个性推荐算法。在这里的社交app不仅仅是微信、QQ等聊天的app,还有支付宝等支付app,一些短视频网站等,因为这些都是有比较明显的用户历史记录,所以比较好挖掘用户行为习惯,用户特征比较明显,易于进行个性推荐,提高推荐命中率。用户的关注人、关注事件、搜索记录、使用时间、关注类型、共同好友、发布动态、购买相关物品等记录,全方位综合分析用户行为习惯,可以大体猜测用户的职业兴趣等综合信息,结合知识框架,得到入手点和适合的推荐算法,提高准确率[3]。同样,结合共同的兴趣特点,对于一些行为特征相近的用户可以计算出相似的推荐内容,节省一定成本。还可以分析用户所关注的事物的属性向用户统一推荐。此算法优缺点比较突出,准确率高,全面、普及率高、维护成本低,但综合性强,算法不易统一,容易涉及到用户隐私等法律问题等。
2个性化推荐算法联系
2.1 与AI的联系——相辅相成
对于AI来说,一个学习型的算法是非常重要的,就目前而言,个人用AI主要是被动接受并加以学习模仿,贴和日常的用户的个人习惯,对于主动出击进行推荐的能力还不够强,或者说无法满足需求,无法达到替代一部分人工的作用,所以对于AI,个性化推荐的算法更加有助于他的发展。而对于个性化算法来说,他比AI的收集范围要广,利用知识的联系性,不仅仅应用搜索引擎,在搜索引擎中寻找符合用需要的内容,依据用户的爱好和行为喜欢等等,个性化推荐各类内容,而引入AI可以更贴和用户习惯,在合适的时间,以合适的方式推荐给用户并且让用户自行选择,再通过用户所选的内容,进行学习,决定下一次的推荐方式并修改个性化推荐算法,达到个性化效果。中短期来说个性化算法无法被AI替代,同时也可以作为AI发展的素材。也可以将AI引入个性化算法,将所计算出的数据结合用户的选择得要结论,使AI进行学习,相辅相成,或者在个性化推荐算法的平台的UI引入AI,作为学习模式,使用户更容易接受。长期来说,既可以独立存在,也可以融合,这对于两者有着很高的要求。
2.2 与大数据的运用
尽管是个性化推荐算法,但是个体离不开整体,大数据的应用对于个性化推荐算法还是很必要的。当用户的行为习惯大致相同,可以从数据库中提取类似计算的结果,减少计算时间成本;收集普遍性和增长趋势规律,掌握需求走向,提供给其他供应商,从而对用户提高针对性,减少成本[4]。
3 个性化推荐算法流程
本章将以半开源多样化的数据处理平台为例,介绍个性化推荐算法的流程。
3.1 概念介绍
通过半开源的数据分析处理平台,用户可以自主选择数据处理方式和种类,即可引用与一般出具处理如简单函数计算,也可以用于互联网搜索,用户可以操作算法,自主选择算法。而对于用户来说如何录入需求就是问题,这就需要一个平台,可以是网站或者是手机app,在界面中用户选取数据对象、数据类型、要求、范围、偏好等要求,经过个性化推荐算法得出相关结论。
3.2 数据类型
个性化算法的最大优势在于它可以推荐各类数据,不仅仅应用搜索引擎简单的关键字和标签等简单搜索方式,运用个性化算法中的知识结构,从各类网站入手,多种渠道多种数据形式,依靠知识网络加强对于数据联系性的考察,以知识结构为起点搜索多种数据格式如:视频、文字、表格、甚至社交平台可以得到的留言帖子等等,全方位满足用户需求。此外,多种数据形式对于知识结构和数据关联性筛选的算法有着极高的要求,这是急需解决的问题。
3.3 算法流程介绍
首先收集用户需求,如:价格、问题、意见、学习内容。确定搜索范围:如:相关网站、百度经验、视频网站、相关论坛、贴吧等。调查对应目标主体的相关数据要求并需要用户进行进一步选择,具体步骤如下:
(1)寻找主要相关联数据;
(2)根据用户行为习惯知识关联性主动过滤;
(3)选取关联性最强,重复检索次数最多,较权威的数据;
(4)AI过滤;
(5)整理数据,分类;
(6)用户主观选择。
3.4应用形式
该平台既可以采取会员制,也可以采用一次性购买制度,平台结合数据流通形式定期更新和完善提供算法,提供计算的服务器。
4 个性化推荐算法应用
4.1数据筛选推荐
现在用Python等软件进行智能检索已经是提高效率的好方法,但是在一些情况下,对于一般人来说稍微复杂的数据处理使用Python的及時性不够高,同时学习Python并且熟练应用的过程也需要时间,在急需数据的情况和未接触过Python的人可以使用这个平台,圈定范围、大小、参数、类型等并导入数据在平台内独立运算,再根据用户自己的限制进行过滤,算出所需要的数据。总体来说就是Python的编程模板的整合。
此外,个性推荐可以用于商业伙伴的选择和自身的内部检查,有点类似于现在的天眼查,引入了个性推荐和用户自身加以编辑限制的算法,使结果更符合公司需要。
4.2 学习内容推荐
技术的掌握已经成为各大公司职位的挑选依据之一,如:经济领域的员工需要一定简单Python基础和运用技能,互联网企业需要员工会运用PS、PR、AE等软件。
现在,我们百度相关问题,基本上都会有教程,但是这些教程终究只针对一个问题,无法系统的学习;而只理论学习不操作实操中会遇到更多的问题。这时也可以运用个性化算法推荐,从这个问题作为出发点,搜索各大论坛和视频网站,整合相关问题,在解决对应问题时,向外延伸,推荐其他问题解决方案,相关系统学习视频,整合论坛相关留言帖子,从中学习未涉及的问题和疑难杂症,综合得出当前问题的解决方法、相关问题、可能出现的情况、疑难杂症、相关推荐学习资料等。
4.3 网购推荐
在网购普及的今天,个性化算法已经可以帮助我们节省大量的挑选时间。以价格为例,在双十一狂欢的时候,用户往往会因为价格的变动,会货比三家,人工进行比较计算。在网站层面,对于价格网站往往不会将真实价格呈现出来,需要第三方的介入,运用爬虫获取价格走势,收集优惠程度价格,再根据消费者特定需求,比如:平台、产地、价格区间、发货和物流速度、商家信誉等,综合以上的需求,得出结论。再比如电脑的选择,既可以选择厂家已经批量生产的一体机,也可以采用组装好的主机+显示器的组合,或者是自己独立组装,自行购买CPU、硬盘、显卡、声卡等硬件设备,结合用户输入的需求(如:游戏用、办公用、剪辑等专业用)推荐一定组合的硬件配置。结合用户所选的硬件,推荐连接线、主机箱、音响、显示器等其他核心设备。在个性算法计算的同时引入的AI结合用户习惯职业推荐固定线、特色键鼠、支架、收纳架等非必须物品。综上,个性算法节省了用户学习了解相关物品的专业知识、减少人工组合时间,同时减少支出,增加体验感。
4.4广告投放
个性化推荐算法不仅仅个人对于数据的搜索,同样的也可以反向用于被推荐,传统广告的“命中率”已经不适合年轻人。既然用户选择了最适合自己的数据,这些都可以被提供个性推荐算法的平台所知,广告的投放变得越发有针对性,不只是简单的TAG推荐和普通的贴片广告[5]。
5结语
本文对现阶段比较适合个性化推荐的基本算法进行了介绍,对其运作流程进一步阐述,随着数据的急速增长,越发完善的算法和用户个性的突出,个性化推荐算法的优势进一步体现出来,结合时下热门AI和大数据的等相关产业,可见个性化推荐算法的发展趋势十分明朗,一定可以在未来为更多的用户提供更精确的个性化服务。但在快速发展中,也未可避免的涉及到过度收集用户隐私,信息泄露,过度干扰,信息误判等诸多问题。
参考文献
[1] 张志威.个性化推荐算法研究综述[J].信息与电脑,2018(17):27-29.
[2] 周颖芮,孙锐,袁圆.个性化推荐研究热点及学术群探析——基于1990—2017年数据统计及可视化研究[J].科技与经济,2019,32(3):1-5.
[3] 陈豪,王泽珺.个性化推荐算法综述[J].企业科技与发展,2019(2):64-65.
[4] 代丽,樊粤湘.个性化推荐系统综述[J].计算机时代,2019(6):9-11+15.
[5] 李珊.个性化推荐系统研究综述[J].科技致富向导,2014(8):157.