APP下载

推荐系统专利技术综述

2019-09-10齐智超乔帅方源

信息技术时代·上旬刊 2019年3期
关键词:匹配检索

齐智超 乔帅 方源

摘要:本文介绍了推荐系统相关的重要技术及其技术发展路线,通过对推荐系统相关专利进行分析,梳理出推荐系统技术重要的发展及趋势,并结合业内重要申请人的技术演进,对推荐系统的发展历程和呈现形态进行分析,预测未来推荐系统技术的发展新趋势。

关键词:信息超载;推荐;检索;匹配

1、概述

近年来,推荐系统在商业领域的应用越来越广泛,其应用包含电子商务推荐、个性化广告推荐、新闻推荐等诸多领域,如人们经常使用的淘宝、今日头条、豆瓣影评等产品,其背后均有成熟的推荐系统作为支撑。推荐系统是一个能够为用户提供个性化服务的系统,其能够将最符合用户个性化需求的信息推荐给用户。经过了二十多年的积累和沉淀,推荐系统逐渐成为一门独立的学科在学术研究和业界应用中都取得了很多成果。

为了获取推荐系统相关的专利技术的申请情况,本文使用专利检索与服务系统,通过分类号(IPC:G06F17/30)+关键词(recommend、match)在VEN数据库(外文数据库)中进行检索,截止2019年6月6日,共检索得到相关专利文献共1827篇,其中中国国内申请量为1210篇,国外申请量为617篇。以下内容将对该1827篇专利进行分析,以获得推荐系统相关专利申请总体情况,梳理其技术发展脉络,并对主要申请人以及相关关键技术进行统计分析。

2、专利申请总体情况

随着互联网技术的广泛应用,尤其是移动互联网的发展,推荐系统逐渐成为互联网技术中研究的热点内容,从专利申请量来看,1999-2005年间并未出现明显的增长,而2006-2010年间出现了小幅度的增长,然后在2011年迎来的爆发式的增长。从技术发展的角度来看,1999-2005年属于互联网应用比较平淡的时期,大多数PC重在客户端软件的开发;而2006-2010年,则互联网技术快速更新迭代、逐渐累积大量用户的过程,此时即是推荐系统技术的萌芽时期。2007年1月9日,蘋果发布iPhone,2008年Google发布安卓操作系统,经过4-5年的技术迭代,随着技术的逐渐成熟,在2011年左右移动互联网技术已经深刻改变了人们的生产生活方式,也正是移动互联这样肥沃的土壤中,推荐系统技术得以生根发芽,并逐渐壮大。相信随着5G技术的推广和普及,万物互联的逐渐成型,推荐系统技术必将迎来新一轮爆发。

3、专利技术分析

在推荐系统的发展过程中,推荐系统经历了多种多样的变化,但总体来说,主要还是从用户模型、推荐算法、待推荐对象模型等三个方面进行改进。

3.1对用户模型的改进

用户模型主要用来存储用户兴趣数据,其体现了用户对哪些内容感兴趣,也就是说用户模型体现的是用户的具体的需求,对用户模型的改进即是解决如何更准确地获取用户兴趣这一问题的过程。

北京搜神网络技术有限责任公司申请的CN101105795A公开了一种基于网络行为的个性化推荐方法,通过分析用户的网络行为,据此向用户进行个性化的推荐。百度在线网络技术(北京)有限公司申请的CN101968802 A公开了一种基于用户浏览行为进行互联网内容推荐的方法,实现了基于用户浏览行为进行互联网内容推荐,为用户提供了更为丰富的、高相关度的信息内容,从而提高了用户的搜索浏览体验;北京字节跳动网络技术有限公司申请的CN104317959A公开了一种基于社交平台的数据挖掘方法,通过建立用户(老用户)在不同平台上的关联模型解决了现有技术中因新注册用户没有历史浏览记录,导致的无法提供有针对性的资讯的问题。

3.2 对推荐算法的改进

推荐系统中,常见的推荐算法包括基于关联规则的推荐,基于内容的推荐,协同过滤推荐和混合推荐等,其主要目的实现如何将用户的兴趣与待推荐的内容进行匹配。

3.2.1 基于关联规则的推荐

推荐系统可以通过将原本存储在原有数据库中的信息和规则库中的关联规则数据对比得到最终的推荐结果,为客户提供个性化的推荐。

杭州因豪信息科技开发有限公司申请的CN101697162A公开了一种智能化推荐点菜方法,其对所有菜品的属性进行挖掘生成关联规则集,计算每条关联规则的置信度,从关联规则集中寻找匹配的属性关联规则集,并得到菜品的推荐价值,将推荐价值进行排序,选取多个菜品作为推荐菜品并输出,能够使推荐的菜品更具科学化和合理化。

3.2.2 基于内容的推荐

基于内容的推荐是根据用户历史信息(如评分、评价、分享、和收藏过的文档)构造用户偏好文档,计算推荐项目与用户偏好文档的相似度,将最相似的项目推荐给用户。

索尼公司申请的CN102270214A公开了一种内容推荐方法,其基于存储的优选判别信息和内容特征信息,通过对于每个用户统合针对内容的评价及内容特征来产生每个用户的优选信息,向客户端发送基于内容特征信息、评价与优选信息的特征的相似度而提取的推荐内容列表,提高了推荐准确度,符合用户需求,无需考虑用户的当前环境,能在多种环境中推荐与用户的期望匹配的内容。

3.2.3协同过滤推荐

协同过滤推荐(Collaborative Filtering Recommendation)一般采用最近邻技术,利用用户的历史喜好信息计算用户之间的距离,然后利用目标用户的最近邻居用户对商品评价的加权评价值来预测目标用户对特定商品的喜好程度,系统从而根据这一喜好程度来对目标用户进行推荐。

得利在线信息技术(北京)有限公司申请的CN102236646A公开了一种对象级垂直搜索引擎个性化排序算法iRank,其实现了构建用户和本体库对象之间喜好兴趣关系,并对语义模型排序结果进行基于用户兴趣模型的个性化推荐排序,构建结构化用户之间的相似度信息,并对用户兴趣模型排序结果再进行基于用户相似度模型的个性化推荐排序。

由此可知,协同过滤是基于这样的假设的,为一用户找到他真正感兴趣的内容的好方法是首先找到与此用户有相似兴趣的其他用户,然后将他们感兴趣的内容推荐给此用户。其思想在日常生活中也是常见的。

3.2.4 混合推荐

混合推荐(Hybrid Recommendation)经常被采用,最简单的做法就是分别用基于内容的方法和协同过滤推荐方法产生一个推荐预测结果,然后用某方法混合其结果。尽管从理论上有很多种推荐混合方法,但在某一具体问题中并不见得都有效,混合推荐一个最重要原则就是通过混合后要能避免或弥补各自推荐技术的弱点,这里就不在专门针对混合推荐算法的相关专利申请进行专门的举例。

整体来看,在1999至今的20年間,出现了多种多样的对于推荐算法进行改进的专利申请,无论是基于关联规则的推荐的、基于内容的推荐的、基于协同过滤推荐或者是混合推荐,在不同的时期都有着数量可观的相关申请。分析来看,1999-2005年间,互联网的发展还处在一个比较低的层次,相关的推荐算法并没有实质性的进步,相关的推荐系统仅仅通过应用原始的算法进行相应的推荐。2005-至今,随着互联网的快速发展,互联网中产生了海量的内容,而为了得到海量数据内容中与推荐系统相关的信息如用户信息、待推荐对象信息以及用户与待推荐对象间的关联关系等内容,数据挖掘以及数据处理算法取得了长足的进步。对于推荐算法的改进,整体来说是随着数据处理能力的提高而逐渐发展的。

3.3 对推荐对象模型的改进

电子科技大学申请的CN104239512A公开了一种文本推荐方法,通过建立用户模型,预处理文本文档,提取特征向量,计算特征向量间同义词的最优匹配,根据特征向量与用户模型间的相似度,确定推荐文本。本发明的方法在传统余弦夹角算法基础上加入同义词间语义相似度的匹配因子,考虑文本同义词对相似度的影响,更精确的计算文本间、文本与用户模型间的相似程度。

清华大学申请的CN105975496A 公开了一种基于上下文感知的音乐推荐方法,基于上下文感知的音乐推荐方法,根据上下文信息与音乐特征的对应关系,得到上下文信息对应的音乐特征,根据音乐特征,获取服务器端与音乐特征匹配的音乐,并将音乐推荐至当前设备的音乐播放器进行播放。其基于上下文感知的音乐推荐方法,不依赖于个人用户,适用于普遍的个性化服务。

从其整体发展历程来看,其主要是随着特征提取相关技术的进步而进步。体现在专利申请中其改进也多是对于对象特征如何提取的改进。例如文本特征提取从普通的词频、权重来表示文本特征到利用语义特征来表示,再到利用机器学习算法对文本进行特征提取。

4、结论与建议

总体而言,推荐系统是建立人与信息之间的联系,结合如今盛行的技术来看,2005年前,互联网技术本身不具备太多内容,推荐系统发展相对比较沉寂,而2005-2010年间,随着互联网内容的不断丰富,出现了利用数据挖掘、机器学习等技术进行改进后的推荐系统,而2011年至今,人工智能技术、深度学习算法的研究的逐渐推荐,有理由相信,通过人工智能以及深度学习算法的加持,推荐系统可以更好地了解到人们真正想要的是什么。人工智能技术拥有对于数据的超强处理能力以及强大的学习能力,可以预见,人工智能技术以及深度学习算法与推荐系统的结合,必然是未来发展的新的趋势。

参考文献

[1]Resnick P,Varian H R.Recommender systems[J].Communications of the ACM,1997,40(3):56-58.

[2]Dietmar Jannach,Markus Zanker,Alexander Felfernig,Gerhard Friedrich著.推荐系统[M].北京:人民邮电出版社,2018.04.

[3]王国霞,刘贺平.个性化推荐系统综述[J].计算机工程与应用,2012,48(07):66-76.

作者简介:齐智超(1991.01-),男,河南新乡人,硕士研究生,实习研究员,大数据技术;

乔帅(1989.03-),男,河南郑州人,硕士研究生,实习研究员,人工智能技术,等同第一作者;

方源(1990.06-),男,河南安阳人,硕士研究生,实习研究员,软件测试技术。

猜你喜欢

匹配检索
CNKI检索模式结合关键词选取在检索中的应用探讨
通过实际案例谈如何利用外文库检索提高检索效率
瑞典专利数据库的检索技巧
调整检索思路,提高检索效率
英国知识产权局商标数据库信息检索
某车型正面碰撞驾驶员侧约束系统匹配研究
中职学生职业性向测评维度与就业岗位匹配研究
基于新型双频匹配电路的双频低噪声放大器设计
工程车辆柴油机与液力变矩器的功率匹配及优化分析
气质类型在档案工作中的应用