“随游而安”智能推荐系统的研究
2017-08-22程彩霞段雪李晓倩
程彩霞+段雪+李晓倩
摘 要 随着互联网科技的迅速发展,旅游住宿信息不断增多,呈指数形式上升。目前,旅游住宿资源信息量大,内容纷杂,使得人们很难从中挑选满足其需求的信息,影响了游客的旅游体验。随着智能化的进一步应用,旅游住宿也在不断地朝智能化方向发展,在对比“游客的需求”和“互联网提供的旅游信息”后,考虑到游客的实际住房需求和现实情况,简要分析研究“随游而安”智能推荐系统。
关键词 智能推荐系统;旅游住宿;数据挖掘
中图分类号 TP3 文献标识码 A 文章编号 1674-6708(2017)191-0044-02
随着“互联网+”的兴起,越来越多的服务业及其辅助业务通过互联网进入电子商务行业,他们的进入使得互联网信息不断增长,信息的暴增为用户提供更多样化服务的同时,也给他们带来了困扰,无法在短时间内筛选出有价值的信息。这为智能推荐系统的发展提供了机遇。智能推荐系统可以抓取分析用户的需求,为他们推送个性化的信息,用一种实用并且友好的方式解决客户困扰,减少其在信息的搜集和筛选上花费的时间。
智能推荐系统为:通过搜索以及分析客户的需求及爱好,为其推荐符合其需求爱好的个性化信息,将处理后的数据利用互联网分享给客户,并提出建议帮助客户解决怎么搜索信息,怎么进行删选等问题的系统。在处理过程中,系统会模拟客户在整个互联网中进行搜集以及处理信息。因为其推荐的个性化,研究人员也将智能推荐系统成为个性化推薦系统[1]。
1 “随游而安”智能推荐系统
“随游而安”给用户提供一个平台,在这个平台中,游客可以发布自己需求,如:地点、住宿条件、愿意接受的价格范围等来选择自己的住宿地点;从游客角度来讲,打破了原来被动接受商家制定的价格的局面,同时有了更多及更便宜的选择。我们的第二个用户群以能提供住宿的景点周围居民为主,在游客发布求房信息的同时,当地居民的房子恰好空出来,也许家里孩子上学有一间卧室空出来,也许只有一个空沙发。这时供方与求方就需要一个交流的平台,“随遇而安”提供这样一个平台更方便供方和求方的交流。
在目前旅游行业借助各种现代化信息技术基础上,“随游而安”智能住宿推荐系统不断添加各类各样的旅游元素,并且将智能推荐定位核心,通过详细科学的整合、分析网络上大量的旅游资源信息,不断丰富系统服务功能,从而为大家提供各式各样的旅游需求和体验,进一步增加旅游业的新颖性和经济价值。
2 数据挖掘
“随游而安”智能住宿推荐系统在整个运行过程中,并不需要消费者提供自己精确的消费需求。通过用户已有的历史行为针对用户兴趣建模,从而让信息呈现对它感兴趣的用户面前,同时帮助新的用户寻找发现对其有价值的信息,最终实现信息生产者和消费者二者之间的双赢。
数据挖掘利用分类技术,在网上找到潜在客户,确定目标客户,对客户进行细分,并动态的向客户展示产品,引导客户进在合适的时间进行合适的产品消费,为客户提供个性化服务。利用数据挖掘不仅能够很好的预测趋势发展,还能检测误差和描述概念,从整个数据库查找数据,这些数据就能够很好的进行预测。
2.1 显示反馈和隐式反馈
将系统建立在强大的数据基础上,是实现推荐信息和用户需求高度贴合的基础,在智能推荐系统中,用户的一般行为称为显式反馈和隐式反馈。显式反馈能够体现用户明确表示对某一产品内容的喜好,而隐式反馈则不能够明确的反应用户的喜好[2]。从正负反馈来看,前者都有,后者只有正反馈。在用户登录浏览“随游而安”后,记录用户点击、浏览、停留、跳转、关闭等隐式反馈数据。后期,显式反馈数据密集以后,对用户历次入住的地点、时间、住宿方式等深度挖掘达到智能推荐的目的。
从用户兴趣来看,显式反馈的数据相对于隐式反馈比较明确;从数据的数量和储存来看,显式反馈的数据较少且存在数据库中,隐式反馈的数据较为庞大。基于此,我们应充分利用隐式反馈数据,叠加用户的点击数据,通过判断加成后的隐式反馈数据和用户点击信息,以降低在隐式反馈数据处理过程中造成的误差。
2.2 静态数据与动态数据
静态数据是指用户由于前一时间段的行为而产生的对接下来的行为造成影响的数据。动态数据指在用户在产生行为时系统捕捉的瞬时数据。在租客和房主进行注册时就可以对其所在地、住宿条件、和年龄、性别等静态数据进行首次的获取。动态数据则是在用户产生进行点击、搜索、浏览等行为时获取。静态数据是动态数据的基础,动态数据是对静态数据进一步的解析。
3 数据处理
3.1 数据预处理
运用一定的数据挖掘算法(分类算法,聚类算法决策树等),首先收集Web服务器数据和用户数据的,对数据问题进行判定,然后用一定的基准衡量数据,对有用的数据进行提取,没用的数据进行去除,最后得到最终数据。对数据进行进一步挖掘,进行分类,聚类。然后将选出的数据进行预处理,为之后的数据分析奠定有效的数据基础。数据预处理包括数据清洗、数据集成、数据选择和数据变换4个方面[3]。
数据清洗是对景区景点资源、房屋住宿资源等进行加工处理和组织重构,为下一步数据处理过程提供基础平台,并对数据进行分析、调整。例如把天津市的所有待租房屋信息的相关数据列出,再根据客户需求:北辰区、一张沙发、?50/晚,对读取、抽取、过滤等操作,选择出客户满意的结果。
数据集成是将多组原始数据源通过匹配相似信息合并成一致的数据存储,例如有三组原始数据,数据1:天津北辰区某小区的单间,?150/晚;数据2:天津市北辰区某小区某单元房客厅沙发,?30/晚;天津市北辰区别墅一套,?800/晚;可以通过关键字“天津市北辰区”将以上3个数据统一管理;数据选择是修整删除冗余数据,选择性的压缩信息;数据转化是通过规范化等方法将旅游点的住房及租客等信息转换成适合检索挖掘的形式。
3.2 静态数据和动态数据处理
针对租客进行搜索过程中静态与动态数据处理如下:系统首先综合房主所在地、住宿条件价格等静态数据,通过抓取关键词进行分类打包,存于数据库中。根据租客进行搜索点击过程中产生数据对包中的数据进行更正。针对房主来说,静态数据和动态数据的处理如下:系统综合租客的性别、年龄、所在地等静态数据,根据关键字进行分类打包,存于数据库中,根据房主提供的租住信息等对包中的数据进行修正。
4 推荐结果处理
4.1 推荐结果的展示
智能推荐系统中,数据经过预处理后并不直接推荐给用户,而是将推荐结果通过关键字权重值进行排序后,将排序完毕的数据在网页上依次展现给用户。
4.2 推荐结果的测试
推荐结果的优劣程度,我们从两个方面进行判断:覆盖率以及准确性。准确性是指推荐系统产生的推荐和用户真实需求之间的契合程度,即正确推荐结果的程度,覆盖率是推荐系统包含可能被用户需要的推荐结果的能力。通过用户对推荐结果的点击率,停留时间以及进行再次搜索的频率对准确性和覆盖率进行判断。也可进行网上调研问卷的形式得到更有效的判断数据,进而对系统进行修改完善。
5 结论
随着人类社会信息化的不断深化发展以及互联网的广泛应用,智能应用系统将有更加广泛的需求,总而言之,“随游而安”智能推荐系统的诞生,不仅满足了人们对各种旅游资源的需求与体验,使得用户获得信息更加明确和精准,节约了用户资源,同时,也为旅游行业开辟了更加广阔的发展空间。实现了基于新一代信息技术,满足游客个性化需求的智能住宿推荐系统,主动感知旅客住宿要求相关信息,从而达到对旅游住宿的智能推荐,提供高品质、高满意度、高效率的服务。
参考文献
[1]沙志强.数据挖掘技术在智能推荐系统中的研究与应用[D].北京工业大学,2005.
[2]赵茜.IPIV智能推荐系统的设计与研究[D].广州:华南理工大学,2015.
[3]张晗.旅游服务智能推荐系统的研究与设计[D].2006,22(15):170-171.