基于空间容量统计的生态旅游路线自动推荐方法
2020-01-15张艳
张 艳
(黄山职业技术学院 旅游系,安徽 黄山 245000)
随着旅游业的发展,改变了传统固化、程序化的旅游方式,如今旅游者对旅游内容的要求越来越高,行程安排也逐渐追求个性化。并且游客更加倾向于自主选择游览景点,自主规划旅游线路,但是目前的生态旅游信息非常散乱,并缺少结构化的特征,普通游客很难根据这些信息制定自己的旅游路线。同时,游客选择陌生景点时无法亲身体验,决策行为不确定,这就需要旅游路线推荐尽可能充分了解游客的偏好,从而为游客推荐满意的旅游路线。
旅游是一种包括生态、空间、经济、心理等的复杂行为,其中,空间行为是生态旅游推荐路线较为重要的一个因素,因此将重点研究空间容量统计在生态旅游路线自动推荐方法中的应用。在这种背景下,传统的旅游路线推荐方法已经不能满足游客需求,因此设计一个基于空间容量统计的生态旅游路线自动推荐方法,以解决传统方法召回率差的问题。此次设计方法首先采用空间容量统计方法收集生态旅游数据,由于数据中存在一定的模糊性,因此对其处理,然后统计生态旅游者旅游时的地理位置数据,生成旅游者的行动轨迹,并去除行动轨迹中的异常点,获得生态旅游者的感兴趣信息。最后采用空间容量统计方法计算旅游景点的瞬时容量,并对旅游线路匹配,自动输出匹配结果评分高的数据,以此完成了生态旅游线路的自动推荐。实验对比结果表明,此次设计的方法比传统方法召回率高,能够正确推荐旅游路线。
1 生态旅游数据收集
在对生态旅游路线自动推荐之前,收集与旅游景点和用户相关的信息,以提高生态旅游路线推荐的合理性。生态旅游数据收集[1]过程如下图所示:
利用空间容量统计方法收集生态旅游数据,由于空间数据具有拓扑关系,使旅游数据属性之间出现一种非线性关系[2],因此对这些数据聚类处理,计算公式如下图所示:
(1)
同时,统计后的数据具有一定的空间信息模糊特性,该特性会导致数据收集结果不准确,因此利用空间容量统计方法对空间数据处理,计算公式如下:
(2)
通过上述计算,完成对空间数据的处理,以此完成生态旅游数据的收集,为生态旅游路线自动推荐提供基础依据。
2 生态旅游者空间行为挖掘
在上述生态旅游数据收集的基础上,对生态旅游者空间行为挖掘[5]。采用空间容量统计方法统计生态旅游者旅游时的地理位置数据,生成旅游者轨迹信息[6]。根据上述收集的生态旅游数据的相关信息,对旅游者轨迹预处理,假设某用户的轨迹数据集为:
Y={tm1,tm2,……,tmn}
(3)
公式(3)中,tm1、tm2、tmn分别代表采样点的位置信息,Y代表用户集合。
在定义相关轨迹点的数据信息后,处理原始数据,因为在对生态旅游者空间行为数据挖掘时,会受外在的干扰原因的影响,而造成错误采样[7],因此对挖掘轨迹平滑处理。
按照时间因素考虑轨迹异常情况,假定有m-2、m-1、m、m+1、m+2五个点,设置阈值,当m点与m-1的距离大于m-1到m+1并且存在一个大于阈值的关系时,则确定为轨迹中的异常点。在发现异常点后,将其从轨迹中去除,旅游者轨迹中的异常点如下图所示:
在上述对初始轨迹预处理后,得到去除异常点的轨迹点集合tmj={p1,p2,p3,……,pn},根据该集合,寻找生态旅游者的轨迹中的热点区域。考虑在已经得到的轨迹点中,若当前区域停留了一定的时长,说明当前游客可能对该区域进行了一次停留访问[8],则将该区域标记为一个热点区域W,同时,将轨迹中热点区域结合记作Wr={d,f,g,h},d、f、g、h分别代表的是轨迹点集合、访问次数、访问时长以及用户对该区域的兴趣度[9]大小。移动对象的轨迹与停留区域如下图所示:
将上述得到的感兴趣点进行序列化[10],计算公式如下所示:
(4)
公式(4)中,J代表不同热点区域的不同特征,v代表感兴趣点的时间阈值,gt、fi代表临近的热点区域,a代表热点区域的距离阈值。
通过上述计算,对所获取的轨迹端进行两次遍历处理,获得用户的热点区域集合,完成生态旅游者空间行为的挖掘。
3 生态旅游路线自动推荐
在上述生态旅游数据收集和生态旅游者空间行为挖掘的基础上,对生态旅游路线自动推荐。由于在旅游景区中,各个景点之间存在差异性[11],并且空间标准不一致,因此采用空间容量统计[12]方法对旅游空间使用范围界定,计算过程如下图:
考虑到景点之间游客流动性的特点,利用整个风景旅游区的平均游览时间计算景区的日周转率[13],选取景点最小的瞬时合理容量代替每个景点的瞬时合理容量进行计算,计算公式如下所示:
(5)
通过上述计算,对旅游区合理容量约束[14],在此基础上,根据旅游者的感兴趣区域匹配旅游路线,计算公式如下:
(6)
在线路匹配后,会生成多种旅游匹配线路,每种方案都会有相应的得分,在对旅游线路推荐时,按照下述计算公式,选取得分最高的路线推荐给旅游者:
(7)
公式(7)中,Qij代表第ij个用户的需求,h代表旅游线路推荐的得分,bij代表路线排序因子[15],Ak为路线推荐结果。 在用户寻找线路时,按照上述计算自动推荐最优线路,以此完成基于空间容量统计的生态旅游路线自动推荐。
4 实验对比
4.1 实验数据
采用实验的方式,对上述提出的方法验证,在某实验网站收集2015年4月至10月的旅游数据。这些数据中包括用户签到地点和签到数据等。为保证网络数据的准确性,对网站的签到记录、用户数、地点数等信息进行采集,次数为100次,并随机挑选一组采集数据,同时为减少实验时间,对实验数据预处理,去掉签到次数少于5次的地点,处理后的实验信息如表1所示:
表1 实验数据
随机抽取实验数据集中的50%作为训练集,剩余的作为测试集,并将测试集中的数据随机分为7个集合,进行7次实验。
为保证实验严谨性,将传统的方法与此次设计的基于空间容量统计的生态旅游路线自动推荐方法对比,对比两种路线推荐方法的召回率。
召回率代表推荐地点中正确推荐的地点占测试集中用户访问地点的比重,召回率计算公式如下:
(8)
公式(8)中,N代表召回率,Z为推荐正确的地点个数,C为测试集中地点个数,A为用户不喜欢地点个数,A数值是针对每个用户的喜好而排除的数量,N越高代表用户对推荐的线路满意程度高。
采用上述公式对实验数据分析,以减少实验对比难度。
4.2 实验平台
为使实验结果更加直观,设计实验平台,实验平台如下图所示:
图5中,云存储资源池主要存储实验数据;云计算资源池主要对实验数据实时计算,并生成相应的实验结果发送到实验控制终端;基站为实验提供网络支持;管理员客户端实时监控实验情况;旅游景点客户端提供旅游景点信息。
4.3 实验结果分析
在上述实验数据以及实验平台准备完成的基础上,对两种方法的实验结果分析,传统路线推荐方法与此次设计的旅游路线自动推荐方法的对比结果如表2所示:
表2 实验对比结果
经过计算得知,此次设计的方法比传统方法的召回率最高高出79%,最低高出30%。因此能够证明此次设计的旅游路线自动推荐方法的召回率较高,说明此次设计方法为用户推荐的路线基本能够满足用户需求。因为此次设计的方法能够有效分析用户历史旅游数据,并且能够分析游客的感兴趣区域,从而推荐出较合理的旅游路线。而传统的旅游路线方法整体召回率较低,并且召回率不稳定,因为传统方法在衡量用户之间或地点之间的相似性时,没有足够的数据,同时,对用户历史数据挖掘结构不准确,从而导致旅游路线推荐效果较差。
5 结果与讨论
通过上述实验能够证明此次设计的基于空间容量统计的生态旅游路线自动推荐方法比传统方法召回率高,能够提高游客的满意度。
传统的生态旅游路线推荐方法存在召回率低的情况,为解决这一问题,将空间容量统计方法应用到旅游路线推荐中。首先利用空间容量统计方法收集生态旅游数据,并对这些数据聚类处理,然后,统计生态旅游者旅游时的地理位置数据,生成旅游者轨迹信息,处理轨迹信息中的异常点,以对生态旅游者空间行为的挖掘。最后,采用空间容量统计方法对旅游空间使用范围界定,计算每个旅游场景的瞬时容量,匹配用户感兴趣路线,并对匹配完成的路线自动评分,将评分最高的发送给旅游者,以此完成生态旅游路线的自动推荐。实验对比结果表明,此次设计的方法比传统方法的召回率最高高出79%,最低高出30%,因此此次设计的方法能够满足旅游者使用需求,具有一定的实际应用意义。在未来的生态旅游路线自动推荐方法中,重点分析经济、心理等因素对生态旅游推荐线路的影响。