APP下载

基于决策树方法的欠发达地区城市居民旅游花费偏好研究
——以江西赣州、吉安为例

2015-08-30梁江川广东省旅游发展研究中心广东广州510630顺德职业技术学院酒店及旅游管理学院广东佛山528333暨南大学管理学院旅游管理系广东广州510632

顺德职业技术学院学报 2015年3期
关键词:收入水平花费住宿

梁江川,陈 薇(1.广东省旅游发展研究中心,广东 广州 510630;2.顺德职业技术学院 酒店及旅游管理学院,广东 佛山 528333;3.暨南大学 管理学院旅游管理系,广东 广州 510632)

基于决策树方法的欠发达地区城市居民旅游花费偏好研究
——以江西赣州、吉安为例

梁江川1,3,陈 薇2,3
(1.广东省旅游发展研究中心,广东 广州 510630;2.顺德职业技术学院 酒店及旅游管理学院,广东 佛山 528333;3.暨南大学 管理学院旅游管理系,广东 广州 510632)

以江西赣州和吉安两地为例,研究欠发达地区城市居民的旅游花费预算及其影响因素。首先,通过线性回归分析初步筛选了影响旅游花费预算的相关因素。然后,通过决策树分析方法,探明旅游花费预算的影响因素构成,证实了旅游天数、住宿设施类型选择、月收入水平是旅游花费预算的最有效预测变量,且这四者之间存在一定的非线性关系,由此细分出5类花费特征显著的潜在消费者群体。

决策树;欠发达地区;城市居民;旅游花费

旅游花费(Travel Expenditure)是游客在旅行过程中为购买或使用旅游产品而支付的货币数量,包括交通、住宿、餐饮、购物、娱乐、游览等与旅游相关的费用支出。旅游花费是维持旅游生产者与消费者之间良性经济循环的最重要关系流,是测量消费需求的最直观指标,并直接影响一个国家或地区的旅游收入水平,因此,旅游花费一直是旅游目的地管理部门和业界关心热议的话题。但因为旅游花费涉及个人隐私,数据收集难度较大,所以旅游花费也是消费者行为研究中的难点。

本文试图从以下两方面进行研究:

第一,相比测量游客实际花费的先行文献[1-13],本文研究潜在旅游者的旅游花费预算。旅游花费预算表示潜在旅游者愿意为单次出游所支付的全部费用总和,反映了潜在旅游者的支付能力和消费偏好,不仅是影响人们旅游决策的重要因素,更是一种对实际旅游需求的心理倾向。

第二,相比多以热门旅游目的地为对象的先行文献[1-13],本文以中国欠发达地区为对象进行研究,欠发达地区指一定的历史时期经济社会发展水平相对落后的特定地域[14]。一般而言,相比广东、上海、江苏、浙江等东部沿海发达地区,中部六省以及西部地区被界定为欠发达地区。该地区集中了中国大多数省区,人口基数大,以其深厚的历史底蕴成为中国实际情况的缩影[15],当代中国消费者市场的偏好和决策机制都可以在这里找到具有普适意义的原型。

1 研究设计

1.1问卷设计

问卷内容包括三部分:旅游消费行为偏好、旅游花费预算、人口统计特征。其中,旅游花费预算部分为了提高应答率,采取封闭式选项和开放式自填相结合的方式。

1.2数据收集

2014年1月1日至5日,笔者在江西赣州和吉安两地以18岁以上常住居民为调查对象,开展被访者自填式的问卷调查。调查地点为赣州市城区(八境台、黄金广场、九方、黄金机场)、吉安市城区(人民广场、滨江公园、庐陵、步行街、白鹭洲、井冈山大学)、南康家具城(南康家居博览中心、一号家居港)。由于在欠发达地区的私营企业从业人口比例相对较高,本文在调查地点中增加南康市家具商城,针对私营业主及其职员进行了适量抽样。家具产业是赣州重要的支柱产业,南康家具城是全国第四大家具市场,直接或间接就业人员超过30万,对于研究私营企业从业者的旅游消费行为较具代表性。调查人员为赣南师范学院、井冈山大学在校旅游管理专业本科学生。计划发放1 000份,实际回收的有效问卷数量为890份。其中,赣州市区352份(39.5%),南康家具城198份(22.2%),吉安市城区340份(38.2%)。

1.3分析方法

本文利用决策树模型分析旅游花费与其它相关变量之间的非线性关系。决策树(decision trees)是一种分类分析程序,根据给定的分类变量和解释变量对样本进行最优分割,按照卡方检验的显著性进行多元列联表的自动判断分组,不仅可以快速有效地挖掘出主要的影响因素,还可以处理非线性相关的数据[16]。采用线性回归和决策树相结合的分析方法,利用SPSS17.0软件实现。首先,通过线性回归,初步识别对旅游花费具有显著影响的因素,由于线性回归分析的只是自变量与因变量的整体线性关系,可能忽略了其它相关关系存在的可能性,因此,接下来利用决策树模型进一步分析。决策树是一种分类分析程序,旨在通过最佳分类变量,识别特征显著的细分群体。决策树一般使用CHAID分析方法,其原理是:根据给定的分类变量和经过筛选的特征指标对样本进行最优分割,按照卡方检验的显著性进行多元列联表的自动判断分组,通过多个分类的比较,找到最佳分类变量和最佳分类结果[17]。相比反映因变量和自变量之间的总体线性关系的回归分析方法,决策树能更好地表达多个变量之间的非线性互动关系。

2 数据分析

2.1样本人口统计特征

样本人口特征如表1所示,分布广泛,对于反映欠发达地区城市居民人口统计特征,具有较强的代表性。女性占57.4%;年龄段以中青年为主体,集中在18~44岁,其中25~34岁者比例最高,占34.8%;学历水平中等,高中或中专学历者比例最高,占31.8%;从事职业以私营业主或个体户、在校学生、专业技术人员、自由职业者、销售及服务人员等为主;月收入水平集中在3 000~4 000元,占43.9%,月收入在2 000元以下者占31.5%、5 000元以上者占24.7%。

表1 样本人口统计特征

2.2旅游消费行为偏好

旅游消费行为偏好如表2所示。从出游动机来看,因缓解压力和休闲放松动机出游者最多,占61.4%;其次为游山玩水和回归自然动机者,占38.3%,再次是体验异地历史文化及增广见闻动机者,占36.3%,第四是陪伴家人子女动机者,占33.2%。而陪伴情侣爱人、享受时尚高雅生活、康体养生、出差开会单位活动、追求新奇特等其它动机者所占比重相对较小。

表2 旅游消费行为偏好

从旅游目的地偏好来看,超过70%的被访者倾向于前往国内知名的旅游目的地,通过与部分市民的面对面访谈了解到,他们比较憧憬的目的地有厦门、深圳、上海、广州、杭州等发达城市、以及粤赣交界的一些旅游城市,如河源、韶关、惠州等;其次,有19.4%的被访者愿意前往江西省内的旅游目的地,如九江的庐山、赣州的八境台、吉安的井冈山等传统观光型景点;而港澳台及国外受出行交通、花费成本所限,目前偏好程度仍较低。

从年出游次数来看,出游频率明显较低。全年无出游者并非少数,所占比例达18%,相比将旅游视为日常生活的一部分或刚性需求的大城市居民,中小城市居民的无出游者比例相对较高。大部分被访者每年出游1~2次,合计比例为55.6%,而年出游3次以上者仅占26.4%。

在旅游方式偏好上,大部分人偏好自驾车或依托公共交通工具的自助游方式,分别占34.9%和42.8%,说明随着我国各地旅游目的地公共服务设施日益完善,以及旅游者在旅游过程中的自我意识增强,自助出游已代替旅行社参团成为人们外出旅游的首选方式。而偏好旅行社参团或公司单位组织者较少,分别仅占15.6%、6.7%。

从人均旅游花费预算来看,愿意为单次旅游花费5000元以上者较多,占44%,其次是3 000~4 000元者,占30.8%,而意向花费在2000元以下者只占25.2%。通过人均旅游花费预算与月收入水平的相关分析表明,皮尔逊相关系数为0.305,说明单次外出旅游花费预算基本上以个人月收入水平为基准进行衡量。

从旅游天数来看,大部分人偏好的旅游时间为4~5天,占46.5%,其次是1~3天,占40.1%,而计划出游时间在6天以上者相对较少,仅占13.4%。可见,1~5天的小长假式的旅游时间是最适合中小城市居民安排旅游行程的。

从住宿设施选择来看,接近半数人偏好三星级酒店,即设施舒适且价格实惠的住宿类型,占48.8%;其次是二星级酒店,即经济型的住宿类型,占20.6%;再次是属于廉价型的家庭旅馆及招待所,占17.1%。而高等级酒店如四星级(高档型)、五星级酒店(豪华型)的受偏好比例仅分别为9.0%、4.5%,说明中小城市居民对住宿设施选择仍处于价格敏感的功能性消费阶段,他们目前的经济收入水平决定了他们更倾向于入住价格实惠且舒适卫生的住宿设施,而不太追求高星级酒店的非功用性利益。

2.3旅游花费的线性回归模型

为了识别并验证对旅游花费具有显著影响的相关因素,以旅游花费为因变量,以消费行为特征、人口统计特征等为自变量,采用逐步进入方法进行线性回归分析。结果如表3所示:旅游天数、住宿设施选择、休闲动机、目的地偏好、月收入水平、学历对旅游花费具有显著的影响,且7个回归模型都具有显著的统计意义;方差膨胀因子(VIF值)为1.022~1.108,低于一般统计要求的上限值5,说明因变量和自变量之间的多重共线性影响较小。

旅游天数与旅游花费存在较大的正向线性相关,标准化系数为0.32,表明出游时间越长花费预算越高。住宿设施选择对旅游花费具有显著的正向影响,说明对住宿设施的档次类型要求越高,旅游花费也会越高。旅游动机中的休闲动机对旅游花费具有显著的负向影响,越是休闲动机者,旅游花费越少。偏好目的地中的港澳台和省外对旅游花费具有显著的正向影响,越是倾向于前往这两个地区的人,旅游花费水平越高。月收入水平对旅游花费具有显著的正向影响,收入越高,旅游花费预算越大。学历对旅游花费具有显著的负向影响,受教育水平越高者反而越有节俭花费的倾向。

然而,回归模型的决定系数和修正决定系数分别仅为0.332和0.324,标准化系数的绝对值也普遍不高,介于0.071~0.32之间,说明这些变量虽然对旅游花费具有一定的预测力,但与旅游消费之间的线性关系不强,需要通过聚类分析进一步分析它们之间的非线性关联。

表3 线性回归分析结果

2.4旅游消费市场细分

对旅游消费市场用决策树方法进行细分。事先将旅游消费、旅游天数从尺度变量转换为名义变量,使自变量和因变量均为名义变量。使用决策树模型中的CHAID(卡方自动交互检测)生长法进行样本分类,结果如图1所示,决策树生成3个层次。第一个层次的分类变量为旅游天数,由此细分出1~3天游、4~5天游、6日以上游三个群体,说明旅游天数是旅游花费的最佳预测变量。第二个层次的分类变量分别为住宿设施选择和月收入水平。三个层次的卡方检验显示,每个层次的分类均达到显著性水平。风险估计值表示该模型所预测类别的个案错误率,越小表明该树形模型进行预测的准确程度越高,本研究模型的风险估计值为0.434,也就是说,对56.6%的被访者进行了正确分类,这表明本研究模型的拟合效果可以接受。

决策树分析模型生成5个末端节点及其所占比重,代表5类具有显著差异的细分市场及其市场份额,各个节点中具有最高频数的群体视为预测类别,以灰色背景突出显示。通过单因素方差分析得出每个细分市场的人均每次花费均值,根据该均值从高到低的顺序,依次命名为市场1至5。由此将每个细分市场的特征描述如下(如表4所示):市场1(节点3)人均花费最高,达5 785元,旅游天数最多,6天以上,所占市场份额为13.5%;市场2(节点7)所占的市场份额最大,为35.9%,人均花费仅次于市场1,为4 887.2元,旅游天数为4~5天,月收入水平在5 000元以上。市场3(节点6)的市场份额最小,仅为10.7%,旅游天数为4~5天,人均花费4 126.6元,明显高于其2 000元以下的月收入水平,可以推测该群体的旅游消费需求较强;市场4(节点4)对住宿设施要求最高,偏好三星级以上的住宿设施,旅游天数为1~3天,人均花费处于中等水平,为3 711.4元,所占市场份额为20.1%;市场5(节点5)的人均旅游花费最低,仅为2 333.6元,旅游天数为1~3天,月收入水平在2 000元以下,住宿设施偏好为1~2星级酒店,市场份额为19.7%。

图1 决策树分类结果

表4 细分市场特征总结

3 结论与讨论

本文以江西赣州和吉安两地为例,研究欠发达地区城市居民的旅游花费预算,通过上述数据分析结果,得出以下结论:

第一,欠发达地区城市居民旅游消费偏好总体特征为:以休闲为主要出游动机,偏好国内知名的旅游目的地,每年出游频率在1~2次,自助游是主流倾向,人均旅游花费预算与月收入水平大致匹配,旅游时间偏好为1~5天,偏好经济型住宿设施,对三星级以上酒店的消费弹性较高。

第二,旅游天数、住宿设施选择、月收入水平是预测旅游花费预算的最有效变量。线性回归分析结果表明它们之间存在一定的线性关系,即从总体而言,旅游天数越长、住宿设施档次越高、月收入水平越高,旅游花费预算也会越高。但这种线性关系较弱,决策树模型进一步说明它们存在一定的非线性关系,即存在一部分具有非线性特征的消费群体:旅游花费预算高但住宿类型选择的档次并不高,月收入水平低但旅游花费未必低。

第三,根据旅游天数、住宿设施选择、月收入水平划分出5个具有显著花费差异的细分市场,并总结不同细分群体的人均单次旅游花费预算均值和市场份额。其中,旅游天数在6天以上者是最高花费预算群体;旅游天数为1~3天、住宿设施偏好1~2星级酒店者构成最低花费预算群体;旅游天数为4~5天,月收入水平在5 000元以上者是外出旅游的最主要消费群体。从而证实了旅游花费是细分潜在旅游消费需求市场的可行指标之一。旅游管理者可根据不同细分市场开展有针对性的营销活动。

[1]L Juan.Eugenio-Martin,Juan A.Campos-Soria.Economic crisis and tourism expenditure cutback decision[J].Annals of Tourism Research,2014,44(1):53-73.

[2]WANG Yu Shan.Effects of budgetary constraints on inter-national tourism expenditures[J].Tourism Management,2014,41(4):9-18.

[3]Joaquín Alegre,Sara Mateo,Lloren Pou.Tourism participation and expenditure by Spanish households:the effects of the economic crisis and unemployment[J].Tourism Management,2013,39(12):37-49.

[4]Peter Forsyth,Larry dwyer,Rayspur,Tiampham.The impacts of Australia's departure tax:Tourism versus the economy?[J].Tourism Management,2014,40(2):126-136.

[5]谷惠敏,伍春来.中国收入分配结构演变对国内旅游消费的影响[J].旅游学刊,2003,18(2):19-23.

[6]滕丽,王铮,蔡砥.中国城市居民旅游需求差异分析[J].旅游学刊,2004,19(4):9-13.

[7]袁宏杰.基于面板模型的城市居民国内旅游消费实证分析[J].旅游科学,2011,25(4):28-35.

[8]苏发金.我国城乡居民旅游消费与收入之间关系的比较研究[J].暨南大学学报:哲学社会科学版,2012 (10):139-145.

[9]王渭,徐月.居民消费水平影响因素的实证分析[J].无锡商业职业技术学院学报,2014,14(2):25-29.

[10]Juan Gabriel Brida,Raffaele Scuderi.Determinants of tourist expenditure:a review of micro econometric models[J].Tourism Management Perspectives,2013,6(4):28-40.

[11]MOK C,Iverson T J.Expenditure-base segmentation:Taiwanese tourists to Guan[J].Tourism Management,2000(21):299-305.

[12]Dı´az-Pe´rez F M,Bethencourt-Cejas M,A´lvarez-Gonza´lez J A.The segmentation of canary island tourism markets by expenditure:implications for tourism policy [J].Tourism Management 2005,26(10):961-964.

[13]WU Lingling,ZHANG Junyi,Akimasa Fujiwara.Tourism participation and expenditure behaviour:analysis using a scobit based discrete-continuous choice model [J].Annals of Tourism Research,2013,40(1):1-17.

[14]吴晓军.产业集群与工业园区建设[D].南昌:江西财经大学,2004.

[15]叶平.我国中等发达地区教育现代化的战略选择[J].中国地质大学学报:社会科学版,2003,3(3):51-57.

[16]何凡,沈毅,叶众.卡方自动交互检测法及其应用[J].中华预防医学杂志,2005,39(2):133-135.

[17]石玲,王燕.婴幼儿死亡危险因素的研究:兼论CHAID方法的原理及应用[J].中国卫生统计,2002,19(5):283-285.

[责任编辑:吴卓]

A Decision Tree Analysis of Tourism Expenditure Preference of Urban Residents in Less-developed Areas:The Case of Ganzhou and Ji'an

LIANG Jiangchuan1,3,CHEN Wei2,3
(1.Guangdong Tourism Research Center,Guangzhou Guangdong 510630,China;2.Tourism and Hotel Department,Shunde Polytechnic,Foshan Guangdong 528333,China;3.Tourism Management Department,Jinan University,Guangzhou Guangdong 510632,China)

Based on the survey in Ganzhou and Ji'an of Jiangxi province,this paper carries out a research on travel expenditure budget and its influencing factors of urban residents in less-developed areas.Firstly,the related influencing factors of travel expenditure budget is preliminary selected through linear regression analysis;then decision tree analysis is adopted to ascertain the real composition of the influencing factors.The results show that the days of travelling,types of accommodation and monthly income are the most effective predictive variables,and there is some non-linear relationship among them.Finally,five segments of consumer markets with distinctive expenditure characteristics are subdivided according to the results.

decision tree analysis;less-developed areas;urban residents;travel expenditure

F590.8

A

1672-6138(2015)03-0038-06

10.3969/j.issn.1672-6138.2015.03.009

2015-05-21

国家社会科学基金项目(12BJY124)。

梁江川(1980—),男,广东广州人,暨南大学博士研究生,研究方向:旅游市场、旅游统计。

猜你喜欢

收入水平花费住宿
男生女生住宿差异大赏
新春开拍小礼物
情况不同,“花费”不一样
民宿市场占比已超星级酒店
P大的住宿学院
中等收入水平阶段居民消费结构对产业结构演进的影响——基于跨国数据的实证检验
法学院哪家最强
全面发展与提高消费力
决定医生收入水平首先是市场因素
2014年世界杯会花费多少?