海南省市县旅游收益聚类分析及M A T LA B实现
2014-07-07何利芳陈奕娟张诚一
何利芳,陈奕娟,张诚一
(海南师范大学数学与统计学院,海口海南571158)
海南省市县旅游收益聚类分析及M A T LA B实现
何利芳,陈奕娟,张诚一*
(海南师范大学数学与统计学院,海口海南571158)
文章利用2002-2012年海南统计年鉴的数据,引入FCM算法,对海南省18个市县进行模糊聚类分析,利用Matlab软件编程把18个市县划分为四类.通过对聚类结果进行深入的数据比较分析,发现了一些现象:(1)市县旅游收益与市县旅游发达程度不是成正比;(2)万宁相对琼海等地,是旅客选择入驻的首选之地;(3)旅客入驻的餐旅费大约是旅客游览景点时所花门票费用的两倍;(4)境外旅客更多选择三亚、海口等地入驻;(5)东西线的旅游收益差距很大.针对这些现象和原因,提出了相应的措施建议.
旅游收益;FCM算法;模糊聚类分析
海南岛是位于中国最南端的热带旅游岛,是旅客最青睐的旅游度假胜地之一.特别是2009年海南国际旅游岛建设上升为国家战略之后,海南省旅游业发展呈突飞猛进的势头.各市县的旅游收益是其旅游业发展的主要评价因素之一.根据既往数据,对各市县的旅游收益予以分类,对各市县的旅游产业发展作出恰当评价、并提出具有针对性的政策建议,将是十分必要的.
聚类分析就是根据事物间的不同特征、亲疏程度、相似性等关系,对它们进行分类的一种数学方法.由于在现实世界中,事物间的关系其界限往往是不分明的,即为模糊关系,故利用模糊数学方法来进行聚类分析会显得更自然,更符合客观实际.模糊C均值聚类方法是在分类数给定的条件下,利用模糊ISODATA算法寻找出对事物的最佳分类方案.根据海南统计年鉴,各市县的重要统计指标中的旅游饭店招待境内旅客人数、旅游饭店招待境外旅客人数、国内旅游收入、外汇旅游收入、宾馆平均开房率这五个指标最能体现各市县的旅游收益情况.本文以海南的18个城市11年的这5个特征指标数据对它们进行分类,通过对市县旅游收益分类不仅可以分析各市县的旅游现状,而且可以通过对同类市县的数据研究,发现它们的共同特点;也可通过对异类市县之间的数据进行对比,分析它们的差异;还可以通过对部分分量数据相似的异类市县的数据进行比较,寻找其影响因素;针对上述三类现象,分析成因,提出相应的政策、措施和建议.
1 FCM聚类算法及MATLAB的实现
FCM算法是由Bezdek等人提出并改进的基于目标函数的模糊聚类方法.FCM算法简单而且运算速度快,易于在计算机上实现,是应用最为广泛的模糊聚类算法之一.
1.1 FCM聚类算法步骤
设被分类对象集合为
其中每一个对象均为有个特征指标,即
相应的特征指标矩阵为
现在要将对象集U分成c类(2≤c≤n),设c个聚类中心向量构成的矩阵为
为了获得一个最佳的模糊分类,按照下列聚类准则,从模糊分类空间Mfc中选出一个最好的模糊分类.其中
聚类问题可以转化为如下优化问题:
Bezdek证明了可以通过模糊ISODATA算法进行迭代运算,并且运算过程是收敛的.具体步骤:
式中
(3)修正模糊分类矩阵R()l取
(4)比较
1.2 MATLAB的实现
由于模糊聚类分析的计算量相当大,仅仅凭手工或计算器计算是不可能完成的,需要利用软件编程来实现.MATLAB是MATHWORK公司开发的专业的数学软件,它具有强大的科学运算,数据分析,程序设计等能力,它本身自带模糊逻辑工具箱,利用它可以很方便地实现数据模糊聚类分析.与,若对取定的精度ε>0有
2 基于FCM算法的海南市县旅游收益聚类
2.1 指标及数据的选取
根据2003年—2012年海南统计年鉴,选取海南各市县旅游饭店接待国内旅客人数和旅游饭店接待境外旅客人数,国内旅游收入,外汇旅游收入以及宾馆开房率指标作为特征指标(指标的涵义见海南省统计年鉴).上述指标与旅游收益均呈正相关关系.由于统计年鉴是统计上一年的情况,而2013年统计年鉴还未出版,所以实际上是2002年到2011年的统计情况,2013年只有部分数据发表,本文通过时间序列拟合方法补足了2012年的数据.另外统计年鉴里的部分数据缺失,比如部分市县2002年的宾馆开房率缺失,本文通过2003年-2008年之间的数据进行拟合得到2002年的宾馆开房率,因为2009年开始国际旅游岛的建设,旅游业发展相对较快,所以选取2008年以前的数据进行拟合具有合理性.而部分城市的入境旅客人数的数据缺失,考虑到入境人数有可能极少甚至为零,所以把这部分缺失的数据当作0处理.由于白沙的所有数据从2002年到2011年都没有,而2012年的才有,考虑到白沙旅游人数可能很少,所以把白沙2002年到2011年的数据当做零来处理.
2.2 对原始数据进行预处理
由于5个特性指标的量纲和数量级不相同,故在运算过程中可能突出某数量级特别大的特性指标对分类的作用,而降低甚至排除了某些数量级很小的特征指标的作用,致使对各特征指标的分类缺乏一个统一的尺度.为了消除这一影响,首先对数据进行数据规格化的处理.相应的变换公式为:
2.3 获取聚类结果
选取聚类数c=4,相当于对198个样本进行最后聚类,得到隶属度矩阵U,最后采用最大隶属度的评定准则对样本进行归类.执行MATLAB程序,得到最优的聚类结果,见表1.
表1 海南省市县聚类结果(编号)Tab.1Cities and couties clustering results in Hainan(number)
每个城市有11个序号,我们约定哪一类中包含这个城市的序号最多,我们就把这个城市归到那一类.最终得到结果见表2.
表2 海南省市县聚类结果Tab.2Cities and couties clustering results in Hainan
根据数据可以看出,三亚的5个指标的数据比其他地方都大,海口,万宁相对其他地方也大,而白沙,乐东,定安相对是最小的,再结合实际旅游境况和统计年鉴的数据,结果是符合实际情况的.也就是第四类是旅游收益高城市,第二类是旅游收益较高的城市,第一类是旅游收益较低城市,第三类是旅游收益低的城市.
3 对聚类结果进行分析及建议
通过分析聚类结果以及统计年鉴的数据可以发现以下现象:
第一,按各市县的发达程度来排序与按各市县的旅游收益来排序的结果不完全一致,本文聚类是按市县的旅游收益分类,而不是按旅游发达程度分类.从实际情况来看,由于文昌、琼海接近海口,保亭、陵水接近三亚,这四个城市的旅游业发展水平相比其他地方应该更发达,但从聚类结果中看出海口万宁分到了一类.另外,从表3数据可以看出,这5个特征指标都是与饭店或旅馆的接待人数以及收入有关的,所以分类的结果会与市县的旅游收益情况密切相关,而与市县旅游发达与否没有很强的相关性.
第二,沿海南东线的旅游路线一般多是海口→琼海,文昌→万宁→三亚,其中文昌,琼海接近海口是旅游的必经之路,保亭和陵水接近三亚,旅客人数比较多些,这四个城市应该算是旅游收益比较高的市县,但是从分类结果来看,却没有分在海口万宁这一类,究其原因,可能是因为琼海文昌保亭陵水都是旅游者路过的景点,一般的旅客在这些地方游览过后都不会在此过夜,而一般都会选择在万宁入驻.而我们给出的这五个指标中,都与饭店旅馆的接待人数有关,也就是旅客的入驻情况有关,这就是为什么海口万宁分在了一类,而其他四个景点分在了另外一类.
表3 2010年数据统计(海口、三亚等市县)Tab.3Statistics of 2010(Haikou,Sanya,etc)
第三,从表3数据中,比较万宁、琼海这两个城市前四个指标的数据,如图1,万宁接待国内旅客,境外旅客,国内旅游收入,外汇旅游收入分别为2650800万人次,36853人次,32.60532亿元,1986.282万美元,琼海接待国内旅客,境外旅客,国内旅游收入,外汇旅游收入分别为906000万人次,13797人次,11.14397亿元,743.623万美元,万宁每一个指标的数据几乎都是琼海的三倍左右,而经过琼海的旅客一定会经过万宁,在琼海消费的几乎是旅游景点门票的费用,所以旅客在万宁消费的费用比在琼海花的费用多了两倍,而多出来的这部分费用就是旅客入驻的费用,也就可以看出旅客入驻的餐旅费大约是旅客游览景点时所花门票费用的两倍.
第四,从旅游饭店接待旅客人数这项指标的数据可以看出,境外旅客更多选择三亚,海口等地入驻,原因是这些地方的旅游设施比较完备、规范,更安全,医疗卫生服务也更健全.
第五,表4的数据也可以看出东西线的旅游收益差距很大.例如,东线的市县有琼海、万宁,这些市县的旅游人数相对较多,而西线城市,例如儋州、临高、昌江、东方四个市县,旅游人数和收益相对较少.
基于以上的情况分析,本文提出以下几个建议:
图1 琼海和万宁2010年的五个指标的数据对比Fig.1Data comparisor of Qionghai and Wanning
(1)对于琼海,文昌,保亭,陵水等市县,要努力实现过路城市到入驻城市的转型,比如增加新的景点,与原景点构成景点链或景点群以延长游客滞留时间;也可以延长产业链;开发特色旅游项目群,比如特色购物,建设以体育、动漫、演艺等产业为主题的特色旅游项目等,让旅客游览景点的时间延长,游览后可以在这个城市入驻下来,这样就可以提高整个城市的旅游收益.例如在琼海可以依托博鳌亚洲论坛品牌优势,大力发展国际会展和文化创意产业,打造国际会展和文化产业品牌;在保亭七仙岭可以继续完善服务设施,建成以温泉疗养、森林旅游为特色的旅游度假区等.
(2)开发景点游览服务项目,比如提供本土特色产品,开展海岛观光、海上休闲运动、邮轮游艇等旅游项目,这样可以刺激游客消费和吸引更多的游客.完善配套服务,做到基础设施完备,各项旅游的配套设施齐全,提高游客的消费力度.
(3)在精品旅游景点区建立完善境外旅客服务系统,如提供与外国语言、文化等有关的旅游服务,大力开发和培养以医疗保健、养老托老为服务内容的国际疗养旅游产品,吸引国外旅客,加快国外、境外市场的开发,促进海南旅游业的发展.
表4 东西线市县2010年的数据比较Tab.4Data comparison of eastern front and western front
(4)缩小东西线旅游差距,例如在西线景点开发特色旅游,开发与东线旅游景点不同的独特旅游项目.充分利用西线独特的旅游资源优势,比如临港工业和高新技术产业资源、热带雨林资源、生态资源、历史遗迹资源等,大力发展生态旅游、工业旅游、滨海旅游,开发探险游乐项目,建立滨海旅游度假养生区等.例如规划建设东坡文化园,深入挖掘、保护和提升东坡文化;把霸王岭建设成为集生态旅游、休闲度假和科普教育为一体的旅游区等.
4 结束语
本文将FCM算法引入到市县旅游收益的聚类之中,利用MATLAB软件实现FCM算法的程序,得到了最优的聚类结果.通过分别对聚类结果中的同类、异类以及部分分量数据相似的异类的市县进行数据比较分析,分别找出它们的特点、差异以及影响因素,分析其原因,并针对这些现象及原因,提出相对应的政策、措施和建议.怎样将市县的旅游收益与市县的旅游产业发展程度联系起来并开展相应地评价分析,将是今后要做的工作.
[1]张敏,于剑.基于划分的模糊聚类算法[J].软件学报,2004, 15(6):858-868.
[2]李柏年.加权模糊C-均值聚类[J].模糊系统与数学,2007, 21(1):106-110.
[3]孙晓霞,刘晓霞,谢倩茹.模糊C-均值FCM聚类算法的实现[J].计算机应用与软件,2008,25(3):48-50.
[4]孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008, 19(1):48-61.
[5]张雪艳,陈传钟,胡晓华.基于季节时间序列模型对海南旅游人数的预测分析[J].海南师范大学学报:自然科学版, 2013,26(1):13-18.
[6]张文国,王国利.地下水系统径流带的模糊划分模式[J].水科学进展,2000,11(2):180-185.
[7]陈水利,李敬功,王向公.模糊集理论及其应用(第1版)[M].北京:科学出版社,2005:94-118.
[8]万福永,戴浩晖,潘建瑜.数学实验教程(Matlab版)[M].北京:科学出版社,2012:101-116.
责任编辑:毕和平
The Cluster Analysis of Tourism Benefit in Hainan Using Matlab
HE Lifang,CHEN Yijuan,ZHANG Chengyi*
(College of Mathematics and Statistics,Hainan Normal University,Haikou 571158,China)
Based on data from Hainan statistical yearbook between 2002 and 2012,this paper makes fuzzy cluster analysis of eighteen cities of Hainan by introducing FCM algorithm,and divides these cities into four categories.We compare and analyse the data of cities.The main conclusions are as follows:1)The tourism benefit of the city is not proportional to the de⁃velopment of the city;2)Wangning is the preferred place to settle for the tourists compared to other cities such as Qionghai. 3)The cost of hospitality is about twice as much as that of travelling.4)The foreigh tourists are inclined to choose Sanya and Haikou to settle.5)The gap of tourist benefit between eastern line and western line is very big.At the end,countermeasures and suggestions are offered for these phenomena and their reasons.
tourism benefit;FCM algorithm;fuzzy cluster analysis
F 590.8
A 文章编号:1674-4942(2014)02-0128-05
2014-01-03
国家自然科学基金项目(71140008);海南省社会发展专项(2011SFO3)
*通讯作者