APP下载

基于CFPS数据的家庭旅游消费特征及影响因素研究

2020-10-23罗建基彭磊义肖洪根李德裕林明水

关键词:回归系数基础变量

罗建基,彭磊义,肖洪根,李德裕,林明水

(1.香港理工大学 酒店及旅游业管理学院,香港 九龙 999077;2.台北科技大学 管理学院,台湾 台北 10608;3.浙江旅游职业学院 旅行社管理系,浙江 杭州 311231;4.福建师范大学 旅游学院,福建 福州 350117)

2018年,中国居民出游力指数达到17.8%[1],旅游消费成为居民消费主体,是居民实现美好生活的重要路径[2]。随着全域旅游、文旅融合、乡村振兴等相关政策红利的不断释放,文化体验游、康养游、研学游等新业态不断呈现,旅游消费大众化已成为新趋势[1],居民的旅游消费需求不断增长,成为我国扩大内需、促进居民消费的重要战略支撑[3]。

国内外关于旅游消费支出的研究在宏观层面多侧重某时段某国家或区域居民的旅游消费总体特征及影响因素[4-7],在微观层面多侧重从个人视角和家庭视角研究旅游消费主体[8]。个人视角下的研究主要涉及个体在旅游过程中的各类旅游消费支出及相关影响因素[9-12]。家庭视角下的研究,多聚焦于游客在旅游过程中的各种旅游消费形态和游客在旅游期间的餐饮、住宿、交通等各种单项旅游消费支出及其影响因素[13-16]。国内学者关于家庭视角下旅游消费的研究多以家庭类型为研究对象,以城镇(城市)家庭[8]、中产阶层家庭[17]、儿童家庭[18]为主,难以反映家庭旅游消费的总体特征;同时还存在着将家庭作为旅游形式与影响因素阐述不清的情况;研究变量多借用西方家庭视角的旅游消费指标,难以真实反映独特家庭视角下的旅游消费特征和内涵[19];研究数据多为特定区域的一次性抽样调查数据[20],所呈现的家庭旅游消费特征具有局部性和间断性,由于缺乏全国性、连续性的数据,难以全面真实地反映家庭旅游消费特征;研究结论主要为旅游消费的特征及影响因素,其中影响因素包括经济制约因素、社会人口属性因素、个体心理因素三类[21],以社会人口属性因素论述较多[22,23]。

中国家庭追踪调查(China Family Panel Studies,CFPS)是北京大学中国社会科学调查中心(ISSS)实施的一项全国性、大规模、多学科的社会跟踪调查项目[24]。CFPS重点关注中国居民的经济与非经济福利,包括经济活动、教育成果、家庭关系与家庭动态、人口迁移、健康等在内的诸多研究主题[24]。CFPS通过跟踪收集个体、家庭、社区三个层次的数据为学术研究和公共政策分析提供数据基础[25],形成的数据库具有整体性、连续性和基础性的特点,越来越受到学者的青睐[26]。目前,已有基于CFPS数据的家庭旅游消费研究的报道[17-18],其研究变量主要集中于社会人口属性因素,以家庭收入类因素为主的经济制约因素偏少;因CFPS调查同一家庭中的若干成员,使家庭成员的年龄、性别、种族、婚姻状况、受教育程度、就业状态、职业类型等无法代表家庭的整体特征,而经济制约因素是以家庭为基本单位进行统计的,代表着家庭整体水平;研究方法主要以描述性分析和线性回归分析为主,描述性分析对于家庭旅游消费研究过于浅显,无法进行深度解读,线性回归分析虽应用较广但受限较多;研究数据的选取以单独截面数据为主,即数据选取来源于一个数据库(年),无法描述出家庭旅游消费的连续性发展态势。由此可见,有必要从全国性、连续性的旅游消费数据着手,以大范围跨区域的家庭旅游消费为研究对象,选取反映家庭整体性特征的影响因素作为研究变量,更加真实客观地对家庭旅游消费发展态势、显著消费特征和影响因素进行探讨和研究。

本研究基于CFPS的两个数据库(年),以实际发生旅游消费支出的家庭为研究对象,以数据库所提供的反映家庭整体性特征的影响因素(包括经济制约因素和个别社会人口属性因素)作为研究变量,利用Logistic 回归分析方法研究家庭旅游消费发展态势、消费特征和影响因素,以期进一步丰富家庭旅游消费研究成果,为促进家庭旅游消费发展提供参考。

1 研究设计

1.1 变量选择

参考前人的研究报告并根据本研究的实际情况,本研究从CFPS数据库中选取家庭旅游消费支出作为因变量,选取全部家庭纯收入、人均家庭纯收入、工资性收入、房屋所有权性质、家庭净资产、总房贷、居民消费性支出、交通通讯支出、家庭总支出、所在地区、社区性质、家庭人口规模为自变量。

1.2 数据来源与分析方法

1.2.1 数据来源

自CFPS于2010年开始实施调查以来,两年一次的全样本追踪调查已完成三次,形成了CFPS-2012、CFPS-2014、CFPS-2016三个庞大的数据库。鉴于新常态下宏观经济周期的阶段性和连续性,本研究选取CFPS-2014和CFPS-2016两个数据库中的家庭经济数据进行分析。

1.2.2 数据预处理

首先,本研究删除了旅游消费支出为零的样本和自变量中含有缺失值的样本,由CFPS-2014 和CFPS-2016两个数据库分别提取到符合本研究要求的样本2130个和2999个;其次,以所在地区为参考变量,借助SPSS 22.0软件中的智能分箱工具,将连续变量进行离散化处理,变量处理结果见表1。同时,家庭人口规模分类变量的类型跨度较大,为避免因类型比例过低在logistic 回归对数运算中出现极值而对类别进行了缩减。

表1 变量名称及数据处理结果Table 1 Variable names and data processing results

1.2.3 研究方法

多元Logistics回归主要用来对多因素影响事件的概率进行预测,其基本假设与其他多变量分析的假设不同,无需符合正态分布的假设,但如果自变量为正态分布结果会比较可靠。与一般回归分析不同,Logistic回归中因变量是离散型变量。

本研究采用多元Logistics回归考察各个变量对我国家庭旅游消费支出的影响。令p 表示某种事件成功的概率,受因素x影响,p 与x的关系为

上式为Logistic回归模型,β为回归系数,k为因素x 的项数。

发生比率Exp(β)是回归系数β以e 为底的自然幂指数,是事件的发生频数与不发生频数的比值,用于衡量自变量对因变量的影响程度,Exp(β)<1说明发生比减少,Exp(β)=1说明发生比不变,Exp(β)>1说明发生比增加[27]。

2 结果与分析

2.1 各变量类别的分布

2016年,基础档、中档和高档家庭旅游消费占比分别为41.1%、42.8%和16.1%。2014年,基础档、中档和高档家庭旅游消费占比分别为72.4%、20.2%和7.4%,说明基础档和中档家庭旅游消费在被调查对象中是家庭旅游消费的主要选择,如表2所示。

表2 变量频次分析Table 2 Frequency analysis of variables

住房所有权性质方面,完全拥有房屋产权家庭在2016年和2014年占比分别达76.7%和80.2%,占比均较高。社区性质方面,城市城镇家庭在2016年和2014年占比分别为73.7%和74.2%,在调查对象中占比均较高。所在地区方面,三线地区家庭在2016年和2014年占比分别为52.1%和50.1%,在调查对象中占比均较高。家庭人口规模方面,三口之家占比最高,在2016年和2014年分别为30.3%和30.5%,排在第二、三、四和五位的家庭人口规模类别分别是两人家庭、四人家庭、五人家庭和单身家庭。

2.2 共线性检测

将Logistic回归的相关变量直接带入线性回归模型进行共线性检测,获得容忍度或方差膨胀因子,容忍度小于0.1或方差膨胀因子大于10表示变量存在共线性。本研究中,容忍度均远大于0.1,且方差膨胀因子均小于10,研究变量间不存在多重共线性。

2.3 模型自变量验证

将选择的12个变量代入多元Logistic回归模型中,将显著性水平大于0.05的变量剔除,重新建立回归方程并进行显著性检验,直至方程中的所有变量检验都显著,最终的剩余变量及其显著性检验结果见表3。

表3 模型自变量显著性检验Table 3 Significance test of independent variables of logistice model

多元Logistic回归模型的拟合度分析结果见表4,纳入研究的两年的最终模型比其常数项模型的拟合性要好(1629.512 <2645.133,1278.727 <1754.805),且概似比检验(Likelihood Ratio Tests)结果显示最终模型的改善有统计学意义(P <0.001),模型通过检验。

表4 模型拟合信息Table 4 Model fitting information

拟合优度分析结果见表5,纳入研究的两年数据的皮尔逊卡方显著性P 值分别为0.877、0.996,均大于0.05,原假设成立,模型对原始数据的拟合通过检验。

表5 模型拟合优度检验Table 5 Model goodness-of-fit text

2.4 变量检测

运用SPSS 22.0软件对通过显著性检验的自变量进行多元Logistic 回归分析,并检验各个自变量在主效应模式下对因变量的影响,各自变量的统计检定值见表6。

表6 家庭旅游消费多元Logistic回归分析Table 6 Multinomial Logistic regression analysis of family tourism consumption

2.4.1 共同变量检测分析

2016年家庭净资产各群中,仅第三群(3)对中档家庭旅游消费的回归系数P值大于0.05,无统计学意义,其它都具有统计学意义;处于家庭净资产第一、二、三群的家庭更偏向于选择基础档的家庭旅游消费,这种可能性分别是选择高档家庭旅游消费的4.755、2.571、1.964倍;处于家庭净资产第一、二群的家庭选择中档家庭旅游消费的可能性分别是选择高档家庭旅游消费的2.393、2.278倍。2014年家庭净资产各群中,第三群(3)的回归系数P值和第二群(2)对中档家庭旅游消费的回归系数P值均大于0.05,无统计学意义,其他均具有统计学意义;处于家庭净资产第一、二群的家庭选择基础档家庭旅游消费的可能性分别是选择高档家庭旅游消费的4.680、2.386倍;处于家庭净资产第一群的家庭选择中档家庭旅游消费的可能性是选择高档家庭旅游消费的2.517倍。

2016 年和2014 年居民消费性支出第一群(1)对基础档和中档家庭旅游消费的回归系数P 值皆小于0.05,具有统计学意义。2016年居民消费支出第一群的家庭选择基础档和中档旅游消费的可能性分别是选择高档旅游消费的3.846、2.081倍,2014年分别是12.388、4.398倍。

2016年社区性质第一群(0)对基础档和中档家庭旅游消费的回归系数P值皆小于0.05,2014年社区性质第一群(0)对基础档家庭旅游消费的回归系数P值小于0.05,均具有统计学意义。2016年农村家庭选择基础档和中档旅游消费的可能性分别是选择高档旅游消费的2.489、1.518倍,2014年农村家庭选择基础档旅游消费可能性是选择高档旅游消费的2.998倍。

在地区分群中,2016年二线地区家庭对基础档和中档旅游消费的回归系数P值皆小于0.05,2014年一线、二线地区家庭对基础档旅游消费的回归系数P值小于0.05,均具有统计学意义。2016年二线地区家庭选择基础档和中档旅游消费的可能性分别是选择高档旅游消费的1.757、1.497倍,2014年一线、二线地区家庭选择基础档旅游消费的可能性分别是选择高档旅游消费的0.603、1.893倍。

2.4.2 相异变量检测分析

2016年人均家庭纯收入各群对基础档和中档旅游消费的回归系数P值皆小于0.05,均具有统计学意义;处于人均家庭纯收入第一、二、三群的家庭较倾向于选择基础档旅游消费,其可能性分别是选择高档旅游消费的8.143、4.176、1.594倍;处于人均家庭纯收入第一、二、三群的家庭选择中档旅游消费的可能性分别是选择高档旅游消费的3.295、2.731、1.574倍。

2016年房屋所有权性质变量中仅有廉租房(4)和租的商品房(6)两群对基础档和中档旅游消费的回归系数P值小于0.05,具有统计学意义;租赁廉租房和商品房的家庭选择基础档旅游消费的可能性分别是选择高档旅游消费的0.830、2.536倍,选择中档旅游消费的可能性分别是选择高档旅游消费的0.825、1.880倍。

2016年家庭总支出第一群对基础档旅游消费的回归系数P值小于0.05,具有统计学意义,该类家庭选择基础档旅游消费的可能性是选择高档旅游消费的1.884倍;家庭总支出第一群对中档旅游消费的回归系数P值大于0.05,不具有统计学意义。

2014年交通通讯支出对基础档家庭旅游消费的回归系数P值小于0.05,具有统计学意义。Logistic回归通过对不同数值变化的动态比较实现对连续变量发生比的有效解释,单纯静态且孤立的观察意义不大。

基于经济影响因素的观察可得,基础档和中档家庭旅游消费的发生比都大于1,可能得益于近年来中国经济社会条件的极大改善。基于社会人口属性因素观察可得,基础档和中档家庭旅游消费的发生比也都大于1,可能源于中国辽阔地域下存在的城乡二元经济结构和经济发展的不均衡,社会人口属性不同的家庭在选择旅游产品时各有侧重,具体表现为:三线地区家庭、农村家庭以传统观光游为主,二线地区家庭、城镇家庭更加青睐于休闲度假游;三线地区家庭、农村家庭主要选择国内游,二线地区家庭、城镇家庭更偏爱出境游。长期以来,中国家庭形成了重视教育和尊老敬老的优良传统,旅游既承担对孩子的教育功能,又发挥促进家庭关系融洽和谐的功能,旅游日益成为人们日常生活的重要内容,以家庭为主体的旅游成为当前的重要旅游形式。

3 结论与启示

3.1 主要结论

第一,中国家庭旅游消费呈现出强劲态势。2014年和2016年基础档和中档旅游消费在其研究样本中占比合计分别达92.6%和83.9%,基础档旅游消费的发生比率要高于中档旅游消费,但二者发生比率皆大于1,基础档和中档旅游消费是中国现阶段家庭旅游消费的主流选择。

第二,基础档和中档旅游消费在二线地区家庭和农村家庭旅游消费选择上更为明显。人口社会属性指标显示,农村家庭选择基础档和中档旅游消费的可能性比城镇家庭更高,二线地区家庭选择基础档和中档旅游消费的可能性比三线地区家庭更高,而一线地区家庭选择基础档和中档旅游消费的可能性差异则不显著。消费层级与家庭所处区位的密切关系是中国家庭旅游消费的显著特征。

第三,家庭旅游消费影响因素的多元化特征已经凸显。首先,中国现阶段家庭收入日趋多元化,工资性收入虽具有普遍性,但已不是唯一的旅游消费影响因素,人均家庭纯收入和家庭净资产成为衡量家庭收入的重要指标和旅游消费的重要影响因素;其次,旅游正成为中国居民家庭生活的重要内容,需要从家庭消费结构的整体性来分析各消费类型的影响,家庭总支出和居民消费性支出逐步成为影响旅游消费的重要因素;再次,家庭人口规模没有成为影响旅游消费的显著性因素,其原因可能是现阶段中国家庭收入的不断提高、家用汽车和高铁的普及解决了过去家庭出游的诸多问题,使家庭人口规模的影响日趋弱化;最后,房屋所有权性质实质上分为拥有产权和租赁两大类,本研究中总房贷未成为显著影响因素反映出中国拥有住房完全产权的家庭具备一定的经济实力,总房贷对家庭旅游消费的影响不显著。而不同类型的房屋租赁家庭的旅游消费情况也各异,租赁商品房的家庭在旅游消费上的发生比明显高于廉租房家庭。由此可见,家庭旅游消费的影响因素日趋多元化。

3.2 研究启示

第一,家庭旅游消费的强劲态势是旅游业发展的机遇,各级政府要持续加大政策引导和投入,旅游企业要不断加强相关旅游产品的开发,以满足家庭旅游消费的多样化需求。

第二,在旅游市场消费升级和结构调整的背景下,旅游企业应该关注基础档家庭旅游消费市场,不断增加和完善与其相匹配的旅游产品。

第三,在大众旅游深入发展的新阶段,影响家庭旅游消费的因素日趋多元化,旅游相关部门和学者需对新的影响因素加以重视和研究,以便更好地解读和预测我国家庭旅游消费的新趋势。

3.3 研究展望

本研究还存在如下不足:第一,鉴于CFPS现有数据,本研究只选取两个数据库,研究深度略微缺乏,未来随着CFPS数据库的不断丰富,可选取时间较长的多个年份数据进行研究;第二,CFPS是一个综合性的数据库,不是针对家庭旅游消费的专项调查,其指标设计的针对性不强且可供选择的影响因子较少,如无法从现有数据中判断家庭生命周期等,可能无法全面阐释家庭旅游消费内涵;第三,CFPS数据库中存在着庞大的没有发生旅游消费的家庭,因此无法真实了解其旅游消费现状和潜在旅游需求。

猜你喜欢

回归系数基础变量
“不等式”基础巩固
“整式”基础巩固
抓住不变量解题
也谈分离变量
多元线性回归的估值漂移及其判定方法
“防”“治”并举 筑牢基础
电导法协同Logistic方程进行6种苹果砧木抗寒性的比较
多元线性模型中回归系数矩阵的可估函数和协方差阵的同时Bayes估计及优良性
SL(3,3n)和SU(3,3n)的第一Cartan不变量
分离变量法:常见的通性通法