基于CKB数据的中国茶叶消费行为研究
2018-06-21管曦杨江帆谢向英林畅李静芸
管曦,杨江帆,谢向英,3,林畅,李静芸
1. 福建农林大学经济学院,福建 福州 350002;2. 福建农林大学茶叶科技与经济研究所,福建 福州 350002;3. 福建农林大学管理学院,福建 福州 350002
中国是茶叶的主产国,2016年中国茶叶产量、茶园面积、茶叶出口分别为243万t、293.33万 hm2(4 400万亩)和 32.9万 t[1],各项指标均位居世界前列。另一方面,中国作为主要茶叶消费国,其国内茶叶消费者数量已达4.28亿,城乡居民饮茶率分别为 46.5%和33%[2],茶叶消费量和茶叶消费者数量均位居全球第一。随着中国茶叶产业快速的规模化扩张,中国茶叶产业供求失衡问题日益突出,2016年中国国内茶叶供给大于需求42.19万t,几乎占该年中国国内茶叶市场供给量的20%[3]。在茶叶供过于求和供给侧结构性改革的大背景下,如何更好地开发茶叶消费市场,以提供符合消费者需求的茶叶产品,是当前中国茶叶产业面临的现实问题,这就需要对中国茶叶消费问题展开系统的研究。
近年来对于中国茶叶消费的研究主要集中于以下几个领域:(1)不同地区茶叶消费者行为分析[4-9];(2)茶叶消费弹性测算[10-14];(3)茶叶消费者购买意愿研究[15-20]。随着越来越多的研究关注中国茶叶消费,这些研究的方法和结论都为茶叶消费这一领域展开进一步深入分析奠定了扎实基础。但基于数据获取的难度,现有的研究主要以某一地区的茶叶消费者为研究对象,样本数量较少,其代表性有限。在关于茶叶消费量的数据获取上,主要使用消费者每日饮茶杯数,忽略了中国饮茶一次投放多次续水的传统消费习惯,这可能会导致回归系数估计有偏差进而对研究结论产生影响;其次现有研究大多忽略了消费者饮茶习惯的时间长短可能对茶叶消费产生的影响;再次现有的研究大多忽略消费茶类的区别。
基于以上的分析,本文认为需要通过一个覆盖面更广、代表性更强、调查更全面的数据库,来对上述中国茶叶消费研究中存在的问题展开研究。中国慢性病前瞻性研究(China Kadoorie Biobank, CKB)项目的基线调查数据,为本研究的开展提供了这样一个完整的数据库支持[21-23]。该基线调查数据涉及中国 10个省(区)512 891个样本,调查问卷不仅包括消费者饮茶的类别,还包括消费者每日茶叶消费量、饮茶杯数、饮茶习惯形成年龄、茶水浓度偏好等,这些都为本文从新的视角更全面地分析中国茶叶消费提供了良好的支持。
1 数据来源
本文使用的数据来自中国慢性病前瞻性研究(China Kadoorie Biobank, CKB)项目的基线调查数据,该调查是中国医学科学院与英国牛津大学联合开展的慢性病国际合作项目,是一项多因素、多病种、多学科合作的大规模慢性病病因流行病学研究,在中国 10个省(区)开展,共涉及 512 891人,持续时间15~20年。在调查问卷中,除了基本的人口特征外,涉及茶叶的相关问题选项包括中国居民的饮茶频率、饮茶类型、饮茶历史、饮茶特征、饮茶偏好等,这些数据的获取都为本文奠定了扎实的研究基础。
从表 1的数据统计性描述情况来看,在10个地区调查获取的512 891个样本中,男性为41%,女性为59%,平均年龄约为51.5岁。在样本的受教育程度方面,小学和初中比例分别占32.2%和28.3%,在家庭年收入方面,超过1万元的家庭占总样本的71.8%,样本总体代表性较强。需要说明的是本文重点考察样本的饮茶行为,由于在涉茶选项上存在一些数据遗漏或逻辑错误的无效样本,在剔除这些样本后,本文后续的样本分析总数是512 824个。
2 中国茶叶消费现状分析
表 2列出的是不同地区城乡消费者饮茶频率高低的相关数据。通过对不同年龄消费者的饮茶频率进行统计,40~49岁消费者经常饮茶的频率最高,这一年龄层中约有34.4%的消费者经常饮茶,50岁以上消费者的经常饮茶率都基本维持在33.3%~34.1%,与40~49岁消费者的经常饮茶率并无显著差别。与之对应的是39岁以下消费者经常饮茶的比例最低,仅为 30.3%,这和现有大部分研究中年轻消费者饮茶比例较低的结论基本一致。但是在偶尔饮茶率方面,39岁以下消费者的偶尔饮茶率达到38%,在所有年龄段中比例最高,这一定程度上说明年轻消费者事实上有一定的饮茶行为,只是该饮茶行为并不能固化为真正持久的饮茶习惯,针对年轻群体的茶叶消费拓展,要考虑到增加其茶叶消费的粘性,提高其重复饮茶率。
表1 10个CKB项目地区研究对象基本特征Table 1 Basic characteristics of research objects in 10 CKB project areas
表2 全国不同地区饮茶频率的分布Table 2 Frequency distribution of tea drinking in different regions of China%
表3重点对不同年龄段内部不饮茶、偶尔饮茶和经常饮茶的结构性差异进行分析,并没有考虑到不饮茶、偶尔饮茶或经常饮茶消费者年龄上的分布差异。从表3可以看出,在经常饮茶的消费者中,比例最高的是50~59岁以及40~49岁两个年龄段,这两个年龄段是当前茶叶消费主要群体。随着年龄的不断增加,60~69岁和70岁以上消费群体经常饮茶的比例显著下降。偶尔饮茶的消费者主要以40~59岁年龄段为主,39岁以下消费者偶尔饮茶的比例甚至高于 60~69岁的消费者。尤其值得注意的是,在当前不饮茶的消费者中,其中 50~59岁年龄段比例最高,达到32.1%,其次分别为40~49岁和60~69岁的年龄段,而39岁以下年轻消费者仅占所有不饮茶消费者的12.3%。
进一步针对经常饮茶消费者饮茶习惯的形成年龄进行统计分析,得到图1。图1显示,全部样本中有 18 998个消费者的饮茶习惯主要形成于 20岁,占总体的 11.1%,此外,分别有9.6%和7.9%的消费者主要在18岁和30岁形成饮茶习惯。整体来看,38.5%的消费者主要在15~20岁年龄段形成饮茶习惯。这再次说明针对20岁以下的年轻消费者采取行之有效的营销手段和产品开发,从而将其培养成为具有饮茶习惯的消费者,对于中国今后进一步拓展国内茶叶消费,具有重要的现实意义和实践价值。
通过对中国茶叶消费者的饮茶特征进行全面系统的统计学分析,得到表4。从表4可见,目前中国茶叶消费的主体仍然为男性消费者,饮茶者中男性比例高达62.3%。在每周饮茶频率上,约78.3%的消费者基本每天饮茶。在饮用的茶叶种类中,绿茶和红茶分别占85%和10%,基本与中国不同茶类产量的分布保持一致。需要重点关注的是,从全国平均值来看,消费者每日饮茶的杯数达到4.2杯,但其每日更换茶叶次数却仅为0.6次,说明大多数茶叶消费者并不会频繁更换茶叶,这一定程度上验证了本文前述提出的问题,即以每日饮茶杯数来替代每日茶叶消费量,会导致研究结论有偏差,进而使得对茶叶消费的现状和趋势研判出现偏差。此外,消费者每次更换茶叶数量2.5 g,每日茶叶消费量 4.1 g,由于不同茶类如绿茶、乌龙茶和红茶每次投入量并不相同,如绿茶一般以3~5 g为准,乌龙茶一般以7~9 g为准,如果忽略茶类的区别,必然会导致茶叶消费量的统计会由于无法判断茶类区别而出现较大偏差。这使得茶叶消费的相关研究中必须尽可能将茶叶类别加以控制,以减少不同茶类消费数量上的差别对结果造成的影响。
表3 不同饮茶频率消费者的年龄分布Table 3 Age distribution of consumers with different tea drinking frequency%
图1 消费者形成饮茶习惯的年龄分布Fig. 1 Age distribution of tea drinking habits among consumers
表4 中国茶叶消费者的饮茶特征Table 4 Characteristics of tea drinking from Chinese tea consumers
3 影响中国茶叶消费的因素分析
3.1 模型和变量设置
基于以上分析,中国不同地区茶叶消费者在饮茶种类、饮茶历史、饮茶频率等方面都存在显著差异,需要从茶叶消费量的视角对中国茶叶消费展开研究。本文接下来的思路是首先从一个较长的维度(年),根据消费者一年中饮茶频率的高低,将消费者区分为不饮茶者、偶尔饮茶者和经常饮茶者,分析消费者饮茶习惯形成的影响因素;其次,对于经常饮茶者,再根据其每周饮茶天数的多少,将其分为轻度茶叶消费者、中度茶叶消费者和重度茶叶消费者,分析影响其饮茶频率高低的因素;再次是针对这些重度茶叶消费者,考虑到数据的完全可得性,分别以其每日茶叶消费量和饮茶杯数为因变量,测度不同因素对这二者的影响及其差异,以验证使用饮茶杯数替代茶叶消费量会导致研究结论有偏的假说。
本文所使用的模型是 OLS多元线性回归模型,其具体如下
其中y是因变量,xi是自变量,e是误差项,α是常数,通过回归后得到的βi是偏回归系数,反映的是在其他自变量保持不变的时候,xi每增加或减少一个单位时y的平均变化量。
在自变量的选择上,本文除了选择消费者的年龄、性别、城乡分布、家庭收入、受教育程度等因素,还将饮茶时间长短(饮茶历史)纳入模型,并同时将消费者工作性质、省份分布、饮用茶类、婚姻状况等做控制变量的设置,尽量降低不同茶类、不同地区、不同工作等因素对研究结果的影响。这样的控制变量设置在现有的其他茶叶消费研究中较少涉及,而CKB的数据为本研究展开这样的分析奠定良好基础。
在因变量的选择上(表 5),方程 1中选择消费者过去一年中饮茶频率的高低,并借鉴李夏等[24]的观点,将饮茶的习惯由弱到强分成不饮茶者、偶尔饮茶者和经常饮茶者,分别赋值0、1和2;方程2中以经常饮茶者每周饮茶天数的多少,对轻度茶叶消费者赋值为0,对中度茶叶消费者赋值为1,对重度茶叶消费者赋值为2;方程3和方程4中分别以重度茶叶消费者的每日饮茶杯数和每日茶叶消费量作为因变量带入。各个变量的统计分析如表5所示。
表5 模型变量统计分析Table 5 Statistical analysis of model variables
3.2 实证分析
表6显示了具体分析结果。其中方程1的回归结果显示,对于消费者是否会形成饮茶习惯,在控制了消费者的区域、职业和婚姻因素后,年龄、性别、城乡分布、家庭规模、受教育程度和家庭收入都显著影响消费者饮茶习惯的形成。消费者自身受教育程度和家庭收入与其经常饮茶显著正相关,年龄、性别、城乡分布和家庭规模与其经常饮茶显著负相关。这说明随着个体受教育程度提升和家庭收入增加,消费者会逐渐养成饮茶习惯,原因在于受教育程度增加,消费者对饮茶的益处会有更多的认知,进而带动其饮茶,而家庭收入增加会使其预算约束不断增加,推动其更多饮茶。
对于方程2,由于因变量是茶叶消费者每周饮茶频率,即已经将对象界定为具有饮茶行为的消费者,因此自变量中加入了饮茶历史的长短,同时在控制变量中加入了茶叶种类变量的虚拟变量。从回归结果来看,除家庭规模外,其他变量与饮茶者日常饮茶频率都具有显著相关性,其中性别、城乡分布、教育程度与日常饮茶频率呈负相关,年龄、家庭收入和饮茶历史与其日常饮茶频率呈正相关。这说明对于饮茶者来说,年龄越大、家庭收入越高和饮茶历史越长,其日常饮茶频率会更高,但来自城市、具有较高教育程度的女性其饮茶频率更低。可能的解释是来自城市、教育程度更高的女性具有更多的消费选择,虽然其日常也饮茶,但由于存在众多的替代品如咖啡和功能饮料,其对茶叶的依赖程度并不高。
方程3和方程4列出了影响茶叶重度消费者茶叶消费情况的相关因素,其中方程3选择消费者每日饮茶杯数作为因变量,而方程 4选择以消费者每日茶叶消费量作为因变量。回归结果显示,对于茶叶重度消费者的每日饮茶杯数、性别、年龄、家庭规模和受教育程度与每日饮茶杯数为负相关,城乡分布、家庭收入和饮茶历史与其每日饮茶杯数有显著的正相关。但从茶叶重度消费者每日茶叶消费量来看,性别、年龄、城乡分布与其茶叶消费量为负相关,受教育程度、家庭收入和饮茶历史与其每日茶叶消费量呈正相关。对比方程3和4的结果,二者间具有显著差异,从各影响因素回归系数大小来看,方程4中所有变量的系数都小于方程3,这从一定程度上验证了本文提出的假说,即使用每日饮茶杯数会夸大各个因素对茶叶消费影响。以饮茶历史长短为例,在其他因素保持不变的前提下,消费者饮茶历史每增加1年,其每日饮茶杯数增加0.025杯,但每日茶叶消费量仅仅增加 0.023 g,如果使用饮茶杯数,会使得饮茶历史长短对茶叶消费影响的估计值大出0.002个单位,夸大饮茶历史对茶叶消费的影响。从回归方程的R2来看,方程 4的R2达到 0.371,显著大于方程 3的0.259,这也说明方程 4拟合度更好,方程中所有自变量,对于消费者每日茶叶消费量变化的解释,相较于每日饮茶杯数会更有说服力。这也为今后茶叶消费行为调查问卷的设计提出了新的思路,即调查中应该尽可能以获取消费者每日茶叶消费量为主。
表6 模型回归结果Table 6 Results of regression model
从4个方程的结果来看,与其他的研究相比,本研究考察了饮茶历史长短这一因素,研究结论也显示饮茶历史长短对茶叶消费者的饮茶频率和每日饮茶量都具有显著的正向影响,饮茶时间越久,消费者饮茶频率和消费量越高,这与茶叶嗜好品的产品特性相吻合。此外,年龄与饮茶习惯形成和茶叶重度消费者每日茶叶消费量都呈负相关,这与现有大部分研究认为中老年群体是茶叶主要消费者的结论并不一致。原因在于本次调查样本中60岁以上群体不饮茶比率明显更高,可能的解释是随着年龄不断增加,对茶叶中咖啡因等物质的敏感性不断上升,进而可能会导致其失眠,一定程度上会降低饮茶倾向,即使是这些具有饮茶行为的老年茶叶消费者,也会随着年龄的增加不断减少茶叶消费量。
4 结论与启示
论文基于CKB的大样本数据,全面分析了中国茶叶消费的影响因素,对影响消费者是否饮茶、饮茶频率、每日饮茶杯数和茶叶消费量的因素做了科学的分析,得到如下结论:第一,家庭收入和饮茶历史对茶叶消费者的饮茶频率、每日饮茶杯数和茶叶消费量具有显著的正向影响,相较于男性,女性参与饮茶、饮茶频率都明显更低;第二,年龄对中国消费者形成饮茶习惯具有显著负影响,但对于饮茶者消费频率具有显著的正向影响,并与重度茶叶消费者每日饮茶量和每日饮茶杯数呈现负相关;第三,采用每日饮茶杯数分析消费者的茶叶消费行为,会导致结论存在较大偏差,更为合理的是使用消费者每日饮茶量;第四,大部分的茶叶消费者都是在 15~20岁之间形成饮茶习惯,这就需要采取针对性的市场营销和产品开发,以培养这一年龄段消费者的茶叶饮茶习惯。
以上结论揭示出中国茶叶消费需求的多样化和消费行为的复杂化。因此,今后对于中国茶叶消费的相关研究,首先不仅要根据消费习惯的有无,将消费者分为饮茶者和非饮茶者,还要根据饮茶频率的高低,将饮茶者分为轻度茶叶消费者、中度茶叶消费者和茶叶重度消费者,因为不同类型茶叶消费者饮茶行为的影响因素完全不同;其次对于茶叶消费行为的调查,以每日茶叶消费量来替代每日饮茶杯数,以减少一次投放多次续水的传统饮茶习惯对研究结论的影响。对于今后中国茶叶消费群体的市场拓展,一是要针对不同年龄段开发相适应的茶叶产品,如针对老年群体开发出低咖啡碱茶叶产品,针对年轻群体开发出便捷性茶叶产品;二是对年轻群体的饮茶习惯要尽早干预,加快15~20岁茶叶消费群体的培育,为中国今后茶叶消费稳步增长储备更多的“后备军”。
致谢:感谢所有参加CKB项目的队列成员和各项目地区的现场调查队调查员。感谢项目管理委员会、国家项目办公室、牛津协作中心和10个项目省、地区办公室的工作人员。
[1] 梅宇. 2016年中国茶业经济形势简报[J]. 茶世界, 2017(2):14-18.
[2] 管曦, 杨江帆. 中国城乡居民茶叶消费对比研究[J]. 茶叶科学, 2015, 35(4): 397-403.
[3] 管曦, 杨江帆, 谢向英, 等. 中国茶产业供求失衡的再思考—基于国内主要茶叶市场数据的分析[J]. 茶叶学报,2017(2): 75-79.
[4] 汤一, 黄韩丹. 杭州市区茶叶消费者特性之实证研究[J].茶叶科学, 2007, 27(4): 323-327.
[5] 张毓雄, 汤跃跃. 广东农村居民茶叶消费实证分析[J].茶叶科学, 2010, 30(6): 482-488.
[6] 管曦, 杨江帆, 谢向英, 等. 中国茶叶消费现状与消费行为的影响因素研究[J]. 茶叶科学, 2011, 31(6): 546-551.
[7] 姜友雪. 城市居民茶叶消费行为影响因素实证分析—基于广州调查数据[J]. 茶叶, 2013(3): 146-148.
[8] 陈富桥, 姜爱芹. 消费者产品知识、知识获取渠道与消费行为—基于杭州市 1803份居民茶叶消费调研数据[J]. 商业经济与管理, 2013(1): 52-57.
[9] 陈萍, 王宇婷, 管曦, 等. 福建省居民茶叶消费行为调查[J]. 林业经济问题, 2016(8): 369-372.
[10] 苏祝成, 童启庆. 我国国内市场茶叶需求弹性的估算[J].茶叶, 2001(03): 35-37.
[11] 孔玉屏, 汤一. 我国农村居民茶叶消费特点之实证分析[J].茶叶, 2006(4): 218-221.
[12] 张莉琴. 城镇居民茶叶消费行为分析—基于北京住户调查数据[J]. 中国农业大学学报(社会科学版), 2010(2):128-134.
[13] 许咏梅. 中国不同地区、城乡茶叶消费需求收入弹性比较研究[J]. 茶叶, 2016, 42(2): 65-72.
[14] 陈富桥, 姜爱芹, 姜仁华, 等. 城市居民茶叶消费收入弹性研究-基于扩展线性支出模型(ELES)的估计[J]. 中国食物营养, 2014(6): 46-49.
[15] 黄祖辉, 钱峰燕, 李皇照. 茶叶安全性消费特性分析[J].浙江大学学报(人文社会科学版), 2004(3): 21-26.
[16] 杨江帆, 刘宝玉, 管曦. 福州市消费者有机茶支付意愿及其影响因素分析-基于CVM的实证研究[J]. 福建农林大学学报(哲学社会科学版), 2011(3): 38-42.
[17] 陈富桥, 胡林英, 姜爱芹, 等. 城市居民茶叶质量安全风险认知与处理策略调查研究[J]. 食品安全质量检测学报,2017(5): 1914-1919.
[18] 陈富桥, 姜爱芹, 姜仁华, 等. 消费者茶叶质量安全标识认知度及支付意愿研究[J]. 食品工业, 2015(2):240-243.
[19] 刘佳佳. 网络与实体市场消费者茶叶购买意愿影响因素差异性分析[D]. 南昌: 江西农业大学, 2016.
[20] 王永青. 大学生饮茶意愿及其影响因素研究[D]. 福州:福建农林大学, 2016.
[21] Chen Z, Lee L, Chen J, et al. Cohort profile: the Kadoorie study of chronic disease in China (KSCDC) [J]. In J Epidemiol, 2005, 34(6): 1243-1249.
[22] Chen Z, Chen J, Collins R, et al. China Kadoorie Biobank of 0.5 million people: survey methods, baseline characteristics and long-term follow-up [J]. In J Epidemiol, 2011, 40(6):1652-1666.
[23] 李立明, 吕筠, 郭彧, 等. 中国慢性病前瞻性研究:研究方法和调查对象的基线特征[J]. 中华流行病学杂志, 2012,33(3): 249-255.
[24] 李夏, 吕筠, 郭彧, 等. 中国慢性病前瞻性研究:10个项目地区成年人群饮茶行为特征差异分析[J]. 中华流行病学杂志, 2015, 36(11): 1195-1199.