基于产业链视角的林产品百度指数动态关系研究
2021-07-08韩锋赵荣宁攸凉
韩锋 赵荣 宁攸凉
摘 要:通过建立2011年1月—2019年12月的百度搜索指数时间序列,应用向量自回归模型,分析以“木材+原木+锯材”等为代表的上游林产品、以“板材”为代表的中游林产品、以“地板+家具+木门”等为代表的下游林产品的百度搜索指数之间的动态关系。研究结果显示:从百度搜索指数角度看,上游林产品主要受到自身及外部因素的影响,受下游产业链影响较小;中游林产品短期受上游林产品的影响较大,长期则受自身及外部因素的影响;下游林产品受上游产业链影响非常小,主要受到自身及外部因素的影响。研究建议:针对木材等原材料市场,市场观察者应更加关注自身市场和下游板材市场;针对以“板材”为代表的中间产品市场,市场观察者应更加关注自身市场和上游木材原料市场;针对家装等终端市场,市场观察者应更加关注产业链外部环境影响。
关键词:人造板;木质家具;产业链;百度指数;向量自回归模型
基金项目:中国林业科学研究院基金专项“我国林业科技需求分析研究”(CAFYBB2019MC003);国家社会科学基金项目“天然林全面商业禁伐背景下中国木材安全风险及其防范研究”(17BGL248)。
[中图分类号] F302.4 [文章编号] 1673-0186(2021)004-0063-012
[文献标识码] A [DOI编码] 10.19631/j.cnki.css.2021.004.006
庞大的网络搜索数据与现实的社会行为具有强相关性[1],通过搜索数据的挖掘分析能够准确预测公众需求变化,对指导和调控社会经济活動具有重要意义[2-3]。Google Trend和百度指数(Baidu Index)是全球最重要的搜索数据平台,其运作机制都是基于海量网民搜索日志,获取关键词一定时间内被搜索频次、趋势,进而反映事件热点。Google Trend和百度指数研究已经广泛应用于旅游行业[4-6]、交通运输行业[7]、股市投资金融领域[8]、期刊评价[9]、农业管理[10]等领域,通过对研究对象网络关注情况进行分析,并结合实际情况进行判断,进而指导经济决策。研究利用百度指数分析上游(原木、木材)、中游(板材)、下游(木质家具)林产品的百度指数时间特征,通过向量自回归模型(VAR模型)对其百度指数的相互传导进行时间序列分析,并结合现实林产品市场变化,分析林产品百度指数的变化内因,为林产品市场行为预测、指导和调控提供一定的理论参考。
一、文献综述
我国是全球林产品生产加工和贸易大国,锯材、人造板、地板等年产量均为世界第一,2019年林产品进出口贸易额达到1 600亿美元[11-12]。作为一项传统产业,林业生产制造环节从原材料一直到终端产品已经形成了完整的产业链,全产业链研究也成为林业产业研究的重要视角,如林业产业链的形成机制[13]、林业生态产业链稳定条件[14]、林产工业产业链效率[15]、林业产业集群[16]。尽管全产业链研究已经取得了丰硕的成果,但从单产品产业链出发的研究相对较少,且主要集中在林纸产业、人造板产业、木质地板产业等相对闭合的产业[17-19]。
在林业产业中,用材林成熟后采伐得到原木、锯材等初加工产品,再加工为人造板,人造板再广泛用于建筑、家具等终端产品,即从木材到人造板,从人造板再到以人造板为原料的木质产品,是非常重要的产业链[13,15,20],这些产品按照关联顺序可分为上游(原木、木材)、中游(集成材、人造板)、下游(木地板、木结构建筑、木门窗家具等)环节,即原材料、中间产品、终端产品。这条产业链贯通资源市场、流通市场、生产市场、需求市场和服务市场[13]。这条产业链相对辐射广且闭合不严,使其针对性研究相对较少,因此开展针对性研究,是对林业产业链研究的重要补充。
百度是全球最大的中文搜索引擎,2019年在我国市场占有率高达67.09%,对我国市场的搜索占有率和中文搜索算法均具有显著优势[21]。尽管如此,大数据和林产品市场的研究结合仍然有诸多发展的空间,目前利用网络信息大数据研究林产品市场仍相对较为空白。因此,通过互联网大数据分享平台,探索大数据技术在林产品市场预测、指导和调控的应用具有重要的理论意义。
二、研究方法
从产业链视角出发,对上游(原木、木材)、中游(集成材、人造板)、下游(木地板、木结构建筑、木门窗家具等)林产品的百度搜索指数构建向量自回归模型(VAR模型)。
(一)百度指数
百度指数是以百度海量网民行为数据为基础的数据分享平台,是当前互联网乃至整个数据时代最重要的统计分析平台之一,能够展示某个关键词在百度的搜索规模、一段时间内的热度涨跌态势以及相关的新闻舆论变化。百度指数的主要功能模块有:搜索指数、需求图谱、资讯指数、媒体指数等,分别用于针对性分析词条的搜索时间特征、地域分布、人群属性等特征。
利用百度指数中的“搜索指数”功能分析我国主要林产品网络关注度时间特征研究,并通过中心词的“需求图谱-相关词分类”进行中心词扩充。搜索指数是以网民在百度的搜索量为数据基础,反映关键词在百度的搜索规模及一段时间内的热度涨跌态势,代表了网络关注度。“需求图谱-相关词分类”是反映搜索中心词之前和之后还有哪些搜索需求,它通过相关程度排序得出来源相关词和去向相关词。
搜索指数包括PC端和移动端搜索指数。PC端趋势积累了2006年6月至今的数据,而移动端趋势展现了从2011年1月至今的数据,为了保证统计指标的一致性,将PC端无法匹配移动端的数据进行剔除,以月为单位,分析我国林产品2011年1月至2019年12月的每月百度搜索指数变化。
(二)向量自回归模型
向量自回归模型简称VAR模型,是基于数据的统计性质建立模型,VAR模型把系统中每一个内生变量作为系统中所有内生变量的滞后值的函数来构造模型,从而将单变量自回归模型推广到由多元时间序列变量组成的“向量”自回归模型。VAR模型是处理多个相关经济指标的分析与预测最容易操作的模型之一,近年来VAR模型受到越来越多的经济工作者的重视。不含外生变量的VAR模型的一般数学形式如下:
VAR模型的建立主要分为以下步骤:第一,进行单位根检验,检验时间序列是否为平稳序列,因非平稳序列在回归分析中存在伪回归,只有平稳序列才能进行VAR建模;第二,滞后阶数的确定;第三,格兰杰因果关系检验,用于检验内生解释变量的滞后值是否对被解释变量具有显著性影响,若没有通过检验,则没有统计学意义;第四,通过最大特征根是否小于1检验模型稳定性。
通过以上检验即可进行脉冲响应分析和方差分解分析,脉冲响应和方差分解是对内生变量相互作用关系的分析,脉冲响应分析是一个内生变量的冲击对其他内生变量带来的影响,方差分解分析是一个内生变量的变化受模型内各内生变量冲击所作的贡献度。
(三)数据的选取
从产业链视角出发,对上游(原木、木材)、中游(集成材、人造板)、下游(木地板、木结构建筑、木门窗家具等)林产品进行数据选取。首先,选择木材、人造板,地板分别作为上游、中游和下游林产品的中心词。然后,利用百度指数的“需求图谱-相关词分类”功能对中心词进行词条扩充,根据扩充结果,并结合产业链产品分类,确定关键词。
通过以上步骤,确定上游林产品选择“木材+原木+锯材”3个词条;中游林产品中选择“人造板+木板+板材+刨花板+纤维板+胶合板+木工板+颗粒板+密度板”9个词条;下游林产品中选择“地板+木家具+木门”3个词条。
最后,通过百度指数的“搜索指数”功能对以上15个词条进行搜索,并按照上游林产品、中游林产品、下游林产品分组进行加权,进而获得2011年1月—2019年12月的上游林產品、中游林产品、下游林产品3类产品的每月的百度搜索指数。
三、结果分析
通过描述性统计分析和向量自回归模型分析,研究上游(原木、木材)、中游(集成材、人造板)、下游(木地板、木结构建筑、木门窗家具等)林产品的百度指数特征和其之间的相互影响。
(一)描述性统计分析
上游林产品:2011年1月到2019年12月间,上游林产品的百度搜索指数9年间总体保持平稳(见图1)。具体来看,2013年最低,搜索指数为797,2018年最高达到1 094,其他各年也均在800~1 100之间范围,其中,在2011年3月底、4月初,2018年7月中旬至9月上旬达到峰值,搜索指数均超过1 500,之后有所下降。
中游林产品:2011年1月到2018年12月间,中游林产品的百度搜索指数8年间总体稳步上升(见图2)。从2011年的3 002增长到2017年的6 227,2018年后有所下降,下降至2019年的4 747。
下游林产品:2011年1月到2019年12月间,下游林产品的百度搜索指数9年间呈现先增高再降低的变化趋势(见图3),其中在2012年9月至2012年底达到高峰,搜索指数超过10 000,随后逐渐回落,2018年后逐渐下降,到2019年12月下降到最低点2 000。
从外部因素影响的角度看,林产品的百度搜索指数受国家宏观调控、房地产新政、环保督察、世界原木出口限制等因素影响。
第一,市场环境的影响。2010年后,受世界经济及我国经济结构转型升级低迷的影响,国家陆续出台很多拉动内需的新政策,同时房地产市场调控政策频出,国内CPI指数变化较为频繁,进而带动木材加工产量和市场需求量的变化。但是,近几年我国经济进入新常态,经济下行压力比较大,这也同样作用于林产品市场,如2014年以来,以下游林产品为代表的家装市场网络关注度逐年降低。
第二,国内采伐政策的变化。2011年国家启动第二轮天保工程,调减了黑龙江、吉林、内蒙古和大兴安岭天然林木材产量690万立方米,国产东北大径材供给进一步减少。2015年天然林全面停止商业性采伐,国内木材原料短缺,给原材料市场供给端带来显著的影响。
第三,逐渐严苛的环保政策。我国林产品市场,特别是中游的板材制造业面临着节能减排等环保新政的影响,其中廊坊、邢台、菏泽、临沂、沭阳这几个板材基地的产量大约占中国板材市场的70%,2017年9月中央环保督察组对山东临沂、日照、青岛等地的木材加工企业进行环保督察,95%的木材加工企业被临时停产整改,2018年3月山东临沂的环保督察“回头看”,也引发社会强烈关注。
第四,国外原木禁出口政策进一步收紧。包括俄罗斯的桦木原木出口、加蓬的高山巴花的禁伐、马来西亚全面禁止橡胶木采伐,也对我国林产品市场带来一定的影响。
(二)VAR模型分析
将上游林产品搜索指数设为变量SYBI;将中游林产品搜索指数设为变量ZYBI;将下游林产品搜索指数设为变量XYBI。通过建立VAR模型,对上、中、下游林产品的搜索指数的动态关系进行分析。
1. 建立模型
(1)单位根检验
ADF单位根检验有三种模型,检验顺序是从(C,T,K)开始,如果平稳则结束检验;如果不平稳,则检验(C,0,K),如果平稳则结束;如果不平稳,则检验(0,0,K),如果平稳则结束,如果不平稳则说明变量不平稳。其中,C代表截距项,T代表趋势,K代表滞后阶数。通过ADF单位根检验,结果显示,上、中、下游林产品搜索指数的ADF值分别小于1%、5%、10%的临界值,即通过了1%、5%、10%的检验,均为平稳序列,具备VAR建模条件(见表1)。
(2)确定最优滞后阶数
通过最优滞后阶数检验,得到LR统计量、赤池信息准则AIC以及施瓦茨准则SC等指标,根据AIC、SC最小值的判断准则,序列最优滞后阶数为1阶或2阶,此时再根据LR值越小越优原则,选择2阶更为恰当。因此,序列VAR模型的最优滞后阶数确定为2阶(见表2)。
(3)模型稳定性检验
只有VAR模型通过了稳定性检验,后面所做的分析才是有效的。根据所有的AR根都位于单位圆内,VAR模型稳定(见图4)。
(4)格兰杰因果关系检验
格兰杰因果关系检验是一种外生性检验方法,用于检验内生解释变量的滞后值是否对被解释变量具有显著性影响。如果解释变量的滞后值对被解释变量没有显著性影响,则VAR模型不具有统计学意义。此外,值得注意的是,格兰杰因果关系检验反应的是时间序列数据的动态关系,具有统计学意义,但是真正因果性的判据仍需结合经济学理论分析。
从表3中可以看到,在格兰杰因果关系检验中,SYBI为被解释变量时,ZYBI和XYBI分别通过了显著性1%和5%的检验,拒绝模型设定的没有因果关系的原假设;ZYBI为被解释变量时,SYBI和XYBI分别通过了显著性水平5%和10%的检验,拒绝模型设定的没有因果关系的原假设;XYBI为被解释变量时,SYBI和ZYBI均没有通过显著性水平10%的检验,不能拒绝模型设定的没有因果关系的原假设。
因此,综上所述,根据模型检验结果,下游林产品、中游林产品的搜索指数的滞后值对上游林产品搜索指数有显著性影响,具有预测能力;上游林产品、下游林产品的搜索指数的滞后值对中游林产品搜索指数有显著性影响,具有预测能力,即上游林产品和中游林产品的搜索指数相互影响,下游林产品的搜索指数变动对上游林产品和中游林产品的搜索指数变动具有单方向影响。
2.脉冲响应和方差分解分析
根据格兰杰因果关系检验结果,上游林产品和中游林产品的搜索指数相互影响,下游林产品的搜索指数对上游林产品和中游林产品的搜索指数产生单方向影响。因此,脉冲响应分析和方差分解分析只针对上游对中游林产品的搜索指数、中游对上游林产品的搜索指数、下游对上游林产品的搜索指数、下游对中游林产品的搜索指数共4个关系做进一步研究。脉冲响应反映了模型中每个内生变量对误差扰动冲击的反应程度。
从图5-1中看,ZYBI的脉冲对SYBI的影响,从开始为逆向,到第2期达到逆向影响最大,到第3期后为正向,在第5期达到正向最大化后降低并趋于收敛。说明中游林产品搜索指数的增加会对上游林产品产生明显的正向作用,随着滞后期的延长,作用会越来越弱。
从图5-3中看,SYBI的脉冲对ZYBI的影响为正向,随着滞后期的延长而降低并趋于收敛。说明上游林产品搜索指数的增加也会对中游林产品产生一定的正向作用,但是长期这种正向作用也会越来越弱。综合来看,两者相互产生正向的影响,随着滞后期的延长影响逐渐减小。
从图5-2和图5-4中看,XYBI的脉冲对SYBI和ZYBI影响的形状较为接近,第2期后变为逆向,第5期达到逆向影响最大后随着滞后期的延长趋于收敛。这说明下游林产品搜索指数的变化会对上游林产品和中游林产品搜索指数产生一定的逆向效应。
方差分解是分析每一个结构冲击对其他内生变量的影响程度,通过方差分解反映冲击的贡献度。从表4中可以看到:
上游林产品搜索指数(SYBI)主要受到自身波动的影响,随着滞后期的延长,到第6期后,中游林产品搜索指数(ZYBI)和下游林产品搜索指数(XYBI)的影响才逐渐显现,但是第10期后,上游林产品搜索指数(SYBI)自身的方差贡献度仍然超过80%,中游林产品搜索指数(ZYBI)的方差贡献度不足20%,而下游林产品搜索指数(XYBI)的方差贡献度不足1%,并已经趋于稳定。这说明上游林产品搜索指数受中游林产品搜索指数的影响相对较大,但迟滞性显著。
中游林产品搜索指数(ZYBI)主要受自身和上游林产品搜索指数(SYBI)影响,前3期主要受到上游林产品搜索指数(SYBI)的影响,第3期后主要受到自身影响,到第9期,自身的方差贡献度达到60%,上游林产品搜索指数(SYBI)的方差贡献度仍然超过30%,而下游林产品搜索指数(XYBI)的方差贡献度不足10%。这说明中游林产品搜索指数短期内受上游林产品搜索指数的影响大,长期内受自身影响大。
下游林产品搜索指数(XYBI)第2期后,自身的方差贡献度已经超过90%,并趋于稳定。说明下游林产品搜索指数主要受自身影响,受到其他内生变量的影响非常小。
(三)结果讨论
基于百度搜索指數,利用VAR模型以月为单位,对2011年1月至2019年12月上、中、下游林产品,即林产品原材料、中间产品、终端产品的时间序列之间的动态关系进行了分析,根据格兰杰因果关系检验,下游林产品、中游林产品的搜索指数的滞后值对上游林产品搜索指数有显著性影响,具有预测能力;上游林产品、下游林产品的搜索指数的滞后值对中游林产品搜索指数有显著性影响,具有预测能力。
通过脉冲响应和方差分解分析可以得出:上游林产品,即“木材+原木+锯材”等林产品原材料市场主要受到自身及外部因素的影响,受下游产业链影响较小,其中板材等中间产品具有一定的影响,并具有滞后性。结合前文的描述性统计分析,在2011年上半年、2015年中、2018年下半年产生三个高峰,其中2011年国家启动第二轮天保工程,调减了黑龙江、吉林、内蒙古和大兴安岭天然林木材产量690万立方米,国产东北大径材供给进一步减少,但是2011年1—6月原木进口量同比增长24.83%,木材市场交易活跃。2015年天然林全面停止商业性采伐,木材原料短缺。2018年,在国家宏观调控、房地产新政、环保督察、世界原木出口限制、原材料和人工成本上涨等因素影响下,我国木材价格在2018年下半年达到峰值,同时国外原木禁出口政策进一步收紧,包括俄罗斯的桦木原木出口、加蓬的高山巴花为期6个月的禁伐、马来西亚全面禁止橡胶木采伐,国内木材需求增加,供给减少,导致木材价格上涨。这些都导致了上游林产品原材料搜索指数的高峰。
中游林产品,即以“板材”为代表的中间产品市场受上游原材料的影响较大,长期则受自身及外部因素的影响。结合前文的描述性统计分析,从短期看,在原材料市场的传统淡季,板材等中间产品市场较为冷淡,如每年的7—9月,在这最热的季节大部分伐木工人选择休息,导致工人工资大幅度上涨,木材原材料的价格也随之上涨;此外7—9月属于多雨季节,运输成本增加,同时多雨季节运输和人造板容易受潮,进而产生变形、发霉,为了节约成本、避免人造板受潮带来的损失,大部分客户会选择在这个时候停止采购。从长期看,近20年来中国人造板产业高速发展,生产、销售、技术水平、产品质量和经济效益都得到了全面提高,据FAO统计,我国是世界人造板生产、消费和进口贸易第一大国,人造板产业已在中国林产品产业中占据举足轻重的位置。根据国家林业和草原局的统计数据,2011—2019年,人造板行业总资产稳定增长,企业数量基本持平,行业销售毛利率和净利润率稳定小幅增长。
下游林产品,即“地板+家具+木门”等终端林产品市场受上游产业链影响非常小,主要受到自身及外部因素的影响。结合前文的描述性统计分析,终端林产品与市场环境,特别是房地产行业变化息息相关。2010年后,我国经济增长承压,GDP增长率保持在6.5%~7%之间,所以导致下游林产品市场整体较为平稳。但是,2012年下半年,由于原材料涨价、家具出口退税率下调、人工和销售成本增加等各种原因,家具和家装的价格出现了新一轮上涨,与2011年同期相比,木制家具的价格涨幅超过10%。此外,对未来木材供应紧张、价格上涨的预期,国内家具和家装业所面临的是持续而巨大的成本压力,这也导致了2013年第四季度下游林产品搜索指数的高涨。此外,2018年的房地产新政、环保督察也对终端的家装市场产生不良影响,影响了市场信心,进而导致2018年以来搜索指数的下降。
四、结论与启示
综上,林产品的网络关注度具有明显的时间差异,其间的动态变化具有内在的影响,通过林产品网络关注度时间序列特征分析,对林产品市场的预测具有重要启示。
从产业链角度看,木材等原材料市场与自身市场和中游板材市场相互影响较大,值得市场观察者给予更多观察,而家装等终端市场与原材料市场和板材市场相互影响不大,更多受到自身市场惯性和产业链外部环境影响。
从网络关注度的角度来看,基于大数据的网络关注度对产品市场具有一定的“预兆”功能,及时把握网络关注度,可以对未来市场行为进行预判,也可以根据关注度情况,对产业的优化布局和营销产品提出针对性的措施。
参考文献
[1] GINSBERG J, MOHEBBI M H, PATEL R S, ect. Detecting influenza epidemics using search engine query data[J]. Nature: International Weekly Journal of Science, 2009, 457(7232): 1012-1014.
[2] 李霞,曲洪建.邮轮旅游网络关注度的时空特征和影响因素——基于百度指数的研究[J].统计与信息论坛,2016(4):101-106.
[3] 刘建.大数据背景下税收治理中的隐私权保护问题[J].重庆社会科学,2019(12):45-56.
[4] DAVIDSON A P, YU Y. The internet and the occidental tourist: Ananalysis of Taiwan's tourism websites from the perspective of west-ern tourists[J]. Information Technology and Tourism, 2005, 7(2): p.91-102.
[5] 吴妙薇,张建国,崔会平,等.诸葛八卦村游客行为特征与旅游体验评价研究——基于百度指数和网络文本分析[J].中国农业资源与区划,2019(12):259-267.
[6] 孫烨,张宏磊,刘培学,等.基于旅游者网络关注度的旅游景区日游客量预测研究——以不同客户端百度指数为例[J].人文地理,2017(3):152-160.
[7] 孙阳,张落成,姚士谋.长三角城市群“空间流”网络结构特征——基于公路运输、火车客运及百度指数的综合分析[J].长江流域资源与环境,2017(9):1304-1310.
[8] 陈植元,米雁翔,厉洋军,等.基于百度指数的投资者关注度与股票市场表现的实证分析[J].统计与决策,2016(23):155-157.
[9] 王术.基于百度指数核心期刊影响后效应的分析[J].中国科技期刊研究,2015(1):82-85.
[10] 王军华.基于百度指数的“互联网+农业”公众关注度空间自相关分析[J].中国农业资源与区划,2020(4):325-330.
[11] 国家林草局.2019年全国林业产业总产值7. 56万亿元[EB/OL].[2020-01-03]. http: //www. gov. cn/xinwen/2020-01/03/content_5466218. htm .
[12] GARZUGLIA M. 1948-2018 Seventy years of FAO's Global Forest Resources Assessment[R]. Rome: Food and Agriculture Organization of the United Nations, 2018.
[13] 郭承龙,郭伟伟,郑丽丽.林业产业链的形成机制探析[J].林业经济问题,2009(1):56-60.
[14] 曲丽丽,田国双.林业生态产业链的稳定性分析与政策建议[J].东北农业大学学报(社会科学版),2010(6): 46-49.
[15] 李英,刘广丹,龚敏,等.重点国有林区森林资源管理及其产业链发展趋势分析[J].林业资源管理,2016(2):8-13+24.
[16] 洪燕真,戴永务.林业产业集群企业网络结构与创新绩效的关系——基于福建林业产业集群的调查数据[J].林业科学,2015(11):103-112.
[17] 王珊珊,杨红强.基于国际碳足迹标准的中国人造板产业碳减排路径研究[J].中国人口·资源与环境,2019(4):27-37.
[18] 向中华,刘高峰,曾胜.基于灰色-模糊理论的森林木质地板生态产业链优化评价研究[J].四川师范大学学报(自然科学版),2012(4):573-576.
[19] 张智光.林纸循环经济系统的资源、生态和价值链拓展模型[J].中国人口·资源与环境,2012(12):46-53.
[20] 郭承龙,张智光,杨加猛.林业低碳产业链的共生系统动力解析[J].南京林业大学学报(自然科学版),2016(6):92-96.
[21] 前瞻产业研究院.2019年中国搜索引擎行业市场竞争格局分析 百度仍是行业龙头、PC市场双雄并立[EB/OL]. https: //bg. qianzhan. com/trends/detail/506/200212-f8c7fb7b. html.(2020-2-12/2020-2-20)
(责任编辑:丁忠兵)