基于逐步回归模型的金银花价格影响因素实证分析
2020-06-12谢江霞
谢江霞
(万博科技职业技术学院,安徽 合肥 230031)
二十一世纪以来,我国人口老龄化现象日益加重,医疗卫生问题严峻,国家大力提倡发展传统医学和中医药产业。受到以上多方面因素的影响,全国中医药产品需求量大幅增加,极大地推动了中医药产业的发展。但问题也随之而来,市场上的中药材价格呈现出涨幅大、波动广、价格不稳定等问题,极大影响了中医药产业的健康发展。以金银花为例,金银花主要有山东省平邑县、河北省巨鹿县、河南省封丘县三大产区,其中山东平邑的金银花种植面积最大。由于其特有的抗炎、抗菌作用在治疗近年频繁出现的突发性、传染性类疾病上发挥了显著作用。这使得金银花在中药材市场上供需两旺,很多地方都在大规模推广种植金银花,市场价格也直线上升。出现这种毫无规律可寻的价格变动严重打击了从业人员的生产积极性以及对产业未来发展的预期,这也给金银花销售市场乃至整个中药产业埋下隐患,势必阻碍中医药产业的进一步发展。因此,本文选取平邑县金银花数据作为分析对象,以区位因素作为理论基础,构建逐步回归模型对该地金银花价格进行分析,以期对金银花产业的发展提供参考和借鉴。
区位因素是指促使区位地理特性和功能的形成和变化的原因或条件,这些原因和条件又被称为区位因子。根据区位因素本身的性质和状态,可分为自然因素、社会经济因素和技术因素[1],其中影响中药产业的主要区位因素主要可以分为自然因素和社会因素。本文通过整理近年来平邑县主要经济数据变化以及该地出产的金银花产地价格变动情况[2],建立逐步回归模型分析平邑县金银花产地价格的影响因素,分析平邑县社会因素变化对当地出产的金银花价格的影响效应,从而为从业者指导企业生产,保障中医药产业发展给出理论依据和数据支撑。
1 研究现状
当前阶段有关商品市场价格的影响因素研究主要集中在实证分析方面,其中张大勇等[3]运用时间序列成分分解法对国内农资价格的波动特征进行分析,并建立VAR模型,分析影响农资价格波动的主要因素。结果表明,农资价格大幅上涨最根本的原因是上游原料价格飚升,是一种成本推动的刚性上涨,需求因素的影响较小,且仅表现为短期影响。翟帅等[4]构建了包含银行利率、汇率、人口因素等变量的动态蛛网模型,以中部6省2003~2015年商品住宅数据为研究样本,分析住房市场的供求机制及价格波动特征,结果表明,中部6省房地产蛛网模型具有较强的发散性,房地产价格具有明显的外部性,政府在一定程度的调整可以保证房产市场的健康发展。屈小卜等[5]从非线性的角度实证分析了影响豆油价格波动的因素。结果表明:大豆和豆油价格在低迷、高涨和平稳状态下均产生正向效应,且在豆油市场低迷时,大豆价格对豆油价格的影响最为显著[5]。
在借鉴以上研究成果的基础上,采用2013~2018年平邑县主要经济数据,建立逐步回归模型,对平邑县金银花产地价格的影响因素进行分析,并总结以上分析的结果给出相关对策建议。
2 模型构建
2.1 概念界定
逐步回归模型(Stepwise regression model)是一种线性回归模型自变量选择方法,其基本思想是将变量一个一个引入,引入的条件是其偏回归平方和经验是显著的[6]。同时,每引入一个新变量后,对已入选回归模型的老变量逐个进行检验,将经检验认为不显著的变量删除,以保证所得自变量子集中每一个变量都是显著的。此过程经过若干步直到不能再引入新变量为止。这时回归模型中所有变量对因变量都是显著的。
2.2 指标选取
中药材金银花具有明显的农产品特征,其价格的变动十分契合时间序列数据的一般规律,因此本文采用逐步回归分析模型对金银花的价格变动进行实证分析。参考前人的研究成果,选取了2013~2018年平邑县金银花产地价格(CDJG)、第一产业产值(CYCZ)、农业增加值(NYZJ)、工业总产值(GYCZ)、固定资产投资(GDTZ)、农民专业合作社个数(NMHZ)、公路里程数(GLLC)、居民收入(JMSR)和常住人口数(CZRK),分析以上数据对平邑县金银花产地价格的影响情况,部分数据如表1所示。
表1 2013~2018年平邑县经济数据
对比3大主要产地可以发现,相对于其他两大主要产地而言,平邑县金银花产地价格波动较小,稳定性较高。选取该产地价格作为模型参数,也可以较好地剔除游资炒作以及其他外界因素的干扰,从原始数据层面上提高模型的精确度(图1)。
图1 不同产地金银花价格变动情况
2.3 数据来源
本文所使用的数据主要来源于山东省统计年鉴、中药材天地网、平邑县统计局以及平邑县国民经济和社会发展统计公报。
2.4 模型的一般形式
逐步回归法选择变量的过程包含两个基本步骤:一是从回归模型中剔出经检验不显著的变量;二是引入新变量到回归模型中,常用的逐步型选元法有向前法和向后法。其构建方法是变量由少到多,每次增加一个,直至没有可增加的变量为止。具体步骤如下:
步骤1:对P个回归自变量X1,X2,…,Xp分别同因变量Y建立一元回归模型
Y=β01+βiXi+εi=1,…,P
步骤3:考虑因变量对变量子集{Xi1,Xi2,…,Xk}的回归重复步骤2。
依此方法重复进行,每次从未引入回归模型的自变量中选取一个,直到经检验没有变量引入为止。向前逐步回归分析与上述正好相反,本文采用向前逐步回归分析法处理数据。
2.5 数据的预处理
时间序列数据按其统计学特性可分为平稳性序列和非平稳性序列,由于逐步回归模型仅适应于对平稳性序列数据的处理,同时为了去除量纲不同可能带来的共线性问题,因此在建立模型前需要进行取对数处理以及平稳性检验,对不满足平稳性的数据进行差分处理[7]。检验结果如表2。
表2 数据平稳性的ADF检验
由表2可知,经过取对数处理后的数据经过差分处理其P<0.05,说明除居民收入为二阶差分平稳数据以外,其他数据均是一阶差分后的包含截距项和时间趋势项的平稳数据,满足构建统计模型的要求。
2.6 逐步回归模型
2.6.1 模型参数确定 数据通过以上检验后,可以建立以产地价格(CDJG)为自变量,以其他数据为因变量的逐步回归模型,进而考察各个因素在模型中的影响作用和大小。在本文构建的逐步回归模型中,以0.5/0.5为检验精确度对因变量数据进行相关性检验,检验结果如表3,其中C项为截距项。
表3 逐步回归模型具相关性的参数检验
由表3可知,NYZJ、ZZMJ(农作物种植面积)、CL(农作物产量)、CYCZ(第一产业产值)、GDTZ、GYCZ这六个数据对CDJG具有显著相关性,其中NYZJ(农业增加值)、ZZMJ(农作物种植面积)、CYCZ、GYCZ对产地价格具有正向作用,而CL、GDTZ对产地价格具有反向作用,其他数据在0.5/0.5检验精度下无明显统计学相关性。
2.6.2 模型精确度 模型精确度数据如表4所示,可知,建立的逐步回归模型R2为0.884 757,调整后的R2为0.871 952,精确度较好。
表4 逐步回归模型精确度数据
由上述参数可获得模型的表达式为:
CDJG=C(1)+C(2)*NYZJ+C(3)*ZZMJ+C(4)*CL+C(5)*CYCZ+C(6)*GDTZ+C(7)*GYCZ=-312.005 258 877+0.985 101 266 394*NYZJ+25.711 240 474 6*ZZMJ-11.776 269 585 9*CL+1.763 852 353 18*CYCZ-0.831 236 630 532*GDTZ+4.864 569 844 23*GYCZ
2.7 价格预测
根据文中获得的统计学模型,可以对金银花价格进行预测。并以平邑县金银花产地价格数据对模型进行拟合,最后获得的预测结果见图2。
观察价格预测图可知,实际值和预测值之间的拟合度较好,整体差异不大,证明本文建立的逐步回归模型在影响参数的选择和模型方法的建立都比较合适,符合本文模型构建的预期。
图2 逐步回归模型的金银花价格预测
2.8 结果分析
由构建的逐步回归模型结果分析可知,山东省临沂市平邑县金银花的产量和价格波动幅度较小,市场影响对价格的作用也十分明显。 其中2014-2017年期间预测较为准确,而2018年之后的预测出现了一定程度的偏差,通过研究相关市场环境发现,其主要原因可能是政策变动所导致的,因为从2018年开始,全国都在推广金银花国标化,而金银花的特性是头茬花很容易达国标,越往后期,金银花的有效物质含量越低,因此国标货在金银花总份额中只占三分之一左右,而金银花的生产周期是五月份产新,正好符合金银花价格实际值在4-7月份波动巨大。
3 结语
3.1 结论
从区位因素的角度分析平邑县金银花价格的影响因素组成,运用逐步回归模型对主要影响因素及其作用强弱进行实证分析,讨论了金银花价格与生产环节、加工环节、销售环节的作用关系。
一、由构建的逐步回归模型结果分析可知,农业增加值、农作物种植面积、第一产业产值、工业产值对产地价格具有正向作用,即以上参数的增加可以推动金银花产地价格的增加;而农作物产量、固定投资对产地价格具有反向作用,即上述参数的增加可以导致金银花产地价格的降低。以上数据中除固定投资的反向作用外,其他均符合经济学常识和模型预期。
二、通过政府网站查询平邑县政府公报,获得平邑县的固定投资情况相关数据如表5所示,通过分析平邑县三大产业投资占比情况可知:
(1) 第一产业固定投资所占总投资份额太小。查询政府公报可知,平邑县第一产业固定投资历年仅占同期三大产业固定投资总额的0.3%~1.2%,影响作用十分局限。
(2) 第一产业固定投资的增速不稳定。由表5可知,虽然平邑县的总体固定投资是稳定增长的,但其中第一产业的增速却忽高忽低,甚至有负增长的时期。本文认为以上两种情况的共同作用导致了固定投资与产地价格之间在模型中表现出反向作用。
表5 平邑县三大产业固定投资增速
3.2 不足之处
通过建立逐步回归模型对金银花价格进行预测,结果表明模型精确度较高,预测结果符合预期,对实际生产具有指导作用。但仍存在一定问题,主要有以下几个方面:
1.将中药材金银花价格作为时间序列数据,在保证模型精确度的前提下降低了寻找和分析主要价格影响因素的繁重任务,但同时也忽视了如种植周期、上市季节和政府政策等因素的影响,降低了模型的可信度。
2.由价格预测图可知,2014~2017年预测结果较为准确,2018年之后的数据就出现较明显的偏差,这也证实了该模型忽视了外部因素的影响,一旦外部因素有变,就会很大程度地影响模型预测的准确程度。