基于BP神经网络模型的中国棉花产业风险预警研究
2017-11-04贾肖月崔元培孙金生卢秀茹
贾肖月,崔元培,孙金生,卢秀茹
(河北农业大学,河北保定071000)
基于BP神经网络模型的中国棉花产业风险预警研究
贾肖月,崔元培,孙金生,卢秀茹*
(河北农业大学,河北保定071000)
由于棉花种植面积减少、种植成本上升、质量下滑、粮棉争地严重、价格波动频繁、国外市场压迫等诸多因素的影响,中国棉花产业出现高消耗和高库存并存现象,供需结构严重失衡。从供给、需求和国际市场3个角度出发,以棉花市场价格波动率作为棉花产业风险的预警指标,选取了12个指标构建了中国棉花产业风险预警指标体系。运用反向传输神经网络分析了2005―2015年的样本数据,并对2015年的样本数据进行拟合,拟合结果良好,从而将2016―2018年预测数据代入模型中进行棉花产业风险预测。结果表明,中国棉花产业风险预警指数呈现上升趋势,尤其2017年和2018年棉花产业存在高风险。
棉花;产业风险;风险预警;BP神经网络模型
1 研究概况
近年来,产业风险预警已成为学者研究的热点,多采用反向传输(Back propagation,简称“BP”)神经网络[4]、自回归移动平均模型(Auto-regressive and moving average model,简称“ARMA 模型”)[5]、层次分析法(Analytic hierarchy process,简称“AHP”)[6]等,其中卢秀茹等设计了基于信息技术的棉花风险预警体系,并选择棉花价格作为预警系统的关键控制变量,利用信息技术规避棉花生产和经营风险[3]。吴清华等以油菜籽收购价格的波动率作为油菜产业市场风险预警指标,运用BP神经网络模型进行实证研究[7]。张淑荣等运用主成分分析法构建了我国棉花产业安全指标体系和评价模型[8]。张利庠等利用协整检验、Granger因果分析等方法对棉花产业链上的各项指标进行实证研究[9]。白燕飞等以中国乳制品进口数量、进口价格、国内产业影响指数构建了中国奶牛产业损害预警指标体系,利用BP神经网络模型表明了奶牛产业损害预警指数呈下降趋势[10]。众多学者在一定程度上对中国棉花产业进行深入研究和综合评价,但并未量化棉花产业未来面临的风险,也未对未来情况做出预警。李亚兵等利用BP神经网络模型对中国棉花生长指数的6个特定向量进行分析模拟,并对棉花单产进行预测和评估[4]。王伟等采用2-6-1拓扑结构的BP神经网络对1种水分校正和温度补偿的棉花水分检测装置进行分析,消除了温度变化对水分测量值的影响[11]。王伟国等基于EMD的BP神经网络预测了我国棉花期货价格[12]。BP神经网络模型是1种较为成熟的风险预警方法之一,在棉花产业风险预警的应用仍处于起步阶段。笔者从棉花产业风险预警体系的构建、BP神经网络模型的拟合和预警分析3个方面进行实证分析,并实现对2016―2018年中国棉花产业安全情况的预警,在此基础上提出相应的对策建议。
表1 2004-2016年中国棉花产业情况
2 中国棉花产业市场风险预警体系构建
风险是人们因对未来为决策及客观条件的不确定性而可能引起的后果与预定目标发生负偏离的综合[3]。在复杂的农业生产经营活动中,风险是普遍存在的,并起着重要的作用。风险预警是根据所研究对象的特点,通过收集相关的资料信息,监控风险因素的变动趋势,并评价各种风险状态偏离预警线的强弱程度,向决策层发出预警信号并提前采取预控对策。风险预警主要包括识别风险、分析风险、采取有效措施3个层面。根据棉花价格定价主体的不同,把棉花价格分为市场价格和政策价格。棉花的市场价格是指通过市场机制所形成的价格,受供求关系的影响;棉花政策价格一般指根据经济稳定增长的需要,政府制定的对棉花市场进行干预的1种价格,如通过棉花的抛售或收购来进行价格调节。由于棉花产业风险预警最重要的表现形式就是由供需不平衡导致的棉花市场价格波动,因此本研究选取棉花市场价格波动率(表2)对棉花产业进行风险预警,其中棉花市场价格数据来源于中国棉花网,棉花市场价格波动率=(本期棉花市场价格-上期棉花市场价格)/上期棉花市场价格*100%。当棉花市场价格波动超过一定范围时,认为棉花市场存在风险,具体产业风险等级划分标准见表3。
表2 中国棉花市场价格波动情况 %
表3 中国棉花产业风险等级的划分标准
本研究从供给、需求、国际市场等影响棉花价格的因素出发,结合棉花产业自身特点和数据的可获得性,最终选择12个指标研究棉花产业的风险预警(表4)。从供给角度,选取单产、种植面积、生产成本、成本利润率、受灾面积5个指标作分析,其中生产成本和成本利润率数据来源于《全国农产品成本收益资料汇编》,单产、种植面积和受灾面积数据来源于国家统计局,此处“受灾面积”指代“农作物受灾面积”,这一指标主要反映自然灾害对棉花的产量和质量的影响,前人已有所探究[13];从需求角度,选取国内销售量、商品率、库存消费比、纺织业销售增长率4个指标作分析,其中国内销售量数据来源于国家统计局,商品率数据来源于《全国农产品成本收益资料汇编》,库存消费比数据来源于美国农业部,纺织业销售增长率数据来源于中国棉花网;从国外市场角度,选取进口量、贸易竞争指数、国际市场价格3个指标作分析,其中进口量和贸易竞争指数数据来源于中国海关信息网,国际市场价格由国际棉花销售平均单价代替,数据来源于中国棉花网。具体原始数据见表1和表5。
表4 中国棉花产业市场风险预警的警兆指标
3 BP神经网络模型在中国棉花产业风险预警中的应用
3.1 模型选择
BP神经网络模型是1986年由Rumelhart和McCelland为首的科学家小组提出,能学习和存贮大量的输入-输出模式映射关系,是1种按误差逆传播算法训练的多层前馈网络。它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。本研究采用最基本的3层BP神经网络模型,可以分为输入层、隐层和输出层(图1)。BP神经网络一般需要对数据进行归一化处理,使数据映射在[-1,1]内,选取第k个输入样本和对应的期望输出,计算隐含层各神经元的输入和输出,进而对比网络期望输出和实际输出,计算误差函数对输出层的各神经元的偏导数,再进行反向传播,利用输出层各神经元的偏导数和隐含层各神经元的输出修正连接权,利用隐含层各神经元的偏导数和输入层各神经元的输入修正连接权,从而计算全局误差判断其是否达到预设精度(0.001);若不满足要求,选取下1个学习样本及对应的期望输出进入下1轮学习,如此反复,直至误差小于预定值为止,经处理输出结果[4]。
表5 中国棉花产业市场风险预警基础指标的原始数据
图1 三层BP神经网络结构
3.2 模型构建
选取并计算了单产增长率、总种植面积增长率、生产成本增长率、成本利润率变动率、受灾面积变动率、棉花销售增长率、商品率变动率、库存消费比变动率、纺织业销售增长率、进口量变动率、贸易竞争指数变动率、国际市场价格变动率共12个指标产业风险预警指标。计算公式:增长率=(本期指标数值-上期指标数值)/上期指标数值*100%。由于部分指标无法获得月度数据,所以本研究统计数据以年为单位,用2004―2015年的年度数据为样本进行实证分析,将收集的数据进行汇总和变换,得到网络输入的12个神经元(表6)。
表6 BP神经网络棉花产业风险预警指标值 %
表6 续
由于各指标之间存在着数量级差异问题,本研究利用Matlab 2013对原始数据进行归一化处理,使其结果变为[-1,1]区间内的数值[10],具体变换公式为:Yi=(Pi-Pmin)-(Pmax-Pmin) ,式中Yi为预处理后的样本,Pi为输入的样本,Pmin为输入样本中的最小值,Pmax为输入样本中的最大值。利用Matlab 2013和上式对输入数据进行归一化处理,得到表7。
表7 BP神经网络棉花产业风险预警归一化后的数据
本研究设定输入节点12个神经元,输出节点1个神经元,棉花市场价格波动率的期望输出值已知,它可由查询历史数据和作者整理而得,并对棉花市场价格波动率进行归一化处理,结果见表8。
表8 BP神经网络模型输出值
3.3 模型拟合及预警分析
利用Matlab 2013软件,对表6和表7中的数据进行BP神经网络模型训练,经过多次调试,最终选定隐层节点数为12个,样本训练率为90%,学习速率为0.05,训练误差为0.001。为检验BP模型的有效性,利用上述已经训练好的BP网络模型,对2015年的棉花产业风险进行预警分析。结果显示2015年预警指数输出值为0.136,棉花市场价格波动率为-13%,处于负向低风险状态,与2015年期望输出值属于同一风险范畴。由此认为BP神经网络模型可以较好地对中国棉花产业作风险预警。以训练好的BP神经网络对2016―2018年中国棉花产业风险(2016―2018年原始数据为笔者通过ARMA模型所得的预测数据)进行预测预警,将处理后的数据代入训练好的BP神经网络模型中[10],得到2016―2018年预警指数分别为0.147 7、0.588 8、0.596 3。根据变换公式,可知2016―2018年棉花产业风险预警指数为-11.65%、39.04%、39.90%。 2016年预警指数处于[-20%,-5%],评价为“负向低风险”;2017年和2018年预警指数均在20%以上,评价为“正向高风险”。
4 结论
借助Matlab 2013软件的运算,利用BP神经网络构建了2005―2015年的棉花产业风险预警模型,用训练好的BP神经网络模型预测了2016―2018年的棉花市场价格波动率,从而实现中国棉花产业风险预警。然而,本研究收集数据有限,定性指标也未能在模型中体现,所以风险预警模型的预测功能并未得到完全发掘。BP神经网络模型具有非线性映射能力和较强的信息处理能力,克服了时间序列分析在构建过程中的线性问题,将其应用于棉花产业风险预警是中国棉花产业风险预警方法中的新尝试。因此,利用BP神经网络模型进行中国棉花产业风险预警应成为棉花产业研究的主攻方向之一。
[1]张杰,王力,赵新民.我国棉花产业的困境与出路[J].农业经济问题,2014(9):28-34.
[2]魏晓文,雷亚平,刘志红.论我国棉花收储政策[C]//中国棉花学会2014年年会论文汇编.安阳:中国棉花杂志社,2014:10-15.
[3]卢秀茹,代学钢,王健.基于信息技术的棉花风险预警系统及应用[J].农业工程学报,2007,23(9):59-163.
[4]李亚兵,毛树春,王香河.中国棉花生长指数基于BP神经网络的单产预测模型[J].中国棉花,2004,31(1):8-9.
[5]王淑贞,魏华,贺靖峰.基于AR和模糊综合评价的中国能源风险预警研究[J].上海管理科学,2011,33(3):1-4.
[6]安珺.基于层次分析法的乳品质量安全预警系统研究[D].哈尔滨:东北农业大学,2012.
[7]吴清华,高峰,冯中朝.中国油菜产业风险预警研究——基于BP神经网络[J].华中农业大学学报,2015(2):29-33.
[8]张淑荣,魏秀芬.我国棉花产业安全状况评价[J].农业技术经济,2011(2):92-95.
[9]张利庠,周海川,卞秋实.棉花产业链各环节相关性分析[J].山西大学学报,2012,35(5):106-115.
[10]白燕飞,何忠伟,刘芳.基于BP神经网络模型的中国奶牛产业损害预警研究[J].世界农业,2015(3):45-49.
[11]王伟,宗望远,吴文福.基于BP神经网络的棉花水分检测仪设计[J].华中农业大学学报,2011(4):533-536.
[12]王伟国,赵新民.基于EMD-BP神经网络的我国棉花期货价格预测方法研究[J].石河子大学学报(哲学社会科学版),2013(1):78-80.
[13]卢秀茹,焦晓松,刘妍.提升河北省棉花产业竞争力战略研究[M].北京:中国质检出版社,2013:50.
Research on Early Warning of Risk in Chinese Cotton Industry Based on Back Propagation Neural Network Model
Jia Xiaoyue,Cui Yuanpei,Sun Jinsheng,Lu Xiuru*
F326.12:S562
A
1000-632X(2017)10-0001-06
10.11963/1000-632X.jxylxr.20171010
中国棉花产量约占世界总产量的1/4,消费量所占份额超过40%,进口量占40%左右[1]。棉花是中国种植业生产中产业链最长的大田经济作物,商品率超过95%。据国家统计局数据,1978年我国植棉面积为486.64万hm2,皮棉产量为216.70万t,皮棉单产为 445.30 kg·hm-2。1978―2007 年植棉面积跌宕起伏,自2007年以后呈现明显递减趋势,2016年植棉面积仅为337.61万hm2,皮棉产量为534.3 万 t,皮棉单产为 1 582.50 kg·hm-2(表 1)。 近10年来,随着农作物总种植面积逐年增加和棉花种植面积逐年递减,棉花种植面积在全国农作物总种植面积中所占比例不断降低(表1)。
如表1所示,中国棉花平均出售价格波动幅度较大,导致棉花种植成本利润率波动异常,尤其在2008年全球金融危机的冲击下,棉花消费萎缩,价格下降。随后国家相继实施4次收储,使得2009年5月至2010年10月之间棉花价格持续上涨,然而3次抛出后棉花价格在2010年11月至2011年4月仍随国际价格更快速大幅上涨,而后由于出台临时收储政策2011年5月棉价出现疯狂的下跌[2]。2014年取消了棉花临时收储政策,以新疆为试点实行棉花目标价格政策,而目标价格政策的出台并未改变棉价持续下降的态势。由于棉花价格呈现波峰波谷的趋势,导致棉农的种植决策无从参考,加之自身的知识水平和决策水平有限,许多棉农缺乏行情的预测预报[3],陷入“价格高—多种植—产量高—需求弹性小—价格低—少种植—产量低—供不应求—价格高”的恶性循环。如果可以在棉花市场价格波动之前,做出预警并提前采取相应的防范措施,就可以有效降低棉花产业风险带来的损失。
2017-04-11 *通信作者:Luxr2006@126.com
河北省教育厅人文社科重大招标课题(ZD201421);河北省社科基金(HB16YJ056);河北省科技厅课题(17456102D)