新型ARIMA-BP组合模型在医药企业销售管理中的应用
2016-05-09吴磊徐怀伏
吴磊+徐怀伏
摘 要 随着医药企业间的市场竞争加剧,企业销售管理的重要性逐渐凸显。医药销售预测是个复杂的非线性系统,为提高企业销售预测的准确性,本文选取医药上市企业处方药七叶皂苷钠历史销售数据,分别建立ARIMA线性模型和BP神经网络非线性模型并加以验证。证明了在销售预测上采用ARIMA-BP组合模型可以有效降低误差,为医药企业的销售管理和企业决策带来新的思路。
关键词 销售管理 ARIMA模型 BP神经网络
中图分类号:F406.69 文献标识码:A 文章编号:1006-1533(2016)07-0068-05
Application of ARIMA -BP model in the sales management of the listed pharmaceutical companies
WU Lei, XU Huaifu
(School of International Pharmaceutical Business, China Pharmaceutical University, Nanjing 211198, China)
ABSTRACT The importance of sales management in pharmaceutical enterprises has become increasingly prominent with the intensification of market competition among them. Since the forecast of pharmaceutical sales is a complex nonlinear system, the data of historical sales for sodium aescinate, a prescription drug from the listed pharmaceutical companies were selected, and an ARIMA linear model and a BP network nonlinear model were established and verified based on the theory of linear and nonlinear prediction in order to improve the accuracy of sales forecast. It is proved that adoption of a combination of two models can effectively reduce errors and bring in some new ideas for the sales management and policy decision of pharmaceutical enterprises.
KEY WORDS sales management; ARIMA model; BP neural network
随着经济全球化以及市场竞争的加剧,销售管理工作逐渐成为企业管理工作的核心。目前,我国医药企业销售管理工作中存在销售预测脱离实际,预测主观性较强,缺乏科学的方法等问题。准确的药品销售预测不但可以指导生产、销售工作来防范风险,还是科学的销售绩效指标的重要前提条件。随着现代理论以及数据挖掘工具的发展,销售预测和实际数据吻合将成为现实。由于药品销售数据实际是非线性、时变的时间序列数据,本文通过对医药上市企业历史销售数据的分析,建立ARIMA模型,预测结果作为线性预测能力,同时建立BP神经网络模型,预测结果作为非线性拟合能力,将两者结果通过权值来组合模型进行预测,提高了药品销售预测的准确率,为我国医药企业优化药品销售决策方案提供新思路
1 药品销售预测理论概述
1.1 销售预测
药品销售预测是根据药品的历史销售数据和企业发展战略,充分考虑市场需求、市场环境、医药政策等因素,对未来市场进行定量预测,并有合理的预见结论。
现代理论中,运用较多的数据挖掘工具是回归分析、聚类、关联分析以及神经网络等,已在预测财政收入、价格、需求量、销售量上有广泛应用。历史研究表明,单一预测模型都有自身的局限性,于是出现组合模型方法,例如赖红松等[1]运用灰色神经网络组合模型预测人口数量,并获得精确的预测效果;刘明凤等[2]提出一种改进的卡尔曼滤波混合预测模型将 ARIMA 模型和BP神经网络模型相结合,大大减小预测误差并且改善预测结果的延迟现象;李眉眉[3]对比标准BP神经网络模型和混沌线性回归模型的预测结果,表明基于混沌分析的BP神经网络模型的预测精度较高。
销售预测的标准就是准确性,影响销售预测的因素很多,包括人为因素、市场与竞争环境、政策变化、季节变化等。时间序列预测方法考虑影响因素之间的线性关系,运用ARIMA模型得出线性预测结果;BP神经网络模型可把周期因素、市场活动、季节等非线性影响因素的相互作用以权值形式固化在网络中,运用训练得到的BP神经网络模型得到非线性预测结果。
1.2 数据来源
A是一家以研发为基础的医药上市公司,专注于天然药物、新型制剂和生物技术产品的研发、生产和销售。本文数据来源于A医药上市公司2008—2014年处方药七叶皂苷钠的销售数据,建立预测模型时用2010年1月—2014年6月的销售数据为样本(表1),用2014年7月—12月的数据来检验模型预测的准确度。
2 ARIMA-BP组合预测模型应用
2.1 ARIMA模型预测的建立
差分自回归移动平均模型(auto-regressive integrated and moving average model, ARIMA),是一种能很好地预测线性变化的时间序列模型,它由自回归和移动平均两步法构成。ARIMA模型理论上适合于各种时间序列数据,它不需对时间序列的发展模式作先验的假设,可通过反复识别修改,直到获得满意的模型,是一种理论较完善、精确度较高的时序短期预测方法。在医药行业,ARIMA模型已用在发病预测、药品费用预测、医院绩效预测以及药品销售预测等领域。其表达式为:
2.1.1 样本序列特点及平稳化处理
ARIMA模型的假设基础是平稳时间序列,如果时间序列是有趋势的,那么一定是非平稳数据。 如果时间序列非平稳,建立模型之前应先通过差分把它变换成平稳的时间序列。运用Eviews 3.1软件绘制2010年1月—2014年6月销售额时序图显示,此药品销售额有明显上升的长期趋势(图1),因此该序列是非平稳序列。对原时间序列y取对数消除异方差以及进行一阶差分得到平稳数列y*,图像在零附近波动(图2)。
本文运用单位根检验 (augmented dickey-fuller test,ADF)对时间序列进行平稳性检验,检验结果如表2,ADF小于各临界值,序列y*通过平稳性检验。
2.1.2 ARIMA(p,d,q)模型定阶及参数估计
利用Eviews 3.1软件,观察平稳后序列的显著特征就是自相关函数随时间间隔的增大而衰减。自相关系数从第一阶开始下降,先设定的q值可为1;同理,偏自相关函数设定p的值可为2、3、4。模型合理的滞后阶数通常采用AIC信息准则,根据AIC最小原则以及似然函数值越大原则,表3比较结果显示,p=2,q=1时的AIC值最小,且大部分参数检验都显著,确定模型为ARIMA[(2,1,1),(表4)]。
2.1.3 模型估计和检验
模型的残差序列必须通过卡方检验。时间序列的残差得到如果是白噪声序列,说明时间序列中有用的信息已被提取完毕,剩下的是随机扰动,无法预测和使用,此时建模完成;若残差不是白噪声,p值很小就说明残差存在相关性,其中还有有用的信息,模型需要修正[4]。当时间序列通过白噪声检验后,就可以检验序列是否通过Q-统计量检验。如果残差不存在序列相关,在各阶滞后的自相关和偏自相关值都接近于0,所有的Q-统计量都不显著且其p值都大于既定值。
利用Eviews软件中得到对模型ARIMA(2,1,1)进行白噪声检验的结果,随着滞后期的增加,Q-统计量的值都低于5%显著性水平临界值27.58,并且Q-统计量的P值大于显著性水平5%,说明在5%的显著性水平下,接受残差序列为白噪声序列的原假设,残差序列不存在序列相关,表明模型对序列的信息已经提取充分,所以可以确定ARIMA(2,1,1)为平稳序列y*的最佳预测模型。
2.1.4 ARIMA模型的确定
采用TIC、BP、VP、CP值检验模型预测精度,其中BP、VP、CP和为1。拟合值和真实值差异小的话要满足:TIC值接近于0,而CP占BP、VP、CP三者和的比重大。静态预测图中实线代表的是预测值,两条虚线提供的是2倍标准差的置信区间,随着预测时间的增加,预测值很快趋向于序列的均值,其中TIC为0.35,BP和VP比例很小,CP为0.8占比较大,说明实际序列波动较大,而模拟序列的波动较小,可以判断2014年销售量的预测是较为准确的。
最终确定线性预测模型ARIMA(2,1,1)的具体形式为:
2.2 BP神经网络模型的建立
BP神经网络称作误差反传训练人工神经网络,作为一种非线性、具有统计特性的数据挖掘技术,对于连续数值类型数据输出的预测能力,在商业领域、自然科学和社会科学领域得到持续增长的应用。根据Kolrnogorov定理,由输入层、隐含层和输出层组成的BP神经网络能够实现对任意非线性函数进行逼近,可实现从输入状态到输出状态的非线性映射。每层由神经元组成,相邻层各个神经元之间形成完全连接关系,且同层内各个神经元之间形成完全不连接关系,利用输入与期望之间的误差作为信号,进行多次调节至误差最小,适用于无规则、多约束或残缺数据问题的研究,具有强容错性、强自适应性和强映射能力等优点。在医药行业,BP神经网络的应用大致可以分为采购资金管理、医疗器械和材料的需求以及药品销售预测等,如今还有药品价格预测、医药企业绩效评价、药品疗效评价等多方面领域的应用,熊尧等[5]将BP神经网络运用于医疗机构的基本药物需求预测中,为保证采购数量科学化和采购理论方法提供借鉴。神经网络模型中,输出yt和输入yt 1?,yt 2?,…之间的关系如下:
2.2.1 准备训练数据,样本数据归一化
2.2.2 设置训练网络结构和参数
利用MatlabR 2012a得到归一化后的药品时间序列销售额数据,经过多次实验确定将前3个月的销售数据为输入节点,第4个月销售数据作为输出节点,2008—2013年每月数据作为分析对象,2014年数据作为测试样本。网络输入层是3个神经元,输出层是1个神经元。
通过多次网络训练,确定最优训练网络参数为:1)训练最大循环次数(trainParam.epochs)为1 000。2)训练目标误差(trainParam.goal)为0.001,学习速率(trainParam.lr)为0.1,通常较低的学习率需要较多的训练迭代。
3)激活函数的确定:训练函数为LM自适应调整训练函数,隐含层采用双曲正切S型函数,输出层采用线性传递函数,S型函数具有非线性放大系数功能,一般输出层不用S型函数,因为这样输出就会被限制在较小范围内,通常使用线性函数。
4)隐含层神经元个数取5,隐含层数较少会使训练网络收敛较慢。
构建的BP神经网络在Matlab中的语句为net=newff
(inputn,outputn,5,{tansig,purelin},trainlm)。
采用均方误差(mean squared error,MSE)作为检验模型拟合效果的评价标准,MSE的值越小,说明预测模型描述实验数据具有更好的精确度[6]。经过34次训练,在迭代53次后达到预期目标误差,其中在第47次迭代时达到0.000 158 78。用训练得到的网络进行预测,输入2013年10—12月的数值得到2014年1月的预测值,以此类推得到2014年剩下月的预测值。
2.3 ARIMA-BP组合预测模型
对比结果发现,BP神经网络预测的精准度比ARIMA模型高,组合模型的预测精度高于单独使用一种模型,除了个别月存在偶然因素外,平均误差的范围都在10%以内,具有预测有效性(表5)。
3 结语
药品销售额是由很多复杂的因素共同影响,建立一个模型将这些因素都考虑并准确预测销售实际上是非常困难的。为提高销售预测的准确性,本文将两种预测模型组合起来进行预测,比单独一种模型提高了预测精度。由于历史销售数据通常是非线性的时间序列,可以分解成由线性和非线性两部分组成,确定两种预测模型的权值系数后得到的组合模型不仅克服了单纯采用ARIMA模型预测非线性时间序列精度低的问题,也克服了单独使用BP神经网络模型陷入局部极小值、收敛速度慢的不足,同时还借鉴人为的主观经验判断,为企业的生产、经营和销售决策提供了科学的方法和有力的参考依据。然而实际中,应当灵活地将定量和定性分析相结合,进行组合时重要的是要选取适合企业的衡量标准来确定权值系数,在数据预测模型的基础上综合考虑各种因素,这样才能实现对药品销售更为精准的预测。
实际应用中,一个有效的销售预测不应该只有预测的数据,同时应该更新实际销售数据以及保留原有预测的数据。每次企业进行销售预测应该同时考虑:①对已经发生的时间段,比较实际销售与预测数据的差异;②对未来的预测时间段,比较更新的数据和原有预测数据之间的差异;③更新的预测数据与过去实际的销售数据之间的差异。
参考文献
[1] 赖红松, 祝国瑞, 董品杰. 基于灰色预测和神经网络的人口预测[J]. 经济地理, 2004, 24(2): 197-201.
[2] 刘明凤, 修春波. 基于ARMA 与神经网络的风速序列混合预测方法[J]. 中南大学学报(自然科学版), 2013, 44(1): 16-20.
[3] 李眉眉, 丁晶, 覃光华. 基于混沌分析的BP神经网络模型及其在负荷预测中的应用[J]. 四川大学学报(工程科学版), 2004, 36(4): 15-18.
[4] 张华初, 林洪. 我国社会消费品零售额ARIMA预测模型[J]. 统计研究, 2006, 23(7): 58-60.
[5] 熊尧, 李智慧, 杨家欣, 等. 基于BP神经网络在基本药物采购量短期预测中的研究[J]. 上海医药, 2013, 34(5): 47-51.
[6] 盛魁. RBF神经网络在药品销售预测中的应用[J]. 长江大学学报(自科版), 2013, 10(19): 65-67.