基于神经网络的药品需求组合预测研究与应用

2014-04-29宫剑李洁玲

中国管理信息化 2014年8期

宫剑李洁玲

[摘要] 药品的市场需求预测是制药企业生产控制中的重要组成部分，具有复杂的非线性特点。本文以制药企业的药品需求预测为研究对象，通过分析药品需求的特征，建立了基于神经网络的组合预测模型。本文选择3种具有互补特征的神經网络预测方法（BP神经网络的预测方法、RBF神经网络的预测方法和GRNN广义回归神经网络）分别对药品需求进行预测，然后在此基础上使用平均绝对相对误差（MAPE）为最优准则，通过求解二次规划问题得到权重并按照一定的规则进行变权，从而建立了基于神经网络的药品需求组合预测模型，最后对该模型实际应用的精度和稳定性进行评价。实验表明，本方法能够提高预测精度、稳定性，并扩大了模型的适用范围。

[关键词] 药品；神经网络；组合预测；需求预测

doi ： 10 . 3969 / j . issn . 1673 - 0194 . 2014 . 08. 051

[中图分类号] TP183 [文献标识码] A [文章编号] 1673 - 0194（2014）08- 0084- 05

0 引言

随着人工智能技术的发展，人工神经网络得到了广泛研究和应用。由于神经网络具有良好的学习能力和较强的非线性处理能力、不依赖于特定数学模型等优势，其作为一种预测方法已被广泛应用于许多领域。

在医药企业、医药卫生管理领域，药品需求预测一直是管理部门关心的热点问题。药品需求除了受由药品自身属性影响外，还受国家政策或医药行业规定等因素的影响，如药品在某地区是否中标、是否为处方药等；同时，制药企业自身制定的定价、渠道以及促销等营销策略和销售团队的组建制度也对药品需求产生不同程度的影响。药品需求特征的多样性，决定了药品需求预测本质上是一个复杂的非线性系统建模问题。

国内外众多学者对药品需求预测进行了深入的研究，产生了一批有价值的研究成果。目前，药品需求预测的主要方法包括：回归分析法、时间序列分析法、神经网络、遗传算法等。这些方法从不同角度出发建模，均取得一定效果，尤其是BP神经网络，已经在药品预测研究中取得了众多应用。尽管相关讨论和研究不断增多，但是目前常用的神经网络预测方法普遍存在以下问题：由于药品需求特征颇为复杂的特殊性，运用单项预测方法对其进行预测无法涵盖其较多的特征信息，通常表现为对某类特定的药品预测效果良好，而对其他药品则预测性能较差，从一定程度上限制了预测模型的适用范围。

本文采用基于神经网络的组合预测模型来解决上述问题。组合预测方法（combined forecasting）是指通过一定数学方法将不同的单项预测模型组合起来，综合利用各种单项预测方法所提供的信息，从而达到提高预测精度的目的。组合预测方法最早由Bates和Granger[1]于1969年提出，他们认为对于一个包含系统独立信息的单项预测方法，与预测精度较小的预测方法进行组合预测完全可以增强系统的预测性能。

考虑到各种神经网络预测方法的特点及其适用范围，本文选择BP神经网络预测方法、RBF神经网络预测方法和基于广义回归神经网络（GRNN）3种常用的神经网络预测方法作为组合预测模型中的单项预测方法。在此基础上，用平均绝对相对误差（MAPE）和方差为衡量标准，并根据设置的阈值对单项预测方法进行筛选，最后选取了MAPE作为最优准则计算得到权重，从而建立组合预测模型，在提高组合预测模型精度的同时，使得组合预测模型具有现实意义。实验结果表明，本文提出的模型的预测精度高于传统的线性组合模型的预测精度。

1 相关工作

基于神经网络的预测方法具有很多其他预测方法所不具备的优点，近年来越来越被人们所关注。吴正佳等（2010）[2]针对某备货型企业的产品需求量，建立了基于良好学习能力的BP神经网络预测模型，并通过实证分析与简单移动平滑法和加权移动平滑法的预测结果相比较，结果表明BP神经网络预测结果比其他两种更为有效果。童明荣等（2007）[3]提出一种季节性RBF神经网络预测模型，对具有季节性的产品月度市场需求进行预测，最后利用构建好的RBF神经网络模型进行仿真实验，并与ARIMA模型、分组回归模型等常用季节预测模型做对比分析，结果表明前者的预测误差均方差最小，预测精度较高。Maria Cleofé（2005）[4]利用人工神经网络（ANN）对圣保罗地区的降雨量进行预测，并通过实证分析与其他线性回归模型作对比评价，实验结果表明人工神经网络有着更好地预测效果。此外还有其他很多学者在交通、航运、气候等多个领域运用神经网络进行了预测[5-7]，不在此赘述。

针对药品销量预测这一特定问题，国内外部分学者也做了一定的研究工作，试图寻找合适的预测方法对药品需求做出较为准确的预测。马新强等（2008）[8]提出了一种基于BP神经网络的药品需求预测模型，该文先利用数据仓库及数据挖掘技术分析提取了相关有效的药品销售信息作为研究对象，在此基础上利用BP神经网络对其进行预测，最后在较为精确销售量的基础上提出了一种优化的生产决策系统方法。王宪庆等（2009）[9]利用BP神经网络模型对药品超市的药品销售情况进行预测并做了相关实证分析，该文通过观察药品预测的显著性差异评价模型的性能，最终取得了良好的效果，支持了其BP神经网络非常适用于资金有限、仓储量不大的药品超市的结论。刘德玲（2012）[10]提出了一种针对大范围内的药品销售的预测方法。该文利用遗产算法优化支持向量机药品销售预测方式进行预测，提高了药品销售预测的精确度，得到了较为满意的结果。

尽管有关研究不断增多，但由于药品需求特征颇为复杂的特殊性，运用单项预测方法对其进行预测无法涵盖其较多的特征信息，从一定程度上限制了预测模型的适用范围。本文根据药品需求高度非线性的特点选取了3种不同特性神经网络模型作为单项预测方法，每种神经网络都有其所针对的药品需求特征，并在此基础上建立组合预测模型，扩大了药品预测模型的适应范围，对于提高药品预测精度和预测稳定性具有重要意义。

2 基于神经网络的药品需求组合预测模型的建立

基于神经网络的药品需求组合预测模型的具体步骤如下：

（1）数据异常点预处理。为提高组合预测模型的适用范围和预测精度，本文运用基于距离的异常点检测方法对存在异常点的药品需求数据进行异常点修复，得到正常的需求数据。

（2）单项预测方法的选取。针对药品需求的不同特征，选取3种不同特性的神经网络模型作为单项预测方法，以此作为组合预测模型单项预测方法的筛选基础。

（3）单项预测方法的筛选与变权重的计算。因为不同药品具备不同需求特征，在进行组合预测时仍需要在已选取单项预测方法的基础上再次筛选合适的单项预测方法进行组合，以相对误差为最优准则，通过求解二次规划问题得到权重并按照一定的变权规则进行变权。

（4）根据权重建立组合模型进行预测。

2.1 药品数据异常点预处理

在药品销售数据中，由于特殊事件（如铺货）等原因，个别数据会表现出明显突变，导致药品历史数据存在异常点，掩盖了数据本身的规律。本文通过基于距离的异常点检测方法和多项式拟合方法对药品数据做预处理，具体处理步骤如下：

首先，选择一个较大的数（如1010）将缺失数据补足，然后运用基于距离的异常点检测方法进行检测。第一步，对药品需求数据进行归一化处理并计算出各个数据之间的距离，得到距离矩阵P。计算公式如下：

Pij=|xi-xj|，i，j=1，…，n（1）

式中，xi表示时间序列中第i期的数据，Pij表示时间序列中i期数据与j期数据之差的绝对值。距离矩阵P的第i列表示时间序列第i期数据与长度为n的时间序列中所有数据（包括第i期数据本身）的距离。

P=p11，p12，…，p1np21，p22，…，p2n… … … …pn1，pn2，…，pnn（2）

通过设置距离阈值d，计算出所有满足Pij>d的距离个数，记di，得到判别矩阵D。

D=[d1，d2，d3，…，dn]（3）

将di与阈值f进行比较，若大于f，则识别该点为异常点，否则为正常值。最后利用多项式拟合方法，将检测出来的异常点作拟合处理，得到建模需要的正常数据。

2.2 单项预测方法的选取

药品需求预测是一个复杂的非线性系统建模问题，相对于传统分析方法（如指数平滑方法、ARMA模型、MTV模型），神经网络依据数据本身的内在联系建模，具有良好的自组织、自适应性，以及抗干扰能力以及非线性映射能力，能够较好地解决非线性数据拟合问题。

本文选取3种具有不同特征的神经网络模型，即BP神经网络、RBF神经网络和GRNN广义回归神经网络，综合其各自优势建立组合预测模型，提升整个预测模型的泛化能力，提高预测精度与预测稳定性。

2.2.1 基于BP神经网络的药品需求预测方法

BP神经网络由Rumelhard和McClelland于1986年提出，它是一种典型的多层前向型神经网络。药品销售记录作为BP神经网络输入值，药品需求预测即为BP神经网络输出值。当输入节点数为m，输出节点数为n时，BP神经网络就表达了从m个自变量到n个因变量的非线性函数映射关系。

BP神经网络侧重对全样本的学习，因此适合对样本整体特征相近的时间序列进行预测，即适应受某一特定因素影响显著，且该影响因素相对稳定的药品预测。

2.2.2 基于RBF神经网络的药品需求预测方法

径向基函数（RBF，Radical Basis Function）由Powell于1985年首次提出，它是一种三层前馈网络，即输入层、隐含层和输出层。从输入层到隐含层是一个非线性到线性的变换过程，从隐含层到输出层是一个线性处理过程。RBF神经网络在处理非线性问题时，引入RBF核函数将非线性空间映射到线性空间，极大地提高了非线性处理能力，且RBF神经网络采用自组织有监督的学习算法进行訓练，其训练收敛速度具有显著的优势。

RBF神经网络具有很好的非线性处理能力，其学习算法属于局部激活性较高的高斯函数，对于相似的样本有着较高的逼近能力，因此适用于受会随时间变化而较为显著变化的因素影响的药品需求预测。

2.2.3 基于GRNN的药品需求预测方法

广义回归神经网络（GRNN，Generalized Regression Neural Network）由美国学者Donald F. Specht在1991年提出，它是径向基神经网络的一种。GRNN具有很强的非线性映射能力和柔性网络结构以及高度的容错性和鲁棒性，适用于解决非线性问题。

GRNN在逼近能力和学习速度上较RBF网络有更强的优势，网络最后收敛于样本量积聚较多的优化回归面，并且在样本数据较少时，预测效果也较好。此外，网络还可以处理不稳定数据。因此GRNN适用于数据不全、异常点较多的药品。

综上所述，3种神经网络都具有良好的非线性处理及预测能力，因为学习算法的不同有着各自侧重的学习方向，皆为应用广泛的预测方法，且对各自适应范围内有着较好的预测效果。因此本文选择BP神经网络、RBF神经网络以及广义回归神经网络作为单项预测方法，并在此基础上建立组合预测模型。

2.3 单项预测方法的筛选与变权系数的计算

本文在已选取3种单项预测方法的基础上，再根据合适的MAPE和误差方差筛选出组合模型中的单项预测方法，计算出变权系数。假设药品需求的实际时间序列为y（t），t=1，2，…，N，N+1，…，N+T，其中t表示预测区间，T表示预测步长。

（1）单项方法筛选

单项方法进一步筛选的具体步骤为：

①预先设置选择单项方法MAPE阈值m 和误差方差阀值ε

②进行逐期单步预测，预测序列为：

{i（t），i=1，2，…，n；t=N+1，…，N+T}

③计算n种单项方法的相对误差ei（t）、误差方差εi（t）和MAPE。其中，单项预测方法的相对误差序列为：

ei（t）=i=1，2，…，n；t=N+1，…，N+T（4）

单项预测方法的误差方差为：

εi（t）=（5）

单项预测方法的MAPE为：

MAPEi（t）=ei（j），（i=1，2，…，n；t=N+1，…，N+T）（6）

④若MAPEi（t）

（2）变权系数的计算

本文考虑预测效果，选用基于相对误差为最优准则的最优加权法进行计算。

假设从n中方法中筛选出p（p≤n）种单项预测方法，则组合模型第t+1期的权系数w（t+1）由相对误差ei（1），…，ei（t）决定，其中i=1，…，p。变权规则如表1所示。

权系数具体计算过程如下：

①设组合权重wi为方法mi在组合预测方法中权重，则组合预测方法第t期相对误差为：

e（t）=wi*ei（t），i=1，2，…，p（7）

②组合模型前t期的相对误差平方和为：

e2=e（1）2+e（2）2+…+e（t）2（8）

令w=[w1，w2，…，wP]T，

E=e1（1），e2（1），…，ep（1）e1（2），e2（2），…，ep（2） … … … …e1（t），e2（t），…，ep（t）

建立如下目标规划：

min P=e2=wT*ET*E*w

s.t. wi=1（9）

③求解该目标规划得到变权系数w。

2.4 建立组合模型进行预测

组合预测模型可表示为：

式中， wi（t）表示第t期单项方法mi的变权系数，（t）表示第t期组合预测方法的预测值。根据该模型对药品进行预测。

3 实验与分析

本文以上海市某制药企业月度销售额为药品需求预测的实证数据，根据销售地区的不同抽取有代表性的药品销售数据，其中选取上海地区10种药品，北京地区4种药品及全区域销售数据12种药品，数据长度皆为30（2009-1至2011-6）。

数据选择依据如下：①药品销售有一定的连续性，为公司主推或在某地区主推药品，具有代表性及预测意义；②在考虑异常点和数据缺失时，选取异常点和缺失数据较少的药品。

3.1 单项方法筛选和变权系数计算

根据不同销售区域药品需求的具体情况，设定单一省市药品的MAPE阈值和方差阈值分别为20%和0.1；设定公司的MAPE阈值和方差阈值分别为30%和0.1。shy03和all03的单项预测方法选取结果如表2 所示。

利用单项预测方法的6期预测结果计算组合预测模型的3期权重，选相对误差最优准则进行权重计算，运用MATLAB的二次规划函数quadprog求解。变权规则及权重计算结果如表3所示。

3.2 预测模型的精度比较

本文选取平均绝对相对误差（MAPE）和预测有效度两个指标来综合评价模型的预测精度。当MAPE越小时，说明预测精度越高。然而当实际值非常小时，即使是预测值与真实值之差较小，其平均绝对相对误差也会很大，而预测有效度能很好地避免此类问题，故我们引入预测有效度来综合评价预测精度，预测有效度越大，预测精度越高。

用单项预测方法BP、RBF、GRNN与组合预测方法单一省市和全区域药品销售预测值的MAPE和有效度，对MAPE和有效度的情况进行统计并且计算MAPE和有效度的平均值，比较结果如表4所示。

可以看出，运用组合预测方法对单一省市的14种药品进行需求预测时，MAPE小于标准值20%的有8个，占药品总数的57.14%，优于BP（7）、RBF（4）、GRNN（6）方法；14种药品的MAPE平均值为19.81%，优于BP（26.71%）、RBF（28.45%）、GRNN（40.59%）方法。预测有效度大于标准值0.5的有11个，占药品总数的78.57%，優于BP（8）、RBF（10）、GRNN（8）方法；14种药品的预测有效度平均值为0.62，优于BP（0.57）、RBF（0.61）、GRNN（0.57）方法。

此外，运用组合预测方法对全区域销售的12种药品进行需求预测时，MAPE小于标准值30%的有7个，占药品总数的58.33%，优于BP（4）、RBF（6）、GRNN（3）方法；12种药品的MAPE平均值为25.22%，优于BP（35.90%）、RBF（32.07%）、GRNN（70.59%）方法。预测有效度大于标准值0.45的有10个，占药品总数的83.33%，优于BP（7）、RBF（9）、GRNN（5）方法；12种药品的预测有效度平均值为0.58，优于BP（0.46）、RBF（0.56）、GRNN（0.49）方法。

通过上述实证结果，从整体上看，组合预测方法的预测精度优于单项预测方法，而且模型的适用范围较广。

3.3 预测模型的稳定性比较

本文选择预测误差的方差作为评价模型稳定性的指标。将单项预测方法BP、RBF、GRNN与组合预测方法的误差方差进行比较，单一省市和全区域的比较结果如表5所示。

可以看出，运用组合预测方法对单一省市的14种药品进行需求预测时，误差方差小于标准值0.1的有12种，占药品总数的85.71%，优于BP（10）、RBF（11）、GRNN（10）方法；此外，14种药品误差方差平均值为0.0263，优于BP（0.0613）、RBF（0.0361）、GRNN（0.0522）方法。运用组合预测方法对全区域销售的12种药品进行需求预测时，误差方差小于标准值0.1的有11个，占总数的91.67%，优于BP（9）、RBF（10）、GRNN（8）方法，此外，14种药品的误差方差平均值为0.031 0，优于BP（0.092 7）、RBF（0.033 5）、GRNN（0.065 0）方法。因此从整体上看，组合预测方法的预测稳定性优于单项预测方法。

4 总结及展望

本文选择3种具有不同适应特征的神经网络模型作为单项预测方法，建立了基于神经网络的药品需求组合预测模型，以上海市某药企的实际销售数据作为实证对象，验证了该模型在预测精度和预测稳定性上均优于单项预测方法。当然，虽然建立的神经网络组合模型在一定程度上弥补了现有方法的不足，扩大了预测方法的适用范围，但在研究过程中依然存在亟待解决的问题：

（1）单项预测方法的参数优化有待进一步研究。本文在参数优化时，大部分采用遍历法和经验法进行设置，缺乏相应理论依据和方法指导。如何采用合适参数寻优方法进行参数确定是下一步亟待解决的问题。

（2）进行组合预测时，选择合适的最优准则有待于进一步研究。本文选取相对误差作为最优准则进行需求预测，该准则的选取忽视了量纲统一性，未来的研究应该综合考虑量纲统一、预测误差和预测稳定性，使组合预测方法更科学、更合理。

主要参考文献

[1]J M Bates，C W J Granger.The Combination of Forecasts[J]. Operations Research Quarterly，1969，20（4）：451-468.

[2]吳正佳，王文，周进.BP神经网络在备货型企业销售预测中的应用[J].工业工程，2010（1）：105-108.

[3]童明荣，薛恒新，刘路冰.基于季节性RBF神经网络的月度市场需求预测研究[J].运筹与管理，2007（3），146-150.

[4]Maria Cleofé，R Valverde.Artificial Neural Network Technique for Rainfall Forecasting Applied to the S？觔o Paulo Region[J].Journal of Hydrology，2005，1（20）：146-162.

[5]A A Khan，K E Marion，C Bil. The Prediction of Ship Motions and Attitudes Using Artificial Neural Networks[C].19th National Conference of the Australian Society for Operations Research， Melbourne， Victoria， 2007.

[6]D C Park，El-Sharkawi.Electric Load Forecasting Using an Artificial Neural Network[J].IEEE Transaction on Power Systems， 1991， 6（2）：442-449.

[7]Maria Cleofé， Valverde Ramírez.Artificial Neural Network Technique for Rainfall Forecasting Applied to the S？觔o Paulo Region[J]. Journal of Hydrology ， 2005， 301（20）：146-162.

[8]马新强，黄羿.基于BP神经网络的药品销售预测模型设计[J].重庆文理学院学报，2008（2）：64-66.

[9]王宪庆，涂冰，文诗琪.BP神经网络在药品销售预测中的应用[J].中国医药技术经济与管理，2009（5）：27-29.

[10]刘德玲.大区域内药品销售预测方法研究与仿真[J].计算机仿真，2012（7）：227-229.