APP下载

基于数据挖掘的支持向量机库存预测模型研究

2009-12-29李凡生范富旺

中国市场 2009年9期

  [摘要]针对传统库存预测方法的不足及库存自身特点,引入支持向量机这一数据挖掘的新方法,建立了库存预测模型,把服务水平作为模型的输入特征,实现了库存动态预测。
  [关键词]数据挖掘;支持向量机;库存预测模型
  [中图分类号]G258
  [文献标识码]A
  [文章编号]1005-6432(2009)09-0116-01
  
  1 库存预测研究现状
  
  库存是企业经营活动的基础,如何均衡库存管理成本及顾客服务水平,是库存管理的一个重要内容。传统的库存控制系统通常采用经济订货批量模型(EOQ)来决定每次的订货量,然而,该模型建立在一系列的前提假设之下,忽略了需求、订货周期或者供应的不确定性,所以得到的只能是一个近似的结果。
  影响库存的不确定性因素很多且难以量化,它们的作用或大或小,因此进行库存预测时不能忽略这些因素的存在。针对库存的这一特点,我们引入了数据挖掘技术或基于数据的机器学习方法进行预测。在过去的十几年里,人工神经网络以其强大的并行处理机制、任意函数的逼近能力、学习能力及自组织和自适应能力等在库存管理领域得到了广泛的应用。例如,重庆大学罗兵、西安工程科技学院董晓妮等利用神经网络建立了预测模型用于解决库存不确定性等问题,但是神经网络受到网络结构和样本复杂性影响较大,在样本量有限的情况下,容易出现“过学习”或低泛化能力,因此我们需要寻求能够在有限样本条件下进行库存预测的新方法。
  
  2支持向量机理论概述
  
  支持向量机(support VectorMachines,SVM)是Yapnik在统计学习理论和结构风险最小化原则基础上提出的,它具备完备的理论基础和出色的学习能力,是借助于最优化方法解决有限样本机器学习问题的数据挖掘新方法,区别于神经网络等传统方法以训练误差最小化作为优化目标,它是以训练误差作为优化问题的约束条件,以置信范围值最小化作为优化目标,结构风险最小化原则决定了SVM的泛化能力要明显优越于神经网络等传统学习方法。SVM利用一些具有特殊性质的核函数,将特征空间中的内积运算转化为低维空间中的非线性运算,从而巧妙地避免了高维空间中的计算问题。
  
  3基于SVM的库存预测模型
  
  3.1模型建立
  SVM回归算法有ε-支持向量回归机(ε-SVR)和μ-支持向量回归机(μ-SVR)等,实际问题中ε-不敏感损失函数中的8不好确定,因此我们引入了ε-SVR,其中参数是错误样本的个数所占总样本点数的份额的上界,是支持向量的个数所占总样本点数的份额的下界。我们大体上可以用μ(O≤μ≤1)来控制支持向量个数或错误样本点个数,这就为值得选取提供了一个依据。在这个意义上说,μ-支持向量回归机优于ε-支持向量回归机。有研究表明,当μ∈[0,3,0,6]化性能。我们取μ.54。
  核函数和惩罚因子c是SVM回归预测模型的主要参数,它们的选取对于分析结果影响很大,只有正确选择SVM预测模型参数,才能得到好的分析结果。目前在SVM的学习中,对SVM核函数及其参数的选择仍没有形成一个统一的模式。
  
  3.2实例训练及参数优化
  (1)选择核函数。核函数反映了训练数据样本的特性,对于系统的泛化能力影响较大。选择不同的核函数将会有不同的预测结果与精度。在其他参数不变的情况下,通过改变核函数的类型来对输出结果进行误差分析,最终选择多项式核函数来进行预测。其中有3个参数(γ、coe10、degree)需要确定,在LibSVM软件中用分别用符号-g、-r、-d来描述。
  (2)参数优化。核函数选定后,需要人为确定的参数包括(c,-g,-r,-d),它们一般无法直接获得,这里采用网格搜索并结合试算的方法对其进行优化。在实际的训练过程中,我们不难发现,并不需要把取值范围内的所有代表值都带入模型,在试算的过程中,我们将根据实际运行的结果来决定到底哪些是必要的运算。
  
  4结论
  
  本文运用SVM方法建立了库存预测模型,把服务水平作为输入特征,我们可以根据期望的服务水平来预测相应的安全库存额,设定不同的输入服务水平将会得到不同的安全库存额输出,因此能够实现库存的动态预测,有效地缓解了降低库存成本与提高服务水平之间的矛盾,在进行库存决策时具有一定的参考价