智能分析和决策模型在电子商务系统中的应用
2010-04-11任永峰
任永峰,杨 松
(淮阴工学院计算机工程学院,江苏淮安223003)
0 引言
在电子商务中加入决策支持系统是对数据的一种总结,其本身并不能够替代决策者本身,它的主要功能是为了提高决策者的决策效率,帮助企业的决策者强化洞察力。通过决策支持系统将企业决策者的知识、技能和IT技术进行完美结合,使得决策者能够面对迅速变化的市场做出及时的响应,并有效地配置企业的各项资源。
目前有很多关于智能分析和预测的研究,但这些研究大都基于理论上的分析,没有给出实例,或者很多系统都预留了上述功能的接口,但是没有实现。
本文是在一套电子商务系统的基础上对智能分析和智能决策的模型进行研究,希望能给用户的后期决策提供参考。
1 智能分析
智能分析模块主要用来分析实际数据,从宏观的角度去衡量商务平台的运作是否良好、合理。可以采取两种方法来实现:第一,和往年的最佳年度作对比,从中找出差异;第二,请相关的行业专家制定规范的业绩发展标准,用实际的数据如销售数据和专家标准作比较,确定当前的业务发展是否合理。
模糊规则的一般表示形式为:
if A then B(CF,λ)
E为模糊命题表示的模糊条件,可用一个模糊命题表示简单条件,用多个模糊命题表示组合条件;B是用模糊命题表示的模糊结论;CF是模糊规则的可信度因子,可以是一个确定的数,也可以是一个模糊数或模糊语言值;是规则的阈值,用于指定规则被使用的限制。
模糊规则的模糊条件是模糊命题,与之匹配的结论也是模糊命题,故要采用模糊匹配的方法来计算两个模糊命题的相似程度,即比配度。
本系统采用最佳年度对比的方法,具体算法如下:
根据制定的总销量增长比例,确定各商品类的具体需要达到的最低销量值,即盈亏分界销量。盈亏分界分析所提供的信息,对于企业合理计划和有效控制生产经营极为有用,如预测成本,利润,销量等。
变量设置如下:
P——利润,TR——收 入,TC——总 成 本,VC——单位变动成本,FC——固定成本,SP——单价,V——销量。
盈亏分界点分析是以成本性态分析和变动成本法为基础,其利润计算如下:
利润=销售收入-变动成本-固定成本
使利润为零,则销售收入=变动成本+固定成本销量单价=销量单位变动成本+固定成本
v×SP=v×VC+FC⇒v=FC/(SP-VC)
安全边际是指正常销售量或现有销售量超过盈亏分界点销量的差值。安全边际越大,企业亏损的可能性就越小,企业的经营就越安全。
计算各类别商品的相关参数,单价和单位变动成本取加权平均值,销售量取本年度和最佳年度的总销售量,求得两个年度的安全边际率,从而构成一个属于论域 U={u1,u2,u3,u4,u5,u6}的模糊集合A和模糊集合B。
计算两大集合的海明距离和欧几里德距离:
欧几里德距离:
模糊匹配度δ(A,B)为语义距离d(A,B)的补集,从而可得匹配度 δ(A,B)=1- d(A,B)。和阈值λ比较,确定是否和命题条件(专家知识)模糊匹配。
如果确实模糊匹配,则本年度的销售情况良好,匹配度越高,说明销售情况趋于最优化。反之,销售情况不理想,可查看销售增长缓慢或下降的商品类,进行具体地分析,制定相应的对策。由于系统针对某销售企业2009年销售数据进行分析(如表1所示),通过分析得出该年度的销售的模糊匹配度大于门槛值0.6,说明该年度销售情况良好。
表1 智能分析结果
2 智能预测
智能预测模块是根据企业已有的数据,用算法进行处理,并在此基础上实现预测未来发展的趋势。
在本系统中,数据仓库将海量复杂的客户行为数据集中起来,建立一个整合的、结构化的数据模型,在此基础上对数据进行标准化、抽象化、规范化分类、分析,为企业管理层提供及时的决策信息,为企业业务部门提供有效的反馈数据。现在,NCR、IBM、Oracle等厂商都在数据仓库领域有所建树,一些预见性的模型和解决方案已经被建立起来,数据仓库已不仅仅是简单的数据存储,而成为对客户资料进行分析,挖掘客户潜力的基石。
本系统可以帮助企业建立起庞大的数据仓库,但在数据仓库中进行数据挖掘是本系统的最核心的部分。
目前,主要的数据挖掘算法有:分类模式、关联规则、决策树、序列模式、聚类模式分析、神经网络算法等等。在选择数据挖掘算法时,应该根据数据的结构和分析的目的采取不同的算法,有些时候可能采取多种算法相结合的方法来实现分析的目的。结合本商务平台的实际,并考虑到未来计算机技术发展的方向,本系统采用了最新的神经网络中的BP算法。
从本质上讲,人工神经网络的学习是一种归纳学习方式,它通过对大量实例的反复学习,由内部自适应过程不断修改各神经元之间互连的权值,最终让神经网络的权值分布收敛在一个稳定的范围。一个人工神经网络可针对特定的输入模式,通过前向计算得出输出模式和一个特定的解。
感知器(Perception)是由美国学者F.Rosenblatt于1957年提出的一个具有单层计算单元的神经网络。它在识别印刷体字符方面表现出了良好的性能,引起人们很多兴趣。后来许多改进型的感知器在文字识别、语音识别等应用领域取得了进展,使得早期的神经网络的研究达到了高潮。
感知器的输入可以是非离散量,它的权向量不仅是非离散量,而且可以学习调整。感知器是一个线性阈值单元组成的网络,可以对输入样本进行分类,而且多层感知器,在某些样本点上对函数进行逼近,虽然在分类和逼近的精度上都不及非线性单元组成的网络,但是可以对其他网络的分析提供依据。
本系统采用根据以往月份的销售记录预测未来月份的销售情况,由于预测的多变性,所以只能针对相对较小的一个范围进行预测计算,比如针对电子类1到6月份的销售记录预测7月份的销售量。
通过计算1到6月电子类的销售情况,预测7月份的销售数量。确定预测神经网络的结构为n输入单输出的三层结构,此处n=6,由于只有一个隐层,在隐层中设置3n个隐层节点,网络结构为6181。
输入节点的传递函数采用f(x)=x,隐层节点和输出节点的传递函数采用Sigmoid型函数f(x)当 x=0 时,f(x)=0,符合预测条件。输入层和隐层的连接权矩阵为 W=[wij]n×3n,隐层各节点的阈值为 θ=(θj)3n,隐层和输出层的连接权表示为U=[uj]3n,输出节点的阈值为r,一般设为零。
隐层各节点输入量为:
隐层各节点输出量为:
输出节点输入量为:
输出节点输出量为:
3n个隐层节点和输出节点的连接权值的修正量:
输入层n个节点和隐层3n连接权值修正量:
修改wij=wij+△wijuj=uj+△uj
采用多输入单输出的BP网络,对一个输入模式,只能得到一个输出结果。采用多输入多输出的BP网络,对一个输入模式可同时得到多个输出结果,称之为神经网络的并行推理。和传统的一元线性回归,指数曲线拟合,对数曲线拟合相比,采用神经网络的算法的拟合精度大大超过了传统的预测方法。
将1~6月电子类的销售情况的具体数据利用已建立的模型进行计算,如表2所示,得到的预测结果是7月份销售为99.99和实际的销售92相比,误差为7.99,具有比较好的参考价值。
表2 销售智能预测结果
3 总结
本文主要探讨了如何在电子商务中建立智能分析和智能决策的模型,并利用实际的数据对模型进行分析和验证,并得到接近实际的结论。智能分析和智能决策的本质就是以人为本,从人的角度出发,设身处地为客户着想,让客户在实际工作中能够最大化的提高工作效率。
[1]赵品,朱镇.企业电子商务战略实施关键成功因素的实证研究[J].清华大学学报:自然科学版,2006,46(S1):914-922.
[2]Garcia - Molina H,Ullman J D,Widom J.Database System Implementation Prentice Hall,2000(中文版:数据库系统实现)[M].北京:机械工业出版社,2001.
[3]陈芳,金瓯,贺建飚.BP神经网络在预测物流成本中的应用[J].计算机信息,2008(5):175-177.
[4]朱启红,张刚.基于人工神经网络的企业知识管理评价模型[J].科学学与科学技术管理,2003(8):32-34.
[5]林宏渝.SQL 2000决策分析OLAP建置与应用[M].北京:中国铁道出版社,2001.
[6]Matt J,Crouch.怎样用 ASP和 COM 进行 Web编程[M].康博创作室,译.北京:人民邮电出版社,2002.
[7]郑英铎.电子商务安全综述[J].市场周刊·管理探索,2005(2):148-172.
[8]李乃文.C#程序设计实践教程[M].北京:清华大学出版社,2007.