电子商务网站性能研究——多类队列网络客户行为模拟思路探索
2014-03-26青海大学现代教育技术中心杨新存
青海大学现代教育技术中心 杨新存
随着科技文化的迅速发展,网络技术同时也在不断完善与成熟,当前电子商务活动已经取代了人们在实际活动中的部分商业活动,成为了目前兴起的新型交易方式。其中网站作为电子商务交易的重要终端,其系统性能对商务活动处理产生较为直接的影响,因此,在电子商务网站开发与构建的过程中,针对其具体性能的分析与后期规划是网站开发的关键环节。它是保障系统响应速度,提升网站使用效率,提高站点应急处理突发流量的关键。同样,网站的站点流通量也是影响客户行为的关键,以下主要针对多类队列网络客户行为进行了研究。
1 客户行为变化概述
在电子商务网站中,客户在具体的数据访问期间所发出的整体数据请求与站点之间的交互联系,称作会话。在不同的会话中,客户行为均存在着一定的差异,发送的请求也大不相同。大体可以将其分为客户的登录行为、网站浏览行为、搜索行为及购物、支付等行为,每个客户均有其不同的网站操作方式。因而在网站设计中可以通过不同频率的变化与操作方式的转换来调节站点,形成不同的行为服务。要抓住客户行为的变化,首先需要建设一个能够反映客户行为变化的模型,来记录在电子商务网站中所呈现的操作状态,并规划出客户行为变化之间的时间要素。
以电子商务中的网上购物为例,若客户已经成为该站点的实名注册用户,在实施购物的具体环节中,客户的行为活动一般包括登录、浏览、搜索、确认选择、加入购物车、完成支付及退出注销等方面。在同一个网络形态的电子商店,不同的客户访问的请求与其频率也存在着一定的差异性。因而,要分析客户行为发生的变化,必须掌握其频率发生转换的概率,建设不同的客户行为转变模型。
2 多类队列网络客户行为模型
在对电子商务网站性能研究中,多类队列网络模拟方法主要是通过以网络队列为系统构建模型来对站点进行模拟分析的方法。单个队列网络是由客户服务中心与客户组成,服务中心主要是系统资源的集合,而客户则是表示其行为请求或事务处理的条件。多类队列模型则是单个队列网络模型的交错集合。在多类队列网络中,资源描述的级别区分主要是由操作详细信息与各细节的具体参数的可靠性决定的。多类队列中,中间队列主要是反映客户行为的整体流向趋势。通常可以将网络队列分为两种不同的模型形式,即封闭式与开放式。若一队列模型中,客户等待资源的需求数量超过网站服务中心既定的资源限制,则将此类模型称作封闭式模型,而开放式模型则与此相反,没有客户请求限制。
一般而言,影响队列网络模型的主要性能参数有六种:第一是网站的站点承载负荷的强度;第二则是客户的服务请求时间;第三则是客户在服务中心排队等候与整体接受服务时间的集合;第四则是客户服务中心,客户的整体数量;第五则是服务对象的利用率;第六则是不同客户所通过客户服务中心的网络速度。分别将其定义为:到达率、服务要求、驻留时长、队列长度、利用率及吞吐量。以下主要构建开放式与封闭式队列网络模型。
(1)多类封闭式网络队列模型。将电子商务站点中,不同客户的请求定义为a,以整体系统固定容量定义为Ra,此时系统所承载负荷的强度变为R=(R1,R2,R3,……,Ra)。以里特定律作为计算依据,将Tc定义为客户请求的整体思考时间,以S表示服务中心,N表示驻留时间,则可得到此时网络吞吐量为:
因此可得出服务中心S的整体队列长度为:
以达到定义作为计算标准,则可得出a类客户请求在客户服务中心S中的整体驻留时间为:
其中Ba,s(R)表示队列的瞬时长度,定义在多类封闭式网络模型中剔除一个客户请求不会对其他请求造成影响,那么得出:
以上式作为计算依据,算出队列的具体长度。具体算法主要是通过对队列中所有的a、s、Qc,k(R)计算出来,将其应用于上式,算出其驻留时间的近似值,并得出服务中心整体队列长度的集合。
(2)多类开放式队列网络模型。在开放式多类队列网络模型中以A作为客户行为的种类数目,以Y作为服务中心的模型数目,设定客户请求a均为较为开放分类,此时将达到率定义为γn,则该模型的到达率则γ=(γ1,γ2,…,γn),其中Dc,k表示a类顾客请求在服务中心S所提出的服务要求,要确保服务中心不会超出负荷,则需保障其满足:
此时可以得出整个网络队列中吞吐量为:
以利用率定律作为计算依据,以Ea,k表示a类请求在服务中心所需耗费的时间,可得出此时的利用率为:
以Fa,k(γ)表示达到a类请求队列S中的请求均数,便可得出驻留时间为:
以里特定律作为计算依据,便可得出队列长度为:
以上式作为计算依据,便可推算出所有客户行为请求在客户服务中心所停留的时间长度集合为:
此时便可根据以上计算公式对多类队列网络客户行为进行分析,进而判定其整体性能。
3 电子商务网站性能分析
电子商务网站的逻辑结构主要包括作为前段服务器的web结构,整体服务器支持的协议及常规网络站点的主页面、处理静态网站请求页面、整个系统执行的应用程序。通常情况下,商务网站的服务器中执行整个系统的应用程序,一般会与数据库交互执行相关的数据请求。商务站点的另一结构便是客户的支付端口,即支持在线支付的服务器端口,主要通过执行系统内部的支付协议,来完成货币资金到金融机构的流转。对网站进行性能分析,需要寻找到影响整个站点负荷承载性能的功能,建立多类队列客户行为,进而分析各具体功能对网站性能所造成的影响。
(1)通过客户行为变化模型来确立影响系统性能的商务功能。设定网站的日均访问具体次数为Mn,以Ys,n表示客户行为转变的概率。此时不考虑客户的退出状态,则可得出客户状态转换的概率:
此时,利用上式结合多类队列网络客户行为方程组,便可计算出其日均访问站点的具体次数,得出处于6个不同状态的客户行为的日均访问次数分别为M1=1.0000、M2=3.8924、M3=3.8924、M4=1.5984、M5=0.15774、M6=0.0487、M7=1.0000。根据结果便可得出结论,客户在电子商务网站中所执行的浏览及物品搜索功能最多,确立选择行为比较多,最少的客户行为则是其将物品放置入购物车及其实际支付。
(2)以多类开放式队列网络作为分析基础,研究其对网站性能的影响。根据前期分析的结果显示,以下主要对客户行为较多的物品浏览、物件搜索、购买选择等三项客户行为进行影响分析。由于每一商务网站访问数据量均十分庞大,且任一站点的访问量上限限制也相当宽泛,因此,在此研究中假定客户的访问行为不会受到客观条件的限制。根据各站点服务器请求发生的概率与客户具体的服务需求作为性能分析的因素,计算出与服务器性能关联较大的服务器利用率及具体停留时间等指标,研究得出,两项因素均是系统内部数据库服务器性能指标高。而Web服务器及应用服务器则性能指标相对而言较小。通过公式计算出各服务器队列的长度分别为web服务器0.1351、应用服务器0.3598、数据库服务器0.8749,其中队列长度也数数据服务器指数最高,进而得出研究结果,在电子商务网站性能研究中,数据库服务器是影响其整体容量规划的重要服务器,需要对其进行进一步探究。
(3)以多类封闭式队列网络作为分析基础,研究数据库服务器中影响性能的组件。假定数据服务器是由简单的系统CPU与磁盘组成,客户在数据库中具体的行为操作主要由查询、删除、添加等操作组成。由于单独的数据服务器系统性能是有限的,因此需要建设多类封闭模型来测试其性能问题。设定数据库系统内部客户行为操作的数据上限分别为10、5、5,此时便可将其代入公式中,算出组成数据库服务器的CPU及其磁盘的具体队列长度为1.237、18.415,得出其CPU的实际利用率高达99.598%,系统的实际相应时间远远大于CPU与之对应的具体值。进而得出在数据服务器中,磁盘是影响其性能的主要原因,因此为提升整个商务网站的性能,首先必须以提升数据库服务器内部磁盘的数据处理能力为出发点,以提升整个站点的性能。
4 结语
总之,通过对多类队列的客户行为模拟进行分析,得出了影响整个电子商务网站系统容量的主要服务器为数据库,而数据库中影响其整体性能的关键又是其磁盘。因此,要提升电子商务网站的性能,必须从解决其数据库服务器的瓶颈问题着手,以解决其磁盘容量问题作为出发点,进一步将电子商务网站的工作负荷参数详细地规划出来,使其更好地为其性能提升提供良好的基础。
[1] 傅柯萌.基于电子商务的客户行为Web挖掘研究[J].现代商贸工业,2009(08).
[2] 王立福.优化ASP.NET的电子商务网站的性能降低成本[J].中国科技博览,2011(24).
[3] 赵文发.电子商务网站中高性能数据搜索关键技术研究[D].武汉理工大学:工业工程,2009.
[4] 龚琪琳,彭雪桃,龚钦.电子商务网站服务器性能计数系统的设计[J].计算机与现代化,2010(09).
[5] 张红,甘利人,薛春香.基于标签聚类的电子商务网站分类目录改善研究[J].现代情报,2012(01).
[6] 汪惠,李玉霞.Excel.Application组件在电子商务网站统计功能优化中的应用[J].商场现代化,2009(06).