APP下载

电子商务平台数据质量控制系统及仿真模型分析

2016-12-21徐刚陈红荀启明

现代情报 2016年11期
关键词:电子商务平台数据质量

徐刚 陈红 荀启明

〔摘要〕本文在系统动力学的基本原理基础上,构建了电子商务平台数据质量控制系统的因果关系图,利用VENSIM PLE仿真软件进行系统仿真,从有效性和灵敏性两方面验证了技术进步率及管理因素对电子商务平台数据质量的影响。结果表明,该模型能够较好的拟合现实中技术进步率及管理因素与电子商务平台数据质量的相互关系,并且为电商平台数据质量建设管理提供了相应的参考依据。

〔关键词〕技术进步率;管理因素;电子商务平台;数据质量

DOI:10.3969/j.issn.1008-0821.2016.11.016

〔中图分类号〕F71336〔文献标识码〕A〔文章编号〕1008-0821(2016)11-0087-07

〔Abstract〕Based on the basic theory of system dynamics,this paper built cause and effect diagrams of e-commerce platform data quality control system.This paper conducted es system simulation with VENSIM PLE simulation software and verified the rate of technological progress and management factors impact on the quality of e-commerce platform data quality effectively and sensitively.The results showed that the model could better fit the relationship between the rate of technological progress and management factors and e-commerce platform data quality in reality.Hopefully,this paper could provide some advice on how to manage e-commerce platform data quality.

〔Key words〕the rate of technological progress;management factors;e-commerce platform;data quality

电子商务与实体经济深度融合逐步加深,在优化资源配置的同时,不仅对生产方式,也给我们的生活方式带来了颠覆性的改变。电商平台最大的特点就是“数据化”,数据成为了构成电商平台的重要元素。数据产生在企业的各种业务活动中,相关的数据被平台数据库收集(不通),经由电商平台采集存储和处理分析,提供给数据需求者使用。在此过程中,电商平台会出现诸如,数据不完整、不准确、不可信等关于数据质量的问题,导致数据失效、决策失误。因此,对数据质量的管理与控制、提升电子商务平台数据质量已经成为业界最为关心的话题。

目前对电子商务平台数据质量的研究主要集中在数据挖掘、数据仓库等技术层面,注重对数据采集、存储、处理环节的数据质量[1],忽略了数据质量控制是一个系统、整体的问题。本文在深入分析电子商务数据质量控制系统的构成要素及各要素相互关系的基础上,针对数据质量全过程控制、用户使用满意度、综合影响因素,将数据质量控制系统看成一个整体系统,建立能够刻画电商平台数据质量控制变化的系统动力学模型,并通过仿真对模型的有效性进行验证。本文基于系统动力学原理,构建电子商务平台数据控制系统,通过仿真模型来确立对数据质量控制产生影响的因素,并深入的剖析各因素对电商平台数据质量的影响程度。

1电子商务平台数据质量控制系统影响因素分析

11数据质量全面控制影响因素分析

MIT数据质量项目的负责人Wang教授等人(1997)认为应当将数据看作实体产品,将数据作为具有生命周期的产品进行管理,数据质量的衡量需要贯穿数据的生产全过程与结果[2]。国内学者商广娟(2005)从现代数据质量的概念角度出发,提出要提供和改进数据质量必须对数据运行的全过程进行管理控制。高品质的数据质量是由访客数据生成、采集存储、分析处理与发布共享各个阶段的高品质的综合作用决定的[3]。

电子商务平台数据质量的控制应当贯穿数据生命周期的始终,因此,本文将数据生命周期划分为访客生成数据、数据采集存储、数据处理分析、数据发布共享4个阶段,对数据产品的全过程质量进行系统分析。

12用户使用满意度影响因素分析

电子商务平台数据用户使用满意度已成为衡量其数据质量的重要指标,如Strong等(1997)国外学者认为“数据就是适合用户使用的”,数据质量就是数据满足特定用户期望的程度[1,4];向上(2007)从用户使用角度对数据质量进行判定,认为高质量的数据就是指那些适合用户使用的数据,强调用户的满意度[5]。

结合众多学者的研究,数据质量可以说是满足使用要求的相对状态[6]。本文认为数据的用户满意度需要通过用户期望与电子商务数据质量实际情况共同来确定。

13管理因素、技术应用及信息因素综合影响因素分析在数据运行全过程质量控制中,对数据质量产生影响的因素较多,谷斌(2007)认为管理因素与技术水平是影响数据质量的两个重要因素,无论哪个因素出现消极面,都会对数据运行全过程的产生负面影响[7]。本文也将通过管理因素、技术应用、信息因素这三大因素对数据的收集存储、分析处理、发布共享环节的质量进行分析。

MIT数据质量研究中心将数据质量描述分为4个类别,每个类别下继续分为若干个属性,通过识别出4类对用户有用的信息质量维度来认识数据质量,包括本征质量,应用质量、描述表达、可访问性4个类别。其中,本征质量涵盖了数据的可信度、准确性、客观性;描述表达质量涉及可解释性、一致性、简洁性;可访问性方面的质量涉及平台的可访问性及访问的安全性;应用方面的质量多与用户使用相关联。在对国内外一部分研究数据质量基本要素分类的学者的观点梳理的过程中,认为数据的本征质量、数据表达、获取特性最终大部分会在数据的发布共享阶段体现出来,即以上3种数据特征会对数据发布共享质量产生积极影响,进而作用于电商平台数据质量[2]。

综上所述,本文通过构建全面数据质量控制系统及用户满意度反馈系统,结合管理因素、技术应用、信息因素的综合作用,以技术进步率为核心,分析电商平台数据质量控制系统的变动趋势。

2电子商务平台数据质量控制系统动力学模型

21电商平台数据质量控制系统的因果关系分析

通过对国内外有关数据质量的研究文献进行梳理发现要使电商平台数据质量控制系统发挥效用,关键在于数据质量全过程控制的协调及综合作用,电商平台数据质量最终会通过用户满意度获得体现。用户使用满意度越高,其在使用的过程中产出的数据会成为数据质量全过程控制系统数据的来源,访客生成的数据质量也会随之提升[8]。

此外,数据多样性、数据量、数据增长、变化速度会导致数据来源的复杂性,伴随而来的就是数据来源质量提升,高质量的数据环境是保证数据质量的前提。因此,数据来源质量越高,数据采集存储状态越好[6]。数据采集存储状态良好,会降低数据处理难度,提高数据处理分析能力。宗威、韩京宇等学者(2013)提出强大、高端的数据处理分析技术是数据发挥效能的重要手段,数据处理分析能力会正向作用于数据发布共享质量,为数据的获取和共享提供了条件,增进电子商务数据质量的产出水平[1,10]。技术进步、管理因素会对数据采集存储、数据处理、信息发布阶段管理提供保障和支持。数据发布共享质量受到数据本征质量、获取特性、数据表达的共同影响[11],同时,数据发布共享提供给数据需求者使用,其质量越高,满足用户期望的比重越高,用户满意度越高。用户满意度成为了衡量电子商务数据质量的另一个重要维度,数据质量与用户满意度之间呈正相关关系。

在深入分析电子商务平台数据质量的全过程控制及构成要素的基础上,本文将技术应用、管理因素、信息因素确立为主要的影响因素,并将各个因素之间的相互作用机理通过访客生成数据质量、数据采集存储状态、数据处理分析能力、数据发布共享质量、用户满意度这5个子系统表现出来。其一,访客生成数据质量子系统体现在数据来源的复杂性及用户满意度的作用下,其对电子商务数据质量的影响程度;其二,数据采集存储状态子系统、数据处理分析能力子系统、数据发布共享质量子系统依赖于技术应用、管理因素及信息因素;其三,用户满意度子系统受用户期望与电子商务数据质量的共同影响,是基于数据使用端对电子商务数据质量的外部评价的输出,采用。

通过上述分析,本文通过技术进步率、管理因素、信息因素对数据采集存储状态、分析处理能力、发布共享质量的影响方式,综合评价电子商务平台数据质量,可以得到如下的电商平台数据质量控制影响因素的因果关系图(见图1)。

由图1可知,电子商务数据质量由访客生成数据质量、图1电子商务平台数据质量控制系统的因果关系模型

数据采集存储状态、数据处理分析能力、数据发布共享质量决定,通过用户满意度体现出来。图中决定电子商务数据质量的四大环节由信息、管理、技术三大因素共同影响。本文将技术作为影响电子商务数据质量的核心因素,采用技术进步率这一变量来分析当技术产生进步时,电商数据质量发生变动的趋势及变动效率。技术进步率越大,技术应用越广泛,访客生成数据质量、数据采集存储状态、数据处理分析能力、数据发布共享质量就越好。

22模型假设及系统流图

根据上述因果关系图构建系统动力学流图,本文引入2个状态变量、3个速率变量、15个辅助变量、7个常量建立了电子商务平台数据质量控制的系统动力学流图(见图2),在合理科学分析各变量、常量现实情况的基础上,利用系统动力学相关函数对个变量的数学公式进行设置,为进行系统模拟仿真提供更准确的依据。图2电子商务数据质量控制系统动力学流图

221模型基本假设

(1)电子商务从1995年起,以Web技术为代表的信息发布系统,爆炸式地成长起来,成为目前Internet的主要应用。1990-1993年,电子数据交换时代,成为中国电子商务的起步期。1998年3月,我国第一笔互联网网上交易成功。因此,本文假定系统的初始时间为21世纪初,本模型设定的系统仿真时间为100个季度。(2)由于电子商务发展的初期之前,有电子邮件、Web技术等电子信息技术的基础,因此,初期电子商务数据质量=10。

222模型参数及方程设定

L1用户满意度=INTEG(DELAY1((用户体验-用户期望)/用户期望,8),0)

以用户体验减去用户期望的差值与用户期望的比值,来表示用户期望得到的满足程度,该值越大则表示用户满意度越高。本文对用户满意度这一状态变量采用一阶延迟函数,是因为在用户期望与实际体验的过程中存在延迟,电子商务平台数据质量的用户满意度是一个大众的概念,需要时间缓冲,假设延迟时间为8个季度。

3电子商务平台数据质量控制系统模型的仿真分析

31模型有效性分析

模型有效性仿真对于检验判断模型模拟运行结果的准确性和有效性具有十分重要的意义。因此,本研究借助系统动力学理论与方法,通过Vensim PLE平台对上述模型进行仿真研究,仿真结果如图3所示。

从图3的系统仿真运行结果中可以看出:在技术进步率的作用下,访客生成数据质量在电商平台初期出现了一定的延迟效果,继而呈现递增的趋势,说明在技术进步率的作用下,技术进步、管理因素等会使访客生成数据质量获得改善和提高。当访客数据质量提高到第60个季度时,此时将会保持在一个相对比较稳定的水平上增长,趋势较为平缓,此阶段可以视作访客数据质量进入了成熟期。

数据的发布共享阶段,在前30个季度中,呈现一种低速增长的量变积累过程,当量变达到一定程度后,数据发布共享质量将会以井喷式、爆炸式的形式增长,待推动力乏力后,将会以一种平稳低速的模式改善系统的结构。

用户满意度是电子商务数据质量的一种评价方式,从第1个季度到第25个季度都在以较高的速度在增长着,而在第26个季度之后,用户满意度趋于一种稳定的态势,是因为电子商务发展的前期,用户的需求以及期望不高,用户体验的新鲜感,使得用户很容易就能被电子商务平台带来的利益所满足。当电子商务平台发展趋于成熟,技术的进步,人们对其质量提出了更高的要求,同时用户体验也图3系统有效性检验

越不容易被满足,此时用户需求的多样性等很难被全部实现,用户满意度出现平缓下滑的趋势。

电子商务数据质量在前40个季度(前10年)主要依赖于互联网WEB技术的支持,一直在稳步发展当中,却并未获得根本上的质变,直到21世界初期,智能手机、移动互联网技术的广泛传播才促使电子商务数据质量获得质变,而且数据质量的增长也在以跃进式、倒U型的特点获得发展。

32模型敏感度分析

灵敏度分析的主要用于寻找模型中较为敏感的参数,以此作为调试对象分析和寻找满足系统运行实际的最佳杠杆作用点。根究本文研究目的,主要改变技术应用进行灵敏度测试,一方面改变技术进步率;另一方面是改变管理因素与技术进步率的作用结构。

321改变技术进步率

灵敏度分析的关键在于寻找模型中较为敏感的参数和杠杆作用点。本文研究的核心是技术进步率对电子商务数据质量的推动力,以及该控制系统的作用方式。因此,采用敏感度分析方法对技术进步率进行调整,观察用户满意度、访客生成数据质量、数据发布共享质量及电子商务数据质量的变化趋势。在保持其他参数不变的情况下,将技术进步率的初始值由1调整到5、9等两种情况,通过VENSIM仿真得到图4的结果。

通过不断的提高技术进步率的数值,从数据发布共享质量、电子商务数据质量图形中的斜率获得了提高,表明可以在很大程度上改善数据发布共享质量,从而改进电子商务数据质量。这表明电子商务数据质量依赖技术进步率的作用路径,随着技术的革新,电子商务数据质量控制系统将会越加完善。而访客生成数据受用户满意度的影响,当技术环境中技术取得不断进步时,用户的需求就越多样、对质量的要求也会越高,换言之,用户如果在技术进步并没有得到满足,其用户满意度就会降低,从而会影响访客生成数据质量。

322改变技术应用结构

为了进一步分析技术进步率对电子商务数据质量控制系统的作用方式,保持其他变量不变的情况,考察技术应用内部结构对电商数据质量控制系统的影响,将技术应用=技术进步率09+管理因素01中的系数由(09,01)调整到(08,02)、(07,01),不断降低技术进步率对技术应用的影响比重,提高管理因素的作用力度,结果如图5所示。

通过调整技术应用的内部结构,即管理因素、技术进步率的比重,可以较为明显的从数据采集存储状态、数据处理分析能力、数据发布共享质量及电子商务数据质量这4张图中发现,提高管理因素在技术应用所占的比重,降低技术进步率的比重,以上包含电子商务数据质量的全过程,都存在一种现象,调整后的电子商务数据各过程的质量都得到了提升,并且提升的空间较为可观。

而管理因素与技术进步率的结构的调整对用户满意度图4技术进步率敏感度分析

及访客生成数据质量的影响不大,究其原因为管理因素是电商平台内部因素,对外部数据质量及用户满意度的控制和影响比较微弱。

4模型结论与启示

本文利用系统动力学研究方法建立了电子商务数据质量控制系统的系统动力学模型,在对技术进步率、管理因素、信息因素的分析基础上构建了各变量间的流变量模型,通过VENSIM PLE仿真发现在技术进步率及管理因素的作用下,技术进步、管理因素、信息因素对电子商务数据质量的关系并非简单的线性关系。电子商务数据质量受技术进步率、管理因素、信息因素的影响,呈现指数增长趋势,即是表明受三者的综合作用,电子商务数据质量不仅表现出正向促进作用,而且当量变积累达到一定阶段,会产生质变,以指数增长的情形增长。

41技术进步率对电子商务数据质量存在正向影响

在电子商务的平台建设中,应当注意对技术的开发及引进,做到引进吸收再创新,促进技术的革新与进步,在初期以技术引进为主,加速技术进步的积累过程,完成电子商务数据平台量变的积累。为此,对技术进步的关注及重视,持续保持对技术所涵盖的各种形式知识的积累与改进。然后,技术引进与技术开发并重,技术进步应当为应用创新创造了新的技术。

42电子商务数据质量控制过程质量受管理因素的影响通过改变技术应用结构,调整技术应用的构成,提高管理因素的作用比重,在保持其他不变的情况下,管理因素的作用力极大的改善了电子商务数据质量控制系统的整体质量,尤其是对电商数据质量内部全过程控制的环节的质量和状态有了极大的提升。为此,电商平台应当高度重视管理因素的作用效果,合理发挥技术进步率、管理因素、信息因素的综合作用。从数据收集、数据存储到数据分析处理、发布共享,电子商务平台的管理者应对数据质量管理的建设保持高度关注和重视,提供足够的支持力度。人员的专业素养是保证电商数据质量不可或缺的一部分,加大相关技术人员的储备,为电商平台建设注入活力。另外,企业必须制定科学合理的管理制度和方案来削弱管理机制障碍的负面影响,考虑大数据在各个方面可能发生的种种意外情形,利用专门的数据提取和分析工具,任命专业的数据管理人才加强对大数据的管理,提高员工的数据质量意识,以保证电商平台的数据质量,从而挖掘出更多准确、有效、有价值、高质量的信息。图5技术应用结构敏感度分析

参考文献

[1]韩京宇,徐立臻,董逸生.数据质量研究综述[J].计算机科学,2008,35(2):1-5.

[2]Strong D M,Lee Y W,Wang R Y.Data quality in Context[J].Communications of the ACM,1997,40(5):103-110.

[3]商广娟.有效的数据质量管理体系——21世纪管理的基石[J].航空标准化与质量,2005,(2):18-22.

[4]Cappiello C,Fran calan ci C,Pernici B.Data quality assessment from users pespective[C].IQIS,2004.

[5]向上.信息系统中的数据质量评价方法研究[J].现代情报,2007,27(3):67-68,71.

[6]姜作勤.数据质量研究与实践的现状及空间数据质量标准[J].国土资源信息化,2004,(3):23-28.

[7]谷斌.信息系统建设中的数据质量管理体系研究[J].情报杂志,2007,26(5):65-67.

[8]钟珞,马志军,水俊峰,等.支持电子商务的高性能数据仓库平台的设计[J].武汉理工大学学报,2003,25(2):65-68.

[9]杨迪,马怡安,王铮,等.运营商在大数据背景下对数据质量管理体系的探索及思考[J].互联网天地,2016,(1):73-79.

[10]宗威,吴锋.大数据时代下数据质量的挑战[J].西安交通大学学报:社会科学版,2013,33(5):38-43.

[11]冯缨.网络调查数据质量控制的方法与对策研究[M].上海:上海三联书店,2013.

(本文责任编辑:孙国雷)

猜你喜欢

电子商务平台数据质量
强化统计执法提高数据质量
浅谈统计数据质量控制