APP下载

基于空间特征的线上消费行为空间特征自动分析系统

2020-10-22罗娇霞彭文武陈政刘杰

现代电子技术 2020年20期
关键词:系统设计

罗娇霞 彭文武 陈政 刘杰

摘  要: 传统基于方差分析方法的线上消费行为空间特征自动分析系统存在系统吞吐率低的问题,为此设计基于空间特征的线上消费行为空间特征自动分析系统。硬件选择DSP处理核心和ARM处理核心组合成双核处理模式,通过不同的接口实现消费者消费行为特征的采集与传输;软件通过驱动代码实现硬件与软件的连接,计算消费者对于空间特征的所属性和消费行为路径的相似性,完成对线上消费行为空间特征的自动分析。测试结果表明,与传统分析系统相比,设计的基于空间特征的线上消费行为空间特征自动分析系统的吞吐率是传统分析系统的2倍,说明所设计的系统更适合应用在实际项目中。

关键词: 空间特征自动分析; 线上消费行为; 系统设计; 双核处理模式; 行为特征采集; 系统测试

中图分类号: TN830.1?34; TP391                 文献标识码: A                      文章编号: 1004?373X(2020)20?0034?03

Spatial feature based automatic analysis system of online consumption

behavior spatial feature

LUO Jiaoxia1, PENG Wenwu2, CHEN Zheng3, LIU Jie2

(1. Central South University of Forestry and Technology, Changsha 410004, China; 2. Hunan Institute of Technology, Hengyang 421002, China;

3. Hunan Institute of Traffic Engineering, Hengyang 421001, China)

Abstract: As the online consumption behavior spatial feature automatic analysis system based on the traditional variance analysis method has low throughput, a spatial feature based automatic analysis system of spatial feature of online consumption behavior is designed. In the hardware, the DSP processing core and ARM processing core are selected to form the dual?core processing mode, and the collection and transmission of consumer consumption behavior features are realized through different interfaces. In the software, the connection between hardware and software is realized by driving code, and the attribute of consumers′spatial feature and the similarity of consumption behavior path are calculated to complete the automatic analysis of the spatial feature of online consumption behavior. The testing results show that the throughput of the spatial feature based designed automatic analysis system of spatial feature of online consumption behavior is twice as high as that of the traditional analysis system, which explains that the designed system is more suitable for practical projects.

Keywords: spatial feature automatic analysis; online consumption behavior; system design; dual?core processing mode; behavior feature collection; system testing

0  引  言

随着移动互联技术的迅速发展,互联网普及率增高,网民数量呈现逐年增长的趋势,线上购物已经成为人们生活中不可缺失的一部分[1?2]。线上消费具有巨大的潜力。分析线上消费行为,得到居民消费所关注的具体内容。针对不同的消费人群组合成最优组合,提高居民对线上消费的满意度,对于没有线上消费经验和线上消费较少的消费者具有指导意义[3]。

随着线上消費者的增加,使用方差分析方法对常规线上消费行为分析已经不能满足当前需求。由于处理的数据量过于庞大,造成系统吞吐率较低[4?5]。为了解决这一问题,设计基于空间特征的线上消费空间特征自动分析系统。通过设计多目标跟踪模块,获得消费者不同消费信息,利用空间特征剖析线上消费空间三元特征,避免冗余数据的干扰,解决常规系统中存在的问题。

1  自动分析系统设计

1.1  系统硬件设计

本文系统通过跟踪技术获取线上消费信息以及消费时的环境信息。为了满足系统硬件功能,采用ARM处理器和DSP处理的双核模式。其中ARM作为主控制器,控制硬件中串口通信、数据传输以及线程调度等功能。DSP控制器负责独立处理计算量较大的分析算法,系统硬件框图如图1所示。

ARM处理器负责处理获取的消费者消费行为信息及相关的数据处理,DSP处理器负责计算量比较大的跟踪算法[6]。其中ARM处理器的任务多数都是计算量较小的任务,ARM处理器选择ARM926EJ?S作为核心,工作主频为297 MHz,满足实际工作的需求[7]。DSP处理器选择C64X+作为核心,工作频率为594 MHz,在DSP核心中设置4个DACs和1个编码器,减少DSP处理器的任务量[8]。

在核心处理器上设置2个输出接口,其中ATA硬盘接口与上位机相连,存储消费者的跟踪数据,通过以太网接口满足上位机对消费者消费行为的跟踪和相关数据的采集。

1.2  系统软件设计

通过void main定义软件与硬件连接方法,利用NumCode设置不同的串口,不同串口的连接通过connect实现,利用for循环语句循环串口,最后通过驱动完成软件与硬件部分的连接[9?10]。

将获取的空间数据按照内在相似性分为若干个类别,使同一类别内相似性较大,类别较小[11]。假设消费者线上消费空间到访记录为[uv]的矩阵[W],则:

[W=α11α12…α1vα21α22…α2v????αu1αu2…αuv] (1)

式中:[α]的取值为1或0;[αuv]表示消费者[u]是否访问过单位空间[v]。采用聚类算法,更新空间内的聚类中心,使每个空间特征样本到其最近聚类中心的距离平方和最小[12]。计算阈值,衡量消费者对其自身空间特征的所属性,即:

[k=xu-yumaxxu,yu] (2)

式中:[k]表示消费者[u]空间特征样本的阈值;[xu]表示该样本到统一类别内的其他样本的平均距离;[yu]表示样本到不同类别样本平均距离。正常情况下,[k]的取值范围在[-1,1],值越大表示对自身空间特征类的所属性越强。在同一空间内,只有路径间相似性强,才能成为典型的消费行为空间特征[13]。测试消费者消费路径相似性的指标计算如下:

[ruv=buv1+quv] (3)

式中:[ruv]表示相似性指标;[buv]表示消费行为路径间相同节点数量占总节点数的比例;[quv]为空间特征距离。当消费行为路径之间完全相同时,[ruv=1];当两者完全不同时,[ruv=0]。

2  系统性能测试

2.1  系统测试环境及相关技术

测试操作系统在Windows 10的计算机中进行,采用Java语言和C++语言实现。软件开发平台为Eclipse。系统软件调用的扩展库主要有JMF,通过Java语言调用JMF类实现对线上消费行为数据的读取。计算机内存为8 GB,硬盘内存为500 GB,CPU为i5?8600K。

2.2  线上消费行为数据集准备

线上消费行为空间特征自动分析系統性能测试使用的数据集来自淘宝电子商务网站。因淘宝网站的产品数据品种较多,零售商较多,其中包含的数据量庞大,产品种类丰富,具有较强的代表性。数据集中包括消费者的线上消费行为数据以及消费产品各项属性,将数据存储在数据库中,使用MySQL数据库管理数据,并通过相同的消费产品将用户关联起来,对数据表中的MEAN_ID属性进行关联,并以MEAN_ID1,MEAN_ID2的格式保存在txt文档中。通过txt2pajek工具,将txt文档转换为可视化工具Pajek软件处理NET形式的文档。数据中用户关系网如图2所示。

图2中的点表示不同用户的MEAN_ID。从图中可以看出,线上消费用户之间形成了一个庞大而复杂的网络,在系统测试中默认该复杂网络确实存在。

在此基础上,将数据汇总为流量,设置成10组不同上行和下行流量,多次测试分析系统的性能。线上行为信息数据流量具体设置如表1所示。

使用以上准备的测试数据,测试系统吞吐率,验证系统的数据处理能力强弱。

2.3  系统吞吐率结果及分析

在以上测试环境中,使用准备好的数据测试系统吞吐率。系统吞吐率是系统在单位时间内满负载的情况下,每秒处理数据流量的能力。

为了验证设计的基于空间特征的线上消费行为空间特征自动分析系统的性能,通过与传统方差分析方法的分析系统进行对比,在相同的测试环境下,针对同一数据集测试。为了比对方便,采用统计软件统计结果。测试结果如图3所示。

分析图3可以看出,图3a)中显示在一定时间内,该系统下行流量数据的吞吐量在30~45 MB之间,上行流量数据在5~10 MB之间,经过计算可知该系统的吞吐率为25.6 MB/s。图3b)中系统下行流量数据的吞吐量在25~33 MB之间,上行流量数据的吞吐量在0~6 MB之间,经过计算系统的吞吐率为12.7 MB/s。证明本文所设计系统的数据吞吐率更好,性能更优越。

3  结  语

线上消费形式在现今社会消费背景下逐渐渗入人们的日常生活中,随着线上消费的普及,线上消费空间也逐渐成为重要研究对象之一。本文设计基于空间特征的线上消费行为空间特征自动分析系统,利用空间特征分析用户线上消费行为,找寻其中的规律,制定使消费者更满意的消费对策。经过系统性能测试,证明了该系统各功能正常,并且有效地解决了常规的分析系统中存在的问题,具有一定的现实意义。

注:本文通讯作者为陈政。

参考文献

[1] 韩增林,谢永顺,刘天宝,等.大连市初中教育消费者的社会空间结构研究[J].地理科学,2018,38(7):1129?1138.

[2] 郎月华,李仁杰,傅学庆.基于GPS轨迹栅格化的旅游行为空间模式分析[J].旅游学刊,2019,34(6):48?57.

[3] 刘金花,李向,郑新奇.多尺度视角下资源环境承载力评价及其空间特征分析:以济南市为例[J].地域研究与开发,2019,38(4):115?121.

[4] 杨晓俊,朱凯凯,陈朋艳,等.城市电影院空间分布特征及演变:以西安市为例[J].经济地理,2018,38(6):85?93.

[5] 夏春萍,雷欣悦,王翠翠.我国农村多维贫困的空间分布特征及影响因素分析:基于31省的多维贫困测度[J].中国农业大学学报,2019,24(8):229?238.

[6] 裴厦,刘春兰,谢高地.赣江上游山洪灾害空间分布特征及生态影响因子分析[J].江西农业大学学报,2018,40(2):413?422.

[7] 吴海霞,杜尚嘉,陈国德,等.鹦哥岭自然保护区药用植物资源种群空间分布特征分析[J].西南农业学报,2019,32(5):981?986.

[8] 曹雪,舒季君,唐根年,等.浙江省创新空间分异特征分析与驱动机制研究[J].科技管理研究,2019,39(9):106?114.

[9] 廉晓梅,吴金华.东北地区人口与经济空间格局演变分析[J].人口学刊,2018,40(1):45?55.

[10] 王斌,陈琳,侯翔宇,等.透明计算中用户访问行為特征分析与预测[J].计算机工程与应用,2018,54(16):49?54.

[11] 王彦雲,李树刚,成连华.基于地铁乘客个体特征的非适应性行为研究[J].火灾科学,2019,28(2):79?84.

[12] 李东进,张宇东.量化自我的效应及其对消费者参与行为的影响机制[J].管理科学,2018,31(3):112?124.

[13] 李欠男,李谷成,尹朝静,等.河北省县域农业绿色全要素生产率的空间特征[J].生态与农村环境学报,2019,35(7):845?852.

猜你喜欢

系统设计
基于FCR的城市地下供水管网应急处置系统设计
基于移动互联技术的通用评价系统的设计
基于UML技术的高校贫困生管理系统建模分析
一种基于SATA硬盘阵列的数据存储与控制系统设计研究
目标特性测量雷达平台建设构想
信息管理服务平台项目应用系统设计探析
基于工程应用能力培养的智能终端课程改革与实践