面向校园消费数据的可视化分析平台研究
2022-03-10曹小平
曹小平,孙 暖
(重庆科创职业学院 人工智能学院,重庆 永川 402160)
1 概述
随着高校信息化建设的不断推进和发展,需要对高校的校园消费进行信息化建设,通过分析大学生和教师的校园消费信息,进一步促进高校的信息化管理和建设,提高高校的智能信息化管理水平,根据校园消费数据分析结果,分析大学生和教师的就餐行为和消费行为信息,可以进一步为贫困生的帮扶以及相关管理措施的制定提供数据基础[1],从而提高校园信息化智能管理水平。研究校园消费数据的可视化分析平台,在高校的智能信息化建设和管理中发挥重要作用,相关的平台建设设计研究受到人们的极大关注[2]。较传统设计方法相比,本文设计的校园消费数据可视化分析平台具有校园消费数据的融合调度处理特点,以及能够计算校园消费数据的窗口最大容纳量的特点,系统稳定性较高,可视化分析能力较强。
设计基于校园消费数据的可视化分析平台,首先进行了平台的总体设计构架分析和功能设计分析,平台的功能实现包括了服务端的实现和客户端实现,主要分析了校园的就餐行为和拥挤度预测,结合数据分析和K-均值聚类方法,实现校园消费数据的可视化分析,从而设计了通用化的校园消费数据可视化分析平台,最后进行仿真测试,得出有效性结论。
2 平台总体设计
2.1 平台构架设计
首先分析校园消费数据可视化分析平台的总体结构构架,并进行校园消费数据可视化分析的功能模块结构设计,校园消费数据可视化分析平台建立在通用计算机平台上[3],校园消费信息分析数据的采集来自于就餐的刷卡相关信息,结合视频监控信息、饭卡充值数据信息以及消费数据信息等,进行大学生就餐信息采集,采用ARM作为核心控制单元,进行校园消费数据可视化平台的嵌入式构造设计,结合物联网技术和ZigBee技术进行的校园消费数据可视化分析平台的网络开发设计,采用VIX总线控制技术构建校园消费数据可视化分析平台的总线模块[4],采用嵌入式总线控制方法,进行校园消费数据可视化分析和信息调度。平台的总体设计构架包括贫困生就餐行为分析模块、大学生就餐行为分析模块、教师就餐行为分析模块以及就餐拥挤度情况预测模块等,首先在用户控制模块进行参数输入,初始化消费统计参数,在数据处理模块进行数据分析和可视化预测,在输出模块显示校园消费的数据分析和统计结果,根据上述总体设计构架,得到校园消费数据可视化分析平台的总体构架如图1所示。
根据图1所示的校园消费数据可视化分析平台的总体结构构架,采用ADSP21160集成处理器系统作为校园消费数据可视化分析平台主控模块,结合PLC逻辑信息分析技术,进行校园消费数据可视化分析平台转换和数据分析[5]。
图1 校园消费数据可视化分析平台的总体构架
2.2 平台的功能设计
为了实现对校园消费数据的可视化分析,需要结合SPSS统计分析技术和传感信息融合技术,进行校园消费数据采样,平台的功能模块分为贫困生就餐行为分析模块、大学生就餐行为分析模块、教师就餐行为分析模块以及就餐拥挤度情况预测模块等,平台分为用户子系统和后台管理子系统[6],首先在用户子系统中建立登录注册模块和账号管理模,构建校园消费数据可视化分析平台的网络通信模块,结合各种消费项目,进行用户的消费行为和就餐行为分析,根据就餐信息反馈结果,进行校园消费数据的可视化平台的用户模块构造,采用信息分类管理的方法,进行校园消费数据的可视化平台的网络控制和用户管理,根据上述分析,得到校园消费数据的可视化平台的功能模块构成如图2所示。
图2 校园消费数据可视化平台的功能模块构成
3 平台功能实现
3.1 服务端的实现
基于C/S客户端服务器建立学生校园消费数据可视化分析平台的服务端模块,在Qt/Embedded中进行学生校园消费数据可视化分析平台的应用软件设计,在Linux内核中开发学生校园消费数据可视化分析平台的移动终端APP,在嵌入式ARM总线控制协议下建立平台的内核结构,进行校园消费数据可视化分析平台的网络模块化开发和嵌入式设计,平台的服务端分为贫困生就餐信息控制、大学生就餐信息控制和教师就餐信息控制等,在CPU寄存器中建立校园消费数据可视化分析平台的客户端,采用ISA/EISA构架模式进行校园消费数据可视化分析平台的总线开发设计,设计校园消费数据可视化分析平台的总线传输协议,综上分析,得到平台的服务端模块结构如图3所示。
图3 平台的服务端模块结构
3.2 客户端的实现
客户端采用标准的JTAG(Joint Test Action Group;联合测试工作组)接口:TMS(Test mode selection;测 试 模 式 选 择)、TCK(Test clock input;测 试 时 钟 输 入)、TDI(Test data input;测试数据输入)、TDO(Test data output;测试数据输出)进行校园消费数据可视化分析分析平台的输出接口设计,实现人机交互设计,在智能控制过程中实现校园消费数据可视化分析和人机交互。通过32位嵌入式设计方法进行校园消费数据可视化分析平台的输出信息调度。选取DS18B20作为校园消费数据可视化分析平台的外围总线,结合交叉编译控制技术,进行校园消费数据可视化分析平台的编译控制和指令加载,设计程序加载模块,进行平台的人机交互设计和人工智能控制,选择ADI公司的ADM706嵌入式处理器作为校园消费数据可视化分析平台总线控制终端模块,利用ADSP-BF537BBC-5A实现校园消费数据可视化分析和总线设计,根据上述分析,得到客户端设计如图4所示。
图4 校园消费数据可视化客户端设计
4 窗口最大容纳量的确定和数据分析
4.1 K-均值聚类
在上述总体设计和功能模块设计的基础上,进行校园消费数据的可视化分析[7-8],采用串口最大容纳量预测的方法进行校园消费数据预测评估,结合K-均值聚类分析技术进行校园消费数据的融合调度处理,构建校园消费数据分布式存储结构模型,假设Nk(k=0,1,…,L)表示第k层校园消费数据主动融合的分布集的个数;表示校园消费数据在数据采样中第k-1层的第i个节点的模糊隶属度函数,采用多层规划的方法,构建校园消费数据主动融合的最大独立平均分布集函数P(n i)={p k|pr kj=1,k=1,2,…,m},初始化校园消费数据的分类区间,在模糊聚类中心F(x i,A j(L)),i=1,…,m,j=1,…,k,采用关联规则挖掘方法,进行校园消费数据主动融合的特征挖掘,得到校园消费数据的模糊隶属函数为:
其中,P fi表示校园消费数据融合过程中的模糊聚类中心,P di为校园消费数据的先验概率密度,设计校园消费数据的区域融合特征分布集,得到模糊统计特征量为:
其中,s c(t)表示校园消费数据的特征属性,ej2πf0t表示直觉模糊信息,校园消费数据的空间分布式存储特征分布为:
假定校园消费数据的簇内分布函数:
对校园消费数据采用空间区域信息融合的方法进行K-均值聚类处理,实现校园消费数据的优化聚类,聚类输出为:
其中
根据上述分析,构建校园消费数据的窗口最大容纳量模型,结合K-均值聚类算法,进行校园消费数据的可视化分析和调度[9-10]。
4.2 窗口最大容纳量的计算
在采用模糊K-均值聚类算法实现校园消费数据特征量聚类分析的基础上,进行窗口最大容纳量计算[11],对关联系数ρ(k)进行自适应修正,得到校园消费数据窗口最大容纳量的约束函数:
其中λ为校园消费数据的统计特征量,通过对校园消费数据的信息融合处理,建立校园消费数据模糊聚类和自适应调度模型,输出为:
结合校园消费的数据的模糊度检索方法,得到校园消费的数据的预测模型为:
据上述预测结果,实现校园消费数据的窗口最大容纳量计算,根据计算结果实现就餐行为和拥挤度预测分析[11]。
5 校园消费可视化分析
为了分析时间段与刷卡次数的关系,收集三食堂周一到周三从10:00到13:00时间段内的pos机的刷卡次数,每隔10分钟统计一次,将采集到的数据进行可视化作图,得到如图5所示,从图中可以看出整体刷卡次数先增大后减小,在12:00左右达到峰值,因为12:00是学校下课学生开始午餐时间,所以此时刷卡人数回达到最高,符合实际情况,随后随着时间的增加,人数越来越少。我们分析了周一到周三的数据,数据的波动程度相似,符合学生的作息规律。
图5 时间与刷卡次数的关系图
接下来我们对学生的近三个月的消费数据进行统计分析,以便对贫困学生的消费水平和一般学生的消费水平进行区分。采取1000个学生近三个月的消费作为样本,取每个月的消费的平均值,并对数据采用归一化处理,采取kmeans算法进行聚类,得到聚类的结果如图6所示:蓝色的点表示蓝色的点表示消费水平在600元以下,有理由认为这些学生中很可能存在贫困生,绿色的点代表消费水平在600-1000元之间属于普通家庭消费,而黄色的点表示消费水平高于1000的人数。通过对学生消费水平的进行聚类可以很容易找到贫困学生,从而对贫困生进行补助。
图6 学生消费水平的k-means聚类
6 实验
6.1 仿真测试分析
根据上述算法设计和系统模块化设计,构建平台的用户表示层、业务逻辑层、数据链路层,在嵌入式Linux内核下,实现校园消费数据可视化分析平台的开发设计,在此基础上进行仿真实验分析,结合Matlab仿真工具,采用Simulink构造校园消费数据的可视化分析平台的接口,设定校园消费数据的模糊采样时间间隔为0.45s,对校园消费数据的离散采样频率为,对校园消费数据K-均值聚类的迭代步数为200,根据上述参数设定,进行校园消费的数据分析,得到原始的数据采集结果如图7所示。
以图7的数据为输入,通过Bridge Api调用原生控件,采用Mysql构建数据库,实现校园消费的数据的可视分析,测试数据召回率,得到对比结果如图8所示:
图7 校园消费的数据采样
图8 数据召回性能测试
分析图8可知,在进行迭代步数的数据召回性能测试时,本文算法召回率对比PID算法和支持向量机算法的召回率较高。设计的校园消费数据可视化分析平台的系统稳定性较好,对校园消费数据的统计分析结果准确可靠。
6.2 聚类指标分析
本文采用F度量值作为聚类结果的评价标准。该方法同时兼顾了查准率(P)和查全率(R)两个指标,P和R分别由下面的计算公式得到。
其中,T P为预测为贫困生的同学是真实的贫困生,即聚类的正确个数,FP为非贫困生被划分为贫困生的个数,F N为贫困生类被划分非贫困生类的个数,T P+FP表示实际分类的同学,TP+FN表示应有的贫困生个数。为更客观地评价聚类性能,本研究对传统的算法进行多次随机选择初始聚类中心完成聚类,对本文提出的初始中心选择算法,也是选取了多个密度阈值进行聚类,分别取各自最佳的一次结果。表1是传统的k-means算法与改进后的模糊k-means算法的F值的实验结果。
表1 与传统k-means算法的F值比较
从表1中不难发现,改进后的聚类算法F值相对比较稳定比传统的FCM和k-means的F值大,这说明本文采取的聚类算法效果较好与上述两种算法,而不像传统kmeans和FCM算法的F值上下波动比较大,此外,改进后的算法总体的聚类准确度有所提高。
7 结语
通过分析大学生和教师的校园消费信息,进一步促进高校信息化管理和建设,提高高校智能信息化管理水平,对接入数据源进行参数初始化设置,实现校园消费的数据分析和统计,提出基于校园消费数据的可视化分析平台。通过C/S模块化设计技术,建立校园消费数据可视化分析平台的服务端和客户端,采用串口最大容纳量预测方法进行校园消费数据预测评估,结合K-均值聚类分析技术进行校园消费数据的融合调度处理,实现校园消费数据的窗口最大容纳量计算,根据计算结果实现就餐行为和拥挤度预测分析。所设计可视化分析平台的创新点是:校园消费数据的融合调度处理与计算校园消费数据的窗口最大容纳量。
在嵌入式Linux内核下,实现校园消费数据可视化分析平台的开发设计。研究得知,设计的校园消费数据可视化分析平台的系统稳定性较好,对校园消费数据的统计分析结果准确可靠,具有很好的应用价值。