决策管理的公交IC卡数据分析方法研究
2021-06-13李慧珠
李慧珠
摘 要:公交IC的数据存在收集中会遇到数据数量庞大且采集时间复杂等对数据分析造成困难的现实问题存在。当研究关系复杂,潜在多维性规律时,会存在分析盲点。本文将发掘公交IC卡数据内容的深度联系,使用科学的数据计算方式结合客观事实规律做好全方位多角度的数据分析工作。
关键词:决策管理;公交IC卡;数据分析方法
0 引言
一般乘坐公交车采取的计费方式分为分段计费和单一票制这两种方式。有的公交线路存在上车下车同时刷卡的问题,具体情况需要根据城市当地政策进行有效判断。使用二次刷卡模式的公交车IC卡记录机主要能够采集的记录如下,乘车日期、卡类别、上车站号、卡号、卡余额、车辆号、上车划卡时间、下车站号、线路号、本次消费额、卡类别。使用一次刷卡模式的公交车的数据分析也只能明确不同时段客流量的变化和不同站点客流量变化。这样粗略的概括方式显然无法得出科学的公交IC卡数据分析结论。对此需要深度发掘各项IC卡之间的隐含关系做好数据信息补齐工作,为决策管理提供准确的方向。
1 公交IC卡数据采集和预处理方法分析
但从公交车的IC卡机端提取信息数据,并不能满足实现分析客流量分布规律的现实条件。对于从OD矩阵中存在的乘客乘车信息也同样需要纳入考量范围之内。可以使用聚类分析手段实现对乘客上车信息的内部关联性建立。统计学自身的数据归纳整理分析工作使得研究客观对象的数量特征同数量关系更加清晰,整个过程离不开对数据地有效收集分类归纳。数据统计分析能够实现对数据的监督管理,辅助决策和信息咨询等,顺利促进做出科学的决策管理意见。但是在进行数据采集和预处理的工程中要注意对数据的动态走势,依存关系,评价方法做出初步判断整理。数据统计分析仅能作为对数据的初步汇集预判工作,能够从数据的整体数量上描述数据采集需要的速度变化和数据质量,以此明确各项数据关系之间的协调。公交IC卡数据之间通常具有一定的依存关系,结合未来的发展趋势做好数据的客观分析研究工作。通过统计指标如计算增长速度、发展速度、增长水平等来描述客观现象发展的基本特征。通过数学模型或图示来描述或分解各种现象的变化规律。利用聚类的分析方式将某一群体使用共性分类方式,保持这一群体内部的做好样本相似性分析工作,结合相似性以及相应的标准,做出衡量判断标准。事物之间的依存分析关系是指事物之间客观存在的必然联系,做好分析目标之间的内在联系建立。动态分析是从时间发展变化的角度研究客观现象的规律,并预测其未来发展变动的趋势。通过统计指标如计算增长速度、发展速度、增长水平等来描述客观现象发展的基本特征。
2 整理时间顺序做好BP算法分析
公交车的客流记录结合时间的先后顺序做出了合理的观察先后顺利集合安排,
所谓时间序列就是根据数值类型做好事物的运动变化规律整合,帮助人们正确认识事物的内在关系,以求实现事物的内在联系关系建立。时间序列模式表示的基本思想是从时间序列中提取特征,将时间序列变换到特征空间,采用特征空间的特征模式来表示原始时间序列。这样的时间顺序采集能够建立线性自回归滑动平均法的模型。这种模型详细分类为滑动平均模型,AR模型(自回归模型),自回归滑动平均混合模型。结合实际数据分析的现实需要选择合适的模型建立合理的模型建立方式,可以选择BP算法进行分析计算。BP算法作为一个输入到输出的映射分析方式,能够经由隐层和隐节点的理想分析方式做好非线性映射关系的建立。BP算法还具备很强的自主学习能力,能够在整理汇集一定的正确答案分析案例之后做好合适的求解规则选择工作。但是BP算法也一样还存在一定的缺点并不能适用于所有的公交IC卡数据分析方式中去。为了应对现实中存在的不同数据方式需要适当的做好计算方式的结合统一,以求得到更好的结果。
3 BP算法的改进方法分析
为了使得BP算法能够顺利配适不同的公交IC卡数据分析方式,需要做好以BP算法为基础的人工神经网络学习计算方式的优化分析。需要注意的是,从数据样本的采集开始就要做好数据录入抽样调查,网络拓扑结构,学习分析等各个流程的质量控制工作,保证每个环节毫无疏漏保质保量。对于BP神经网络,设计其拓扑结构就是对于给定的某个应用任务,确定网络的层数、每层应选多少个结点(单元)和激活函数。网络的结构对系统的信息处理能力有重要影响,因此网络设计拓扑结构是系统成功运行的关键任务。BP算法的神经网络建立需要结合拓扑结构做好特定工作任务的分析工作。结合需要的网络层级,确定需要激活建立的数据函数和单元节点数量。做好网络结构系统的信息处理,减少网络设计拓扑结构的滞后。采用模拟自然界生物的遗传进化规律得到啟发发明的全局化算法,能够顺利实现非导数的和自适应概率性搜索算法优化。一旦明确网络结构建立合适的神经元和连接权重之间的有效阙值,减少网络之间预测值的误差形式顺利解决算法需要面临的难题。采用样本数据进行简单的测试,确认计算的成效,减少输出和目标输出之间的错误产生。根据以上启示,为了更好的做出公交IC卡的数据采集分析工作,可以使用启发式多目标优化算法。从启发式多目标的优化算法的发展进程可知,其一共有三种组合方式。研究人员可以根据自己的现实需要做好选择。第一种是指在启发式多目标优化方法刚产生的阶段,主要是利用帕累托等级排序的方式,以及个体的适应差值来保证整体参数的多样性。涉及到的计算方法有矢量评价遗传计算方法,多目标遗传计算方法以及非支配形的多目标遗传算法。第二阶段是在第一种方法的优化之上,升级成具有一定科学性的降低算法复杂程度的同时能够获得最优的帕累托解集。一般分为具有第二代强度的帕累托进化计算以及根据区域划分选择的多目标进化算法以及非支配排序多目标遗传计算方式。第三阶段的启发式多目标优化方式侧重于解空间以及合理分布解集的角度处理方式实现多目标的共同处理,进而解决更高维度的系统优化问题。这一阶段同之前两种方法的明显区别就是具有智能搜索的功能求解运算速率更快。涉及到的计算方法有多目标粒子群优化计算,分布式估计策略多目标计算以及第三代非支配排序多目标遗传算法。为了更好的适应求解的深度和广度当下的启发式多目标优化方式方法总体呈现出多元化的发展态势。
4 结语
对公交IC卡的相关数据进行采集有助于做出科学的决策管理工作,针对不同地区的公交车运行方式做出合理的信息采集工作。结合实际需要的数据关系建立做出合理的算法结合选择工作,以求实现对公交线路的科学管理,实现增加营收的同时提供更好的便民利民服务。
参考文献:
[1]崔诚靓.基于公交IC卡与GPS数据的乘客使用特征分析——以上海市为例[J].交通与运输,2020,33(S1):231-235.
[2]刘成梅.基于公交IC卡数据的乘客出行特征分析与挖掘[D].西南大学,2020.
[3]余坤,赵向宇,李韫慧.基于公交IC卡信息的城市公交满载率指标计算方法[J].交通运输研究,2019,5(5):49-54.
[4]贾奕宁.基于下车和换乘行为一体化识别的公交客流OD推算研究[D].华中科技大学,2019.