共享单车用户出行目的地预测与分流技术研究
2023-08-19董慧
董 慧
(安徽工业经济职业技术学院 国有资产管理处,合肥 230051)
共享单车的推广符合绿色低碳出行发展要求,能够提升出行便利程度、缓解交通压力,在实际应用环节需配合不同城市的交通情况构建出行目的地预测模型,在设置流量变化、车辆数量及阈值等参数的基础上精准预测出行目的地。
本研究在分析用户出行规律及时空范围内交通情况的基础上,采用深度学习预测模型DPNNst进行目的地预测,以达到整合交通资源、降低出行成本的目的,有助于实现共享发展的目标。
1 共享单车用户出行目的地预测模型建立
预测共享单车出行目的地,需先对用户历史骑行轨迹及地理位置关系、用户行为序列时间关系、天气事件等外部因素进行综合计算考量。深度学习预测模型DPNNst综合了卷积神经网络、长短期记忆网络、全连接神经网络等多种神经网络,在实践应用环节能够准确对共享单车用户出行目的地进行预测[1]。本研究将目的地预测要素分为用户与候选地进行二分类建模预测,根据预测结果,候选地中的位置是目的地则分类为1,否则为0。本研究设计的预测模型整体网络架构有3个层次,分别为用户行为序列、空间地理位置、外部特征,每部分具体建模流程如下。
1.1 用户行为序列
采集用户的历史行为信息,并将其按照时间排序,构成行为序列,进一步组成向量,输入多层长短期记忆网络,利用LSTM系统训练网络,帮助模型快速掌握用户历史行为规律,最终做出行为预测。
统计用户起始点到目的地间的模式计数,按照时间顺序生成行为序列,见图1。
图1 用户行为序列数据Fig.1 Data of users’ behavior sequence
设当前时刻为t时刻、时间窗口为n,序列范围设计为从t-n到t-1,并将其记为[xt-n,xt-(t-1), …,xt-2,xt-1],该序列值表示用户在起始点到目的地之间的骑行次数,此环节如未发生记录,则记为0。
选择定长序列长度,帮助模型分析用户骑行的周期性规律。如训练数据不够充足,也可选择变长序列进行训练,将输入向量设为Xu={x1,x2,…xn-1}。
提取LSTM训练中的第t个输入值,计算其对应的遗忘门f、输入门i、输出门o,得出:
ft=σ(Wf[ht-1,xt]+bf)
it=σ(Wi[ht-1,xt]+bi)
ot=σ(Wo[ht-1,xt]+bo)
ht=ot*tanh(Ct)
(1)
(2)
1.2 空间地理位置
绘制矩阵图分析用户空间地理位置的变化情况,将位置关系以图片形式传输到多层卷积神经网络,在此神经网络中实现训练后传输到多层全连接网络,分析起始地点与目的地的对应关系,计算可能性概率。要注意在时间维度外,还有空间维度,将时空关系映射到二维平面也需构建矩阵,如图2所示,将此矩阵视作表示点与点之间关系,即表示不同地理位置关系的图。
图2 地理空间位置关系卷积过程Fig.2 Convolution process of geographical spatial position relation
通过卷积神经网络,在图2中标记出起始点与目的地,在此基础上生成2通道(channel)的图Xp={xstrart,xdest},其中Xp∈Rr*I*J*2,r表示图的数量,I和J分布为图的宽和高,在进行基层的卷积后,得出:
(3)
(4)
1.3 外部特征
1.4 网络融合
融合三层结构网络,使每个结构的最后一层都连接到全神经网络中,在此部分进行交叉组合,用softmax分类函数对三层结构输出的结果进行分类,得出目的地概率值,其中损失函数需使用交叉熵:
(5)
针对公式(5),使用Adam进行优化训练,得出最终模型结果:
(6)
深度学习预测模型DPNNst的全过程算法见表1。
表1 目的地预测网络算法Tab.1 Destination prediction network algorithm
2 实证分析
2.1 模型评价标准
采用F1值指标,计算参照公式(4),得出模型准确性公式:
(7)
公式(7)中的Precision表示准确率,Recall表示召回率,准确率的计算参照公式(5),召回率的计算参照公式(3),进一步得出:
(8)
公式(8)中TP值表示判定结果,值为正类,属于正确的预测结果;值为负类,属于错误的预测结果[3]。
2.2 实证结果
在实验环节,采用Pythom库函数进行建模,配合使用的编码环境为:CPU版本1.2.1、CUDA 8.0.61、CUDNN版本8.0,运行环境为:处理器Intel i7,内存16GB、显存8G Nvidia-GTX1070显卡。
将LSTM训练网络中的10个隐层定义进行功能划分,设置2层卷积层,内核的大小分别为5*5和10*10,Batch Size值设置在1000上下,Drop-out率设置为0.8。实际训练操作环节采用多个epochs,不考虑设备及其他因素影响,对超参数进行适当调整后取最优结果,深度学习预测模型DPNNst的试验模式与评判标准F1值的关系见图3[4]。
图3 目的地预测模型在测试集上的结果Fig.3 Results of the destination prediction model on the test set
应用DPNNst模型时,只对用户行为序列构成进行LSTMs训练记为DPNNst1,F1值为30.10%。在此基础上添加地理位置空间因素,记为DPNNst2,F1值为32.82%。在用户行为序列及地理位置空间的基础上添加外部特征因素,记为DPNNst3,F1值为34.75%。在DPNNst3的基础上将FCs层数调整到5层,F1值达到41.26%。再将LSTM层数调整到5层,F1值达到42.71%。可见模型输入因素越多,训练层级越多,得出的预测结果就越准确。共享单车用户出行行为具有一定的随机性,导致车辆召回率较低,但在应用过程中该模型能够较好地解决此类实际问题。
3 用户分流技术策略
3.1 推荐还车地点
(9)
3.2 引导用户辅助流量的平衡
(10)