APP下载

基于LSTM神经网络的公交移动支付预测模型

2018-07-12梁肖裕苗晨山东科技大学信息管理与信息系统

数码世界 2018年6期
关键词:分类器公交时刻

梁肖裕 苗晨 山东科技大学信息管理与信息系统

关键字:LSTM 逻辑回归分类器 混淆矩阵检验

1 应用背景

我们拥有的初始数据集是某城市安装四分之一的移动支付设备时,全部公交的移动支付情况。那么,该城市的公交车全部安装移动支付设备后,当前移动支付人数的四倍约为全部安装移动支付设备后的总乘车人数。利用这个关键信息,使用LSTM神经网络对人数进行预测。

2 LSTM神经网络

LSTM网络的训练采用误差的反向传播算法,当前细胞的状态会受到前一个细胞状态的影响。同时在误差反向传播计算时,当前单元的输出误差不仅仅包含当前时刻T的误差,也包括T时刻之后所有时刻的误差,这样每个时刻的误差都可以经由当前单元的输出和前一时刻单元的输出迭代计算。

经过训练后,我们利用LSTM的记忆特点,对全部安装设备后的公交卡支付人数进行预测,再与移动支付人数进行对比。通过数据对比发现,移动支付的人数一直比公交卡支付的人数多。且在统计范围的28天之内,共计多出1440824人。

3 逻辑回归与混淆矩阵检验

逻辑回归是将线性函数的结果映射到了Sigmoid函数中,Sigmoid函数如图1:

图1 Sigmoid函数

其中x为样本输入,对应的函数为模型输出,可以理解为某一分类的概率大小。而θ为分类模型的要求出的模型参数。对于模型输出,令其让它和二元样本输出y(假设为0和1)有以下的对应关系:如果模型输出值大于0.5,则y为1。

混淆矩阵是一个两行两列的情形分析表,可以用来对分类器进行评估检验。矩阵的每一列表达了分类器对于样本的类别预测,二矩阵的每一行则表达了版本所属的真实类别,显示以下四组记录的数目:作出正确判断的肯定记录(真阳性)、作出错误判断的肯定记录(假阴性)、作出正确判断的否定记录(真阴性)以及作出错误判断的否定记录(假阳性)。

我们将用LSTM预测出的结果放入逻辑回归分类器进行重复训练,每天抽调出400个数据作为训练集,100个作为测试集,对28天的数据分别进行检验。

图2 训练集检验图

图3 测试集检验图

可知重复预测的结果比较理想,再根据混淆矩阵的输出,以2月13日为例,当天一百个测试集的数据的混淆矩阵,得到矩阵打印结果:

即成功率为89%,模型通过验证。

4 结束语

综合来看,移动支付平台由四分之一到全部开放的过程中,增加了一定的固定成本,更关键的是移动支付客流量的大幅增长,经过代入数值计算,可得该城市在全部移动支付平台投入运行后的第13天开始盈利,且第三方支付平台在每位用户处获利0.5%,由于移动支付的客流量增大,故开始盈利三十天内,利润可达到340000元。

猜你喜欢

分类器公交时刻
学贯中西(6):阐述ML分类器的工作流程
冬“傲”时刻
捕猎时刻
一元公交开进太行深处
基于朴素Bayes组合的简易集成分类器①
一种自适应子融合集成多分类器方法
等公交
浅谈多分类器动态集成技术
一天的时刻