基于BP神经网络的警情预测模型的研究
2015-10-09段开宇徐漫琳
段开宇 徐漫琳
摘 要:BP神经网络是重要的分类预测方法之一,该文一方面在考察与分析单一因素预测警情的基础上,探讨了一种由多个因素作为神经网络的输入层的预测模型,另一方面,通过合理部署警力、强化重点区域管控等相关防控措施,重新进行引导预测,为维护社会治安提供动态监控和科学决策。
关键词:人工神经网络 警情预测 决策支持
中图分类号:TP311 文献标识码:A 文章编号:1672-3791(2015)06(c)-0230-02
对于公安来说,要保证社会治安稳定良好,就必须在接处警工作中降低辖区内警情,从而针对性的按照案件发生辖区对所有案件发生数量进行预测,根据预测结果分析出哪些辖区的警情会增加,从而可以适当增强这些辖区的警力配置。而警情的产生是一个复杂的非线性动态系统,利用传统的时间序列预测技术很难揭示其内在的规律。该文在利用神经网络技术的基础上,探讨了一种面向公安警情分析、预测和决策的的预测模型。
1 BP神经网络的理论研究
1.1 BP神经网络结构及处理单元模型
BP 神经网络结构如图1,由输入层、隐含层、输出层共三层网络组建而成,为了不失一般性,选取BP神经网络任意两层介绍其处理单元的数学模型。BP神经网络处理单元的结构,如图1-1右上所示,其中L1层的n个处理单元与L2层的p个处理单元全连接,连接权向量;L1层的n个处理单元的输出构成了L2层各个处理单元的输入列变量,L2层各个处理单元的阈值为,因此,L2层各个处理单元接收的输入加权和为[1]:
(1.1)
L2层各个处理单元的输出由转移函数决定。BP神经网络通常采用Sigmoid函数作为转移函数(在实际应用中,也可以采用双曲正切函数作为转移函数)。
BP神经网络选取Sigmoid函数作为转移函数是因为Sigmoid函数的输出接近生物神经元的信号输出形式,能够模拟生物神经元的非线性特征。同时,Sigmoid函数具有的非线性特征也能够增强神经网络的非线性映射能力。
1.2 误差反向传播学习算法
BP神经网络采用BP算法进行学习,其学习过程分为四个阶段[2]:
(1)学习模式是由输入层(不做处理)经过隐含层然后,向输出层逐层传播的“顺传播”过程;(2)网络的输出层得期望输出与实际学习模式的输出之差,即误差信号,是由输出层经隐含层向输入层逐层修正连接权值的“误差逆传播”过程;(3)由“模式顺传播”过程和“误差逆传播”过程反复交替进行的网络“记忆训练”过程;(4)网络趋向收敛,即网络的全局误差趋向极小值的“学习收敛”过程[2]。
前人已经对这方面内容有了深入的研究,这里就不在详述。
2 基于BP神经网络的警情预测模型分析
2.1 单因素预测建模过程
在传统的神经网络警情短期预测中,大部分采用的是滑动窗口时间段内的警情数量,作为神经网络的输入,即网络的输入层,选取的是一段连续时间内连续的警情数,未来的预测值作为输出,然后通过样本训练进行权值的学习。在现实生活中,警情的发生因素很多,这种预测方法中对预测因素的分析是明显不足的。上述这种预测方法叫做现状外推预测,即通过对历史警情数的提取,在当前客观状态下,对未来警情数的预测;在实际生活中,警情的发生有很多因素,诸如由于警力部署、季节性流动人口的不同,会导致辖区某地区发生的警情数也不同。另外,警情数预测的目的是通过调整警力或者有针对的预防措施减少辖区某区域的发案数。
2.2 改进的警情预测建模过程
介于上节所述原因,我们尝试在使用神经网络预测过程中,加入了环比警情数、部署警力数、该地区常住人口数、暂住人口数及重点防控区域数灯相关参数,使用神经网络做预测分类是,首先要确定网络输入层、隐含层和输出层神经元节点的数量,输入层,节点主要选取影响预测目标的各个因素,即上述包含的相关参数。输出层节点,主要选取要预测的未来警情数。所以,在实际仿真中选择三层前馈式的神经网络网络,包含了7个输入节点和1个输出节点,具体如图2所示。
从图中我们可以看出该文所使用的模型相比单因素的神经网络预测模型具有较大的改进,由于加入了几个影响警情发生的要素,我们可以在外推预测阶段结束后,根据实际情况作出调整,诸如由于放假造成的流动人口增多或减少。根据防控要求作出的警力调整等各方面条件之后,再次进行预测,形成了有目的的预测。
3 样本训练及预测结果分析
建立预测模型,至少需要2组数据样本,前一组数据用来构成训练样本,对神经网络单元的权重、阈值进行训练,后一组数据作为检验样本对预测结果进行检验。该例子中选择了某派出所2014年4月到2015年4月的实际数据作为样本。对样本进行归一化处理,势必导致数值大的分量绝对误差变大,一般而言,样本的输入和输出值都限定在0.1至0.9之间。在训练ANN时,应根据情况确定输入输出层的各神经元所代表实际量的最小、最大值Xmin,Xmax,通过代入逆变换公式换算出的真实量。
故,对原始数据按照BP人工神经网络的具体算法的第一步,归一化处理原始数据,可将原始数据转化为[0.1,0.9]上的无量纲指标属性值,如表2所示。
利用训练完成后神经网络的结构和权值参数,我们首先将剩余的其他没有参与训练的测试数据,作为神经网络的输入,进行警情数的预测,然后通过网络的输出值与实际值比较,以此来验证预测模型的准确度和泛化能力。
4 结语
该文从预测结果比较所示可以得到的结论有:(1)预测数据与真实数据在数值上尽管存在一些差距,但是在升降的趋势方向上是较为准确的。(2)改进的多因素BP神经网络预测模型采用了8个影响警情发生因素指标作为神经网络结构中的输入,利用神经网络的自适应、自学习能力对历史样本数据进行训练,通过网络的输出获得了与真实数据趋势一致的预测值。根据预测的趋势情况,可通过强化巡逻、不同区域配置不停警力等方式进行引导预测,这样可以如实的反应出变更防控措施后的优势与不足。
参考文献
[1] 刘莉,徐玉生,马志新.数据挖掘中数据预处理技术综述[J].甘肃科学学报, 2003,15(1):117-119.
[2] 马锐,人工神经网络原理[D].北京:机械工业出版社,2010.
[3] 焦李成.神经网络系统理论[M].西安:西安电子科技大学出版社,1996.