APP下载

区域内人群聚集行为分析与预测*

2020-06-09张成才王瑞刚

计算机与数字工程 2020年3期
关键词:大雁塔阈值定义

张成才 王瑞刚

(西安邮电大学计算机学院 西安 710061)

1 引言

随着经济的发展,人民生活水平不断提高,各大商场、著名景点等区域成为群体事件发生的高频区域。1990 年 7 月 2 日,1426 名朝圣者在通往麦加圣地的地下通道里被人潮踩踏致死。这是迄今为止朝觐踩踏事件当中死伤人员最多的一次。2013年3 月28 日西北工业大学附属小学学生在西安曲江海洋馆乘坐电梯时发生踩踏事故,16 人受伤。2014 年 12 月 31 日 23时35 分,上海市黄浦区黄浦江景观平台的人行通道阶梯处发生拥挤踩踏,造成36 人死亡,49 人受伤。这样的例子比比皆是。因此,预防群体事件的发生对于降低公共场所人群聚集风险具有重要意义。

随着经济水平的提高,全国移动电话用户普及率已达到102.5部/百人[1]。移动基站在城市中已经随处可见,电信运营商后台拥有手机的移动轨迹数据。因此本文利用运营商提供的移动终端位置数据,通过统计分析移动基站下移动终端的接入量以及终端轨迹数据,通过马尔科夫链构建人群密度预测模型,最后通过对人群聚集行为的分析最终建立人群聚集行为预测模型。有助于在人群异常聚集行为发生之前采取全面、有效的应对措施,更好地对它进行有效预警。

2 模型建立基础

2.1 转移概率矩阵

矩阵每个元素均大于等于0,而且各行元素之和等于1,每个元素用概率表示,在具备一定条件下是可以互相转移的,故称为转移概率矩阵。为了研究人群在单位时间内的转移情况,给出如下定义。

定义1:人群转移矩阵。假定单位时间城市内人群总数不变,则在时间(t-1,t]内,区域 i 转移到区域j 的用户人数表示为Δaij(t),区域之间用户人群转移矩阵为A,则有

定义2:人群转移概率矩阵:在时间(t-1,t]内,用户从区域i 转移到区域j 的概率为pij(t),区域之间的用户人群转移概率矩阵为P,则有

其中pij(t)=Δcij(t)÷ui(t-1),ui(t-1)为在t-1时刻,区域i中的用户数量。

2.2 马尔科夫链随机矩阵

用户在区域之间的转移为随机事件,不考虑用户离开城市区域的情况,假设用户离开城市区域的概率为0,N为区域总数,所以得出如下结论:

对于任意的i 都满足式(3),即式(2)中的每一行转移概率之和为1,并且0 ≤pij(t)≤1,因此,概率矩阵P 称之为马尔科夫链随机矩阵。可用P 来预测单位时间后的区域下的用户数量。即:

定义3:人群密度。根据当下城市中手机的普及率λ,数据所在运营商的手机市场占有率μ和区域i 的面积ei,可计算出区域i 下的人群聚集量为,所以区域i的人群密度ρi(t)为

结合式(4)可得,未来单位时间后区域i下的人群密度为

3 人群聚集行为分析

要判定当前区域是否发生了人群的异常聚集行为,就需要把当前数据和历史数据进行对比。本文中人群聚集行为预测模型的构建是通过统计分析研究区域人群日常聚集情况,其中包括无突发事件时的人群集量均值sˉ(根据区域特性,按照人群相对较为活跃的时段确定均值)以及当前区域总人数sx。

定义4:阈值T,如果sx-sˉ≥T则认为区域发生了群体事件,反之,则该区域无群体事件发生。

当该区域在有数据记录时段内发生过群体事件时。统计发生异常行为时的人群总数su,定义Di为su-sˉ,然后根据式(7)和式(8)计算得到阈值T。

将所有的Di由大到小排序,定义权值ωi满足ωi=(12)ωi-1,其中i≥2 ,使得Di与其对应的ωi成反比。通过公式(7)求出在权值ωi下Di的平均值,也就是通过统计的异常值求出最小的阈值T。公式(8)中定义Dx=sx-sˉ,作为约束条件。

这里有两种情况,第一种当我们使ωi的值唯一时,求得的T 值大小就处在Di序列的中间位置,该T 值相对来说会略大,当所预测的区域总人数与sˉ的差值D 小于T 时,也有可能会发生群体事件。这样就不能准确地分析出异常。第二种取ω1=1,ω2=ω3=ω4=…=ωn=0,这种情况看似合理,但是由于影响群体事件的因素过多,会使所计算的阈值相对较小,会出现将正常情况误判为群体事件差错,影响预测的准确性。

此外,当研究区域的人群密度达到一定上限时,不管该区域有没有发生过群体事件,都应看作是一个突发事件热点区域。据已有研究表明,人群最大安全密度Qmax约为3.8人/m2。根据监控区域有效活动面积的比值构建人群密度阈值如下:

K 城市中居民的有效活动空间比例系数,根据《城市用地分类与规划建设用地标准》[21]可得,居民的有效活动空间比例为38.5%。

4 人群聚集行为预测模型

根据第2 节对未来单位时间后区域内人群密度以及人群总量的研究,结合第3 节对人群聚集行为的分析。构建出未来时刻的人群聚集行为预测模型为

当m(t+1)值为1时,则表示监控区域即将发生人群的异常聚集行为,0 则表示监控区域人群流动正常。

5 试验与分析

5.1 数据准备

本次试验是针对西安市大雁塔景区的人群集量进行研究与预测。大雁塔景区近年来一直饱受游客喜爱,亚洲最大的喷泉广场和最大的水景广场就在此地,每年来参观的游客数不胜数。经实地勘察,大雁塔是人群聚集行为发生较为频繁的地方,所以对该区域进行研究更加有利于对模型的准确性进行判断。采用数据集为西安市2017 年2 月13日到3 月15 日联通手机信令数据。据已有统计显示,2017 年联通手机市场占有率约为73%,移动电话普及率为102.5部/百人[1]。

5.2 实验结果分析

选取2月16日到3月15日的数据作为训练集,确定阈值T,将情人节当天的数据作为测试集,每隔一小时进行一次测试,针对大雁塔区域对突发事件进行预测分析,预测结果如图1所示。

图1 区域接入量预测统计图

根据式(10)分析实验结果得:人群在16:00 有一次聚集行为的发生,随后区域人数有一个小规模的减少,到晚上八点钟区域人数达到了一天的最大值,经分析定义为一次聚集行为。据调查所知,这两次群体事件发生的时段正是大雁塔北广场音乐喷泉开放的时段。并且本区域人数在下午和晚上均维持在一个较高的状态,因此本区域应属于群体事件发生的高频区域。

5.3 模型预测精度分析

采用准确率对模型进行评价。

分别将2 月13 日与2 月15 日的数据添加到测试集,分别统计了预测结果。根据式(11)得到模型的预测精度为86.1%。

6 结语

根据运营商提供的用户手机信令数据,建立了人群聚集行为预测模型,并对大雁塔区域的人群聚集情况进行了分析预测,预测结果与真实情况比较符合,在一定程度上说明利用该模型对群体事件进行预测是可行的。

猜你喜欢

大雁塔阈值定义
土石坝坝体失稳破坏降水阈值的确定方法
基于小波变换阈值去噪算法的改进
大雁塔
大雁塔即景
掀起大雁塔的“盖头”来
采用红细胞沉降率和C-反应蛋白作为假体周围感染的阈值
对真实的还原
——谈韩东《有关大雁塔》
成功的定义
辽宁强对流天气物理量阈值探索统计分析
修辞学的重大定义