基于向前搜索和K均值聚类的信号交叉口行人群集分类方法研究
2015-06-07邓小惠
于 泉,王 萌 ,邓小惠
(北京工业大学 交通研究中心,北京 100124)
基于向前搜索和K均值聚类的信号交叉口行人群集分类方法研究
于 泉,王 萌 ,邓小惠
(北京工业大学 交通研究中心,北京 100124)
以信号交叉口行人群体为研究对象,借鉴生物界群集研究的成果,给出了行人群集的定义,同时提出群集半径的概念和向前搜索的群集半径计算方法。运用K均值聚类方法对北京市信号交叉口60 h视频资料的737个行人群集样本进行分析,得到描述行人群集的特征参数数值。研究结果表明:行人群集半径能够较好地评价我国城市信号交叉口人行横道的服务水平,可以为信号交叉口大量行人过街的控制算法和模型的研究奠定基础。
交通工程;信号交叉口;行人;群集;群集半径
行人交通作为一种健康、可持续性交通方式倍受人们的重视,是城市交通系统的重要组成部分。据中国公路学会《交通工程手册》统计,在人口大于200万的城市中,步行交通在城市总出行量中约占35%,100万~200万人口的城市中约占40%,少于100万人口的城市中约占45%[1]。2011北京市交通发展年度报告显示,北京市居民出行方式中,步行比例早高峰达到24.5%,高于轨道交通、自行车和小汽车的出行比例[2]。
信号交叉口是行人大量集聚扩散的地点。红灯期间,行人高密度集聚等待通行,绿灯启亮后,大量行人放行呈现出短时间内密集通过信号交叉口的现象。这种短时间内高密度行人交通流容易引发信号交叉口处行人与非机动车、机动车交通的相互冲突,造成信号交叉口秩序混乱。同时,由于交叉口行人信号配时设置的不合理也会引起行人过街时间不足,诱发行人抢行,导致交叉口交通事故发生。
因此笔者尝试通过借鉴生物群集的定义和分类方法,总结出大量行人通过信号交叉口的运动规律,从而可以为研究行人群体过街模型奠定基础,进而为改善信号交叉口行人信号配时,以增加行人群体的过街安全性服务。
1 行人群集运动研究
群集行为是目前研究的一个焦点,雁群迁徙行为、鹿群逃避行为等都是群集行为的代表性的例子。现有的群集研究多集中在鸟群、细菌群落、蜂群以及机器人群体等方面[3-4]。群集通常具有匿名性、情绪性、暗示性和感染性,能够从事一定的集合行为[5]。不过,群集一般是由临时参加或卷入事件、活动的人们组成的,并不具备成为稳定的社会构成体的条件。判断一定数量的人或物是否属于群,可以从这些人或物之间是否相互影响,相互作用,是否具有该类群的共同特性来判断。
信号交叉口人行横道的行人密度较高,会导致行人在人行横道上自动集合“成群”过街的现象,这些群和生物界的群集类似,我们称之为行人“群集”。行人的运动轨迹、过街时间和过街安全性等会被这种“成群”的现象严重影响,而这种现象在行人流量大的北京市信号交叉口更为常见。
信号交叉口处行人通行现象由于其道路空间环境和绿灯通行时间限制的影响而呈现出其特有的“短时骤放”的特性。红灯期间聚集的行人只能在绿灯启亮时开始通行,此时人行道会出现短时的行人高峰。笔者研究的目标是通过对大量视频的分析,借鉴生物界群集研究的成果,给出详细的行人群集界定方法,从而为后期开展行人群体过街特性研究提供技术手段。
2 行人群集分类方法研究
信号交叉口的行人群集是在人行横道上成群行走的多个行人组成的群体,组成群集的每个行人之间都存在互相的影响。当然组成行人群集的行人要受到距离的约束,群集中的行人位置不能过于分散。为了更准确地描述信号交叉口行人群集的概念,笔者提出了行人群集半径的计算方法,来约束行人群集中行人位置的分散性。
2.1 行人群集半径
判断一组行人在信号交叉口人行横道上是否构成群集,主要约束因素有对行人数量的要求、对行人间互相作用的要求和对群集中行人位置的分散程度要求。其中定量描述行人群集的因素为群集中行人位置的分散程度。
美国HCM2000手册中对行人在人行横道上的服务水平划分中提出了不同密度下的行人空间标准[6]。即不同密度的行人群对应不同的服务水平,这是一种按行人平均占用空间大小分类的方法,表1中服务水平C,D,E下的行人群密度可以体现大流量下行人通行的情况。
表1 行人人行通道服务水平标准
作为高级生物群体,行人通行时并不是单纯地跟随前面的行人,而是在通行过程中搜寻可能的通行空间,因此在实际通行过程中,行人通行呈现出一个不断地循环搜索周边空间,以便实现尽可能快速通过的过程。因此为了体现行人群集中行人占用空间的影响因素,同时体现行人群集行进的方向性特点,笔者提出一种基于方向搜索的群集半径的计算方法。
2.2 行人群集半径计算方法
群集半径的计算过程是一个循环搜索过程,它是每个行人依次按行走方向搜索之后,与最邻近的行人之间的距离的平均值,具体的计算过程如下。
如图1某行人群体,由8个行人组成,分别标号为A,B,C,D,E,F,G,H。以行人A为例,该行人在行进过程中,其搜索范围能够看到除了行人H外的其他人,即行人A是以自身为圆心形成的前进方向的半圆范围进行搜索的。
图1 行人群集示意
如图2,行人A会在前进方向中不断判断自身与周边行人的间距,即AB,AC,AD,AE以及AF,AG。选取行人A搜索范围内与其他行人的最小距离值min(AB,AC,AD,AE,AF,AG),简记为minA。同理,行人H的搜索范围内与其他行人的最小间距值minH。取该群集中所有8个行人的最小间距值的平均值。即R=(minA+minB+minC+minD+minE+minF+minG)/8。该平均值R定义为群集半径,该值表征了形成该群集的行人之间的最小平均间距,即该通行的群体内行人能够形成群集的最近距离的平均值。行人群集半径客观上体现了行人群体的最紧密的平均水平。
图2 行人搜索示意
要计算群集半径值,需要经过搜索和计算两个步骤。以图3为例,人行横道上某个群集由8个人组成,沿y轴方向(平行于行人行进方向)行走,经过4次搜索和距离计算共9个步骤,最终得出群集半径值。
图3 群集半径计算方法示意
2.2.1 第1次搜索
步骤1:寻找群集中最后1人,即最小Y值点A。
步骤2:按行进方向搜索,得到与A相邻的行人分别为B、F、I,按照间距最小的原则,得到距离A最近的点B,其距离为x1。
步骤3:以点B为起点,按行进方向搜索,得到与B相邻的行人分别为C,G,同样按照间距最小的原则,得到距离B最近的点C,其距离为x2;换C为起点,直到搜索到最大Y值点E停止。分别得到离C最近的行人D,间距为x3,离D最近的行人E,间距为x4。
2.2.2 第2次搜索
步骤4:在第1次搜索剩余的点(F,G,I,H)中,寻找最小Y值点F。
步骤5:同理,以F为起点,按行进方向搜索,得到最近的行人G,其距离为x5;换G为起点,直到搜索到上一次搜索中的点D停止。分别得到距离G最近的行人H,其距离为x6;离H最近的行人D,其距离为x7。
2.2.3 第3次搜索
步骤6:前两次搜索剩余的点,只有点I。
步骤7:以I为起点,按行进方向搜索,得到最近点G,该行人在前两次搜索中已经搜索到,因此搜索停止。距离I最近的行人G,其距离为x8。
2.2.4 第4次搜索
步骤8:行人群集中所有行人都已经搜索完成。
2.2.5 距离计算
步骤9:将确定的搜索路径按搜索方向连接起来,如图3,所有距离的均值即为群集半径:
(1)
按以上群集半径的计算方法和步骤,编写计算机程序,很容易计算出每个群集的计算半径。示例程序界面如图4,通过输入1组行人中每个行人的位置横纵坐标,按顺序计算出每个行人的最临近行人,以及与其之间的距离值,这些距离值的均值即群集半径值。
图4 行人群集半径计算程序界面
2.3K均值聚类分析方法
1967年,J.B.MacQueen提出了K均值聚类算法,用来处理数据聚类的问题,该种算法由于其算法简便,因此在科学和工业领域的应用中影响力极为广泛。该算法解决的是将含有n个数据点(实体)的集合X={x1,x2,…,xn}划分为k个类簇cj的问题,j=1,2,…,k,算法首先随机选取k个数据点作为k个类簇的初始簇中心,集合中每个数据点被划分到与其距离最近的簇中心所在的类簇之中,形成了k个聚类的初始分布。对分配完的每1个类簇计算新的簇中心,然后继续进行数据分配过程,这样迭代若干次后,若簇中心不再发生变化,则说明数据对象全部分配到自己所在的类簇中,聚类准则函数收敛,否则继续进行迭代过程,直至收敛[7-8]。
运用K均值聚类方法对观测得到的所有行人群集半径数值进行数据分类分析,其结果能够用于信号交叉口行人群体服务水平评价和大流量行人交通控制与管理。
3 实例应用
采集了北京市八王坟交叉口高峰小时行人群集过街视频,共60 h的视频资料。八王坟路口位于北京市朝阳区西大望路地铁站路口,路口为4相位混合交通流信号控制交叉口。周边环境为:西南角为SOHO现代城,其总建筑面积为48万m2,拥有48家店铺,283套办公室,1 897套公寓;东南角为在建商业楼,西北角为小区和商业街,东北角为华贸中心,正逐步成为国际金融、企业总部云集的聚集地,无论是现在还是未来都将是重要的交通吸引点,因此该信号交叉口是一个行人流量很大的重要的交通节点。
八王坟路口的机动车、自行车和行人流量均相对较大,除东南角外,其他各个方向均设置地铁进出口,因此吸引着众多人群,在人行横道大量行人过街相互干扰的现象时常发生。以八王坟交叉口视频中提取的737个典型群集为研究样本,样本选择如表2。
表2 群集样本选择
提取出样本群集中每个行人的位置坐标,按照行人群集半径的计算方法,可得到每个群集的群集半径值。
运用K均值聚类分析方法对737个群集样本的群集半径进行分类。分析的结果如表3。
表3 群集半径的聚类分析结果
图5为分析的2组行人群集及其计算的群集半径值。第1组行人群集半径计算值为0.87 m,依此值计算得到的行人空间(前方半圆面积)为1.19 m2/人;同理第2组行人群集半径计算值为1.78 m,依此值计算得到的行人空间(前方半圆面积)为4.98 m2/人 。对比表1,HCM2000手册中的服务水平,可以发现第1组的服务水平为E级,第2组的服务水平为B级。可见群集半径值能反应群集中行人位置的分散程度,可以作为评价行人服务水平的依据。
图5 不同行人群集的群集半径值
4 结 语
将大量行人组成的群体划定为多个行人群集,与一般用密度划分的方法不同,提出了一种用群集半径描述群集行人间疏密程度的方法,将群集半径确定为行人群集的主要划分标准。以北京市八王坟地铁处大量行人分析结果为例,计算了不同行人群集半径,并将数值与行人服务水平加以比照。对比的结果表明,行人群集半径能够作为信号交叉口行人服务水平的有效分析指标。该方法与HCM2000手册中使用行人密度进行服务水平的划分方法对比,能够更细致地进行大量行人的服务水平划分,并给出更为合理的量化指标。
后续研究将继续在不同交叉口处继续增加观测样本量,并能够借此继续开展我国信号交叉口行人群集过街样本的采集,为我国行人服务水平的划分标准值和服务水平提供依据。
[1] 中国公路学会《交通工程手册》编委会.交通工程手册[M].北京:人民交通出版社,1998. China Highway Society “Traffic Engineering Handbook” Editorial Board.Traffic Engineering Manual [M].Beijing:China Communications Press,1998.
[2] 北京交通发展研究中心.北京市交通发展年度报告[R].北京:北京交通发展研究中心,2011:33. Beijing Traffic Development Research Center.Annual Report of Beijing Traffic Development [R].Beijing:Beijing Traffic Development Research Center,2011:33.
[3] Breder C M.Equations descriptive of fish schools and other animal aggregations [J].Ecology,1954,35(3):361-370.
[4] 程代展,陈翰馥.从群集到社会行为控制[J].科技导报,2004(8):4-7. Cheng Daizhan,Chen Hanfu.From swarm to social behavior control [J].Science & Technology Review,2004(8):4-7.
[5] 陈世明.群集行为的建模与控制方法综述[J]计算机工程与科学,2007,29(7):102-105. Chen Shiming.Review of the modeling and control of swarm behavior [J].Computer Engineering and Science,2007,29(7):102-105.
[6] Transportation Research Board.Highway Capacity Manual [M].Washington D.C.:TRB National Research Council,2000.
[7] 蒋帅.K-均值聚类算法研究[D].西安:陕西师范大学,2010:9-12. Jiang Shuai.K-Means Clustering Algorithm Research [D].Xi’an:Shaanxi Normal University,2010:9-12.
[8] 于翔.聚类分析中K-均值方法的研究[D].哈尔滨:哈尔滨工程大学,2007. Yu Xiang.Research onK-Means Algorithm in Clustering Analysis [D].Harbin:Harbin Engineering University,2007.
Pedestrian Swarming Classification Method Based on Forward Searching andK-Means Clustering Algorithm at Signalized Intersection
Yu Quan, Wang Meng, Deng Xiaohui
(Transportation Research Center, Beijing University of Technology, Beijing 100124, China)
Pedestrian groups at signalized intersection were the researched object, the achievements of living things were used for reference, and the conception of pedestrian swarming was given. At the same time the conception of pedestrian swarming circus was defined. Also a method based on forward searching was provided.K-means clustering algorithm was used to analyze 737 pedestrian swarming samplings of 60 hours video data at the signalized intersection, and the values of feature parameters of different pedestrian swarming were obtained. The research result shows that pedestrian swarming circus can evaluate the level of service of pedestrian crossing at signalized intersection in China, and can make good foundation for control algorithm and model of pedestrian crossing.
traffic engineering; signalized intersection; pedestrian; swarming; swarming circus
10.3969/j.issn.1674-0696.2015.01.22
2013-08-20;
2013-09-02
国家自然科学基金项目(51108010)
于 泉(1976—),男,山东海阳人,副教授,工学博士,主要从事交通信息与控制方面的研究。E-mail:yuquan@bjut.edu.cn。
U491.31
A
1674-0696(2015)01-100-05