APP下载

基于微博的西安市交通拥堵状况时空分布研究

2015-06-05陈宏飞张心萍赵艳慧孙九林

关键词:高峰西安市路段

陈宏飞,张心萍,赵艳慧,刘 广,孙九林,3*

(1陕西师范大学旅游与环境学院,陕西西安710119;2陕西师范大学网络信息中心,陕西西安710119;3中国科学院地理科学与资源研究所,北京100101)

基于微博的西安市交通拥堵状况时空分布研究

陈宏飞1,张心萍1,赵艳慧1,刘 广2,孙九林1,3*

(1陕西师范大学旅游与环境学院,陕西西安710119;2陕西师范大学网络信息中心,陕西西安710119;3中国科学院地理科学与资源研究所,北京100101)

通过自主开发的数据抓取软件获得西安市新浪微博数据,利用文本分析筛选出表达交通拥堵的微博数据,通过多时间尺度分析,得到交通拥堵的月、周内和日分布规律;经过ArcGIS 10.2的点密度分析工具计算及可视化处理,得到交通拥堵的空间分布规律。结果表明:在时间上,交通拥堵与居民工作日通勤、节假日外出等有密切联系;在空间上,交通拥堵与商业区、学校等人流量密集区域等因素有密切关系。研究证明了利用社交媒体数据研究城市交通拥堵问题的可行性。

微博;西安市;交通拥堵;时空分布

目前,我国正处在城市化进程的关键时期,随着城市规模扩大,城市人口、车辆的增加,交通拥堵问题越来越显现,由此也引发了增加社会成本、环境污染等诸多问题。加里·贝克尔研究发现全球每年因拥堵造成的损失占GDP的2.5%[1];就我国而言,全国范围内因交通拥堵造成的损失大约为1 700亿元/年[2]。由于城市发展的不平衡性,城市道路交通状态在空间上的分布具有差异性;由于人们在不同的时间具有不同的出行需求,城市交通状态在时间上的分布也具有差异性[3]。对重点拥堵路段的治理是缓解交通拥堵问题的关键。交通拥堵可分为偶发性拥堵和常发性拥堵[4],常发性拥堵是可以预测的,它也是缓堵治理的重中之重[5]。因此,获取和掌握城市道路交通拥堵状态的时空分布特点和规律成为出行者和交通规划管理者都比较关注的问题,它也是进行交通拥堵原因分析、城市交通规划、交通调控的重要基础。

交通拥堵的时空分布研究,首先需进行交通拥堵点的检测,然后通过较长时间数据的积累和分析实现时空分布研究。针对拥堵点的检测,以往研究中主要通过以下三种方法实现:利用计算机图像识别技术,通过道路视频监控对交通拥堵点进行自动识别[6-8];利用GPS定位技术,通过对监测车辆运行速度、行驶时间的分析对交通拥堵的检测[9-10];通过实际调查或问卷形式对交通拥堵的确定[11-14]。

交通拥堵无明确定义,主要是人们的一种心理感受[15]。对交通状态判断是否准确,最直观的验证依据正是人对交通状况的感受。因此,交通状态的评价,必须结合人的亲身感受[16]。实际调查或问卷调查的方式本质上也是通过人的感受评价交通状况。

近年来,通过大数据、数据挖掘,并运用新地理信息技术和方法论对新兴领域进行探索成为地理学研究的新方向[17]。社交媒体主要包括社交网站、微博、微信、博客、论坛、播客等形式,其最大的特点在于广大互联网用户的参与性。国外有部分学者通过社交媒体的手段来研究道路交通状况。Kosala和Adi[18]通过对Twitter中交通信息的提取,开发出一套用于监测雅加达交通实时信息的系统。Sakaki等[19]提出了一种将社交媒体作为社会传感器,通过对Twitter微博数据进行语义分析,从而检测出交通拥堵状况及发生位置的方法,研究表明交通拥堵检测准确率为87%,位置检测准确率为85%。

微博的广泛使用为社交媒体大数据提供了一个重要来源。微博用户可以分享个人的日常生活、情感等与个人活动有关的信息[20-21]。每条微博信息中都有发布时间、发布内容、发布者等信息,同时用户使用签到功能发布的微博还包含发布时用户所在地点的经纬度坐标。因此,通过分析相应的微博信息,可以得出微博用户在何时何地进行什么活动。同时通过微博信息内容分析可以得到热点社会事件及自然事件。因此,国外有关学者又将社交媒体称之为社会传感器(Social Sensor)[22]。

本文基于新浪微博签到数据,通过对微博正文的文本分析筛选出表达拥堵的微博数据,从而分析交通拥堵的时间和空间规律。

1 数据来源与研究方法

1.1 数据来源

通过新浪微博API接口,利用研究团队自主开发的抓取软件抓取了西安市以钟楼(34.260 940°N,108.942 292°E)为圆心,半径为11 132m的西安市微博签到数据。该区域基本涵盖西安市三环以内大部分区域。对于获得的数据保留经纬度坐标、发布时间、内容等字段。数据抓取时间区间为2013年7月3日至2014年7月2日(其中2013年10月19日、11月1日、11月2日因设备故障未抓取到数据),共获得微博数据5 219 643条。

1.2 数据处理方法

将抓取到的数据经过结构化处理,存储在SQL Server2008数据库中。根据项目组预研结果,西安市居民在微博中主要以“堵车”、“堵死了”等词汇描述交通拥堵状况。因此,在数据处理中,先以包含关键字“堵”进行初步筛选,共筛选出微博20 083条。对这些微博内容经过人工判读,去除包含诸如“心里堵得慌”、“下水道堵了”等没有表达交通拥堵状况的微博数据,最后得到表达交通拥堵状况的微博19 551条。筛选后的部分微博数据见表1。

表1 表达拥堵的微博数据示例Tab.1 Samples of micro-blog data about congestion

1.3 研究方法

将表达拥堵的微博视为在经纬度坐标标识处、在发布时间时报告一次交通拥堵,把处理后表达拥堵的微博数据根据经纬度坐标通过ArcGIS10.2导入到西安市地图上,然后对拥堵微博点进行点密度分布计算。

并将计算结果通过自然分级法分为高、中、低3类区域,本文将包含在高分值区域的道路定义为易拥堵路段,将包含在中、低分值区域的道路定义为一般道路。

2 结果与分析

2.1 交通拥堵时间分布规律

将表达拥堵的微博数按月统计(见图1),发现9月份、10月份是最易发生拥堵的月份,表达交通拥堵的微博数分别是3 068条和2 751条;2月份是最不易拥堵的月份。

将表达拥堵微博数逐日统计(见图2),表达拥堵的微博数超过200条的分别是2013年9月2日、9月18日、10月1日、10月2日、10月3日、11月22日和12月24日。其中最拥堵的一天是9月18日,即中秋节小长假放假前一天;9月2日为星期一,是西安市中小学秋季开学第一天;10月1日、10月2日、10月3日为国庆节小长假前三天;11月22日为星期五且有小雨;12月24日为平安夜。

图1 拥堵微博数的月份分布Fig.1 Distribution of micro-blog data about congestion by month

图2 拥堵微博数的日期分布Fig.2 Distribution of micro-blog data about congestion by day

分别对2013年9月2日、9月18日、9月30日、10月1日、10月2日、10月3日和12月24日的拥堵微博数据进行统计,将其分别与一年来对应时段拥堵微博数的平均值相除,得到拥堵微博倍数如图3所示。可以得出,2013年9月2日拥堵主要发生在早高峰时段,持续时间较短,但拥堵程度非常强;9月18日拥堵主要发生在晚高峰时段,且从14点开始一直延续至20点,在18点左右达到峰值;9月30日拥堵主要发生在晚高峰时段,主要集中在16至19点;10月1日、10月2日、10月3日拥堵情况基本相同,早晚高峰时段与每日拥堵平均值基本相同,主要拥堵时段发生在11点至13点及20点之后。其中10月1日在16点也有一次拥堵高峰;12月24日拥堵主要发生在中午时段,集中在11—16点。

图3 主要拥堵日拥堵微博倍数统计Fig.3 Micro-blog data about congestion in main congestion days

对每周七天数据进行统计(见图4),一周内最不易拥堵的为星期天,最易拥堵的为星期一,其次为星期五;星期二、星期三、星期四、星期六情况基本相同。

图4 拥堵微博数按星期统计Fig.4 Number of micro-blog data about congestion by week

居民出行具有早、晚出行高峰的特点,将每周七天的早晚高峰时段表达拥堵的微博数据按照10min为周期进行统计。在每周当中,早高峰时段拥堵情况最易发生出现在星期一,且拥堵持续时间最长;星期二、星期三、星期四、星期五早高峰发生拥堵的基本规律与持续时间基本相同;星期六、星期天早高峰没有出现较为明显的拥堵微博数量急剧上升的情况。

在晚高峰时段中,拥堵最易发生在星期五,且拥堵持续时间最长,最拥堵时刻在18点40分左右;星期一、星期二、星期三、星期四较易发生拥堵,高峰拥堵时刻出现在18点30分左右;星期六、星期天没有出现较为明显的拥堵微博数量急剧上升的情况。

2.2 交通拥堵空间分布规律

根据预研结果,非节假日的早晚高峰拥堵状况有较强的规律性,而非早晚高峰期间拥堵分布具有较大的偶然性。因此,将非节假日早晚高峰拥堵微博数据通过ArcGIS 10.2中的点密度分析工具进行可视化分析,按自然分级方法分为3级,在分析结果中将最易拥堵的早高峰、晚高峰路段进行筛选,分析结果如图5。

从拥堵路段来看,早晚高峰易拥堵路段有:解放路(东八路至火车站段)及环城北路东段、北大街(莲湖路十字至北门段及东西向附近的西七路、西五路、莲湖路等)、尚德路(东大街至东新街段)、南门附近、和平路(和平门至西六道巷段)、太白北路(太白北路与友谊西路十字段)、高新路(科技路十字至南二环桃园桥立交段)、小寨十字、西沣路(绕城高速入口处)等18处。按易拥堵路段集中程度来看,早晚高峰发生的路段集中在钟楼商圈(明城墙内)、高新商圈、小寨商圈等主要商业聚集区。以城墙内交通拥堵最为密集,其次为高新商圈。早高峰与晚高峰易拥堵路段重叠区域极高,说明早晚高峰拥堵路段基本一致。早高峰相对晚高峰,拥堵路段范围更大。

图5 西安市早晚高峰交通拥堵空间分布Fig.5 The spatial distribution of congestion in Xi'an city in morning and evening rush hours

2.3 结果对比验证

根据高德地图2014年8月24日发布的《2014年第二季度中国主要城市交通分析报告》[25]及对西安市十大拥堵路段分析结果对比发现,高德地图分析得到西安市2014年第二季度十大拥堵路段为西二环路(洛门路到丰登南路段)、东二环路(辛家庙盘道到华清路立交段)、太白北路(太白立交到丰庆路段)、二环南路东段(沙坡盘道到长安路立交段)、二环南路西段(丰登南路到长安路立交段)、环城北路东段(太华立交到安远门桥段)、太白南路(丈八东路到太白立交段)、西二环路(丰登南路到洛门路段)、环城南路东段(南门环岛到咸宁西路段)、长安南路(雁环路到雁塔西路段)。其中,环城北路东段、环城南路东段、西二环路(双向)、二环南路西段、太白北路、太白南路7处路段与早晚高峰拥堵分布基本一致。这7处路段均包含在早晚高峰拥堵分布图中的对应极易拥堵路段中。此外,结合西安市交通管理局2014年部分同期月份交通运行情况通告,9月份中小学开学、中秋小长假等因素影响,市区交通流量增长明显,早晚高峰部分路段交通压力较大[26];国庆节前三天交通流量最高[27]、晚高峰主要集中于17:30—19:30[28]等特点均与本研究中的交通拥堵时间分布规律一致,因此,本研究中涉及的交通拥堵时空分布规律与相关研究及交通拥堵实际情况具有较高的一致性。

3 讨论

城市交通拥堵的原因有多方面,主要原因在于特定时空下供给小于需求所致,主要体现在以下几个方面:

(1)机动车保有量的迅猛发展是城市交通拥堵的主要原因。2010年西安市机动车保有量为119万辆,仅用4年时间,2014年7月3日,西安市机动车保有量突破200万辆大关[29]。机动车保有量的急剧增加使得城市道路供需矛盾更加突出[30],交通拥堵发生概率极大增加。

(2)城市布局、传统商圈、公共事业单位密集区对交通拥堵空间分布影响巨大。传统商圈为居民出行主要区域,人流、车流密集。钟楼、小寨、高新等商圈都有相应路段属于极易拥堵路段。尤其是钟楼商圈,由于城墙形成的相对封闭空间以及该区域在西安市发展过程中集中了商业、住宅、行政、旅游等功能,使得钟楼商圈范围内极易发生拥堵。学校聚集区是影响交通拥堵的主要原因之一[31]。北大街(莲湖路十字至北门段)及后宰门、西七路区域集中了1所幼儿园(实验幼儿园)、3所小学(新知小学、育英小学、后宰门小学)、2所中学(八十九中、爱知中学),成为早晚高峰拥堵主要路段之一;高新路沿线有高新一小、高新一中、高新一幼,与高新区早高峰上班族集中出行叠加,使得此路段也为早晚高峰拥堵主要路段之一。

(3)节假日出行、工作日通勤等居民集中出行需求对交通拥堵时间分布影响巨大。开学季与较为密集的小长假因素叠加,使得9月份、10月份为一年中最易发生拥堵的月份;春节长假,受传统习俗影响,外来人员回家探亲及绝大部分企事业单位放假,使得2月份为一年当中交通拥堵压力最小的月份。部分节假日出行对交通拥堵影响巨大,影响交通拥堵最主要的节日为中秋节,交通拥堵体现在中秋节放假前一天下午,具体拥堵开始于14点,持续到20点,主要原因在于中秋节前一天下午回家探亲或出行影响。其次影响较大的为国庆小长假,放假前一天下午及长假前3天影响较大;长假前3天交通拥堵主要体现在11点至13点及20点之后,原因在于小长假期间较为集中的上午出行,晚上返程因素影响。另外,平安夜对交通拥堵影响也比较大,具体影响为当天从11点至16点,由于采取交通管制[32],使得19点之后交通拥堵状况与平日基本相同。除此之外的清明节、劳动节、端午节对交通拥堵影响不是太大。从工作日来看,早晚上下班期间相对集中的通勤出行对交通拥堵影响明显,周一早高峰和周五晚高峰为上下班因素影响交通拥堵较大的时段,以周一早高峰拥堵最为严重。

(4)其他因素同样对交通拥堵的时空分布有着重要影响。中小学开学第一天对交通拥堵影响较大;另外,持续晴朗之后的雨雪天气对交通拥堵影响也较大。值得注意的是,多因素的叠加会明显影响交通拥堵状况。2013年9月2日为中小学开学第一天,同时为星期一,当日交通拥堵状况严重;2013年11月22日为星期五,且受多日晴朗之后的降雨影响使得当天为一年内交通拥堵较为严重的一天。此外,车辆随意停放、道路围挡施工也是影响交通拥堵的主要原因之一。尚德路虽不是城市主干道,但长期存在车辆随意停放现象[33],导致拥堵现象严重。和平门、高新路均存在地铁围挡施工,致使此处路段拥堵情况同样严重。

4 结论与展望

(1)西安市交通拥堵状况呈现出一定的时间规律。9月份、10月份是1年中交通拥堵最严重的月份;一周当中工作日早晚高峰交通拥堵明显,周一早高峰和周五晚高峰相对更易发生交通拥堵。中秋节、国庆节、平安夜等节假日以及中小学集中开学对交通拥堵影响较大。

(2)西安市交通拥堵状况呈现出一定的空间规律。明城墙内主城区、高新区、小寨商圈拥堵情况较为严重;学校、医院聚集区拥堵严重。

(3)导致交通拥堵的原因众多。上下班通勤、节假日出行、接送学生上下学等因素是影响交通拥堵时间分布的主要原因;城市格局、商业聚集度、公共服务单位的分布是影响交通拥堵空间分布的主要原因;此外,天气、道路施工、不良的停车习惯等其他因素也在一定时间、一定范围内对交通拥堵造成影响。

城市交通拥堵是目前我国许多城市面临的问题,结合多种技术手段,从不同角度对这一问题进行研究探讨,有利于城市规划、交通规划、交通调控工作,从而缓解交通拥堵压力。由于微博发布的实时性、实地性,通过微博内容筛选的办法可以较好地进行城市交通拥堵监测,通过一定时段数据统计能反映城市范围内的交通拥堵时空分布状况,可以作为城市交通拥堵问题研究的手段之一。但本文使用的微博文本筛选方法较为简单,没有涉及具体语义分析,无法反映某一次具体拥堵发生的持续时间、拥堵强度等问题,后续研究中将在此方面加以弥补与改进。

[1]孙莉芬.城市交通拥挤疏导决策支持系统的研究[D].武汉:华中科技大学建筑与城市规划学院,2005.

[2]冯相昭,邹骥,郭光明.城市交通拥堵的外部成本估算[J].环境与可持续发展,2009,34(3):1-4.

[3]苟锡荣.基于GPS浮动车的城市交通状态时空分布规律研究[D].昆明:昆明理工大学国土资源工程学院,2013.

[4]陈楠楠,周彤梅.缓解快速路常发性交通拥堵的对策研究[J].中国人民公安大学学报:自然科学版,2010,16(1):83-86.

[5]何巍楠.基于浮动车数据的城市常发性交通拥堵时空分布特征研究[D].北京:北京交通大学交通运输学院,2012.

[6]李佳,严余松.基于图像的交通拥堵状态识别系统的实现[J].计算机工程与设计,2011,32(4):1366-1369.

[7]佘永业,赵力萱,罗东华,等.一种交通拥堵自动检测方法[J].计算机与现代化,2013(11):28-33.

[8]Porikli F,Li X.Traffic congestion estimation using HMM models without vehicle tracking[C].IEEE.Intelligent Vehicles Symposium,2004:188-193.

[9]陈青.基于GPS浮动车的城市道路交通状态判别技术研究[D].西安:长安大学电子与控制工程学院:自然科学版,2009.

[10]孙晴,王清华.基于路段行程时间的道路交通状态判别方法[J].长江大学学报:自然科学版,2008,5(4):143-145.

[11]王安琪,关宇辰,张晓棠,等.北京市西三环地区道路交通状况时空分布[J].首都师范大学学报:自然科学版,2008,29(3):69-73.

[12]王德起,许菲菲.基于问卷调查的北京市居民通勤状况分析[J].城市发展研究,2010,17(12):98-105.

[13]王德利,杨青山.北京城区交通便捷性空间分异特征及问题分析[J].经济地理,2012,32(10):49-55.

[14]石京,菅美英,张文言.接送学生机动车对北京道路交通影响研究[J].武汉理工大学学报:交通科学与工程版,2014,38(5):960-964.

[15]邵晓双,谭德庆.城市交通基础设施“公共地悲剧”现象分析[J].城市发展研究,2014,21(4):48-52.

[16]朱广宇,刘克,乔梁.基于TS模型的交通状态自适应神经模糊推理系统建模与仿真[J].北京交通大学学报:自然科学版,2012,36(6):96-101.

[17]郭慧泉,张国友,何书金.近年来美国地理学研究热点问题[J].地理研究,2013,32(7):1375-1377.

[18]Kosala R,Adi E.Harvesting real time traffic information from twitter[J].Procedia Engineering,2012,50:1-11.

[19]Sakaki T,Matsuo Y,Yanagihara T,et al.Real-time event extraction for driving information from social sensors[C].IEEE.Cyber Technology in Automation,Control,and Intelligent Systems(CYBER),2012:221-226.

[20]中国新闻网.新浪微博登陆纳斯达克 曹国伟称市场环境不太有利[EB/OL].http:∥www.chinanews.com/it/2014/04-18/6077631.shtml,2014-04-18.

[21]Ryong L,Shoko W,Kazutoshi S.Urban area characterization based on crowd behavioral lifelogs over Twitter[J].Personal and Ubiquitous Computing,2013,17(4):605-620.

[22]Sakaki T,Okazaki M,Matsuo Y.Earthquake shakes Twitter users:Real-time event detection by social sensors[C].Proceedings of the 19th international conference on World Wide Web.ACM,2010:851-860.

[23]Silverman B W.Density estimation for statistics and data analysis[M].New York:Chapman and Hall,1986:13-18.

[24]Esri.ArcGIS 10.2帮助[EB/OL].http://resources. arcgis.com/zh-cn/help/main/10.2/index.html#/na/009z00000013000000/,2014-05-10.

[25]西安华商网络传媒有限公司.西安十大拥堵路段出炉别以为没进十大堵城就不堵[EB/OL].http://news. hsw.cn/system/2014/08/26/052006270.shtml,2014-08-26.

[26]西安市公安局交通管理局.2014年9月交通运行情况[EB/OL].http://www.xianjj.com/jjcontent.jsp?urltype=news.NewsContentUrl&wbtreeid=10981&wbnewsid=14537,2014-10-09.

[27]西安市公安局交通管理局.2014年10月交通运行情况[EB/OL].http://www.xianjj.com/jjcontent.jsp?urltype=news.NewsContentUrl&wbtreeid=10981&wbnewsid=14963,2014-12-05.

[28]西安市公安局交通管理局.2014年12月全市交通运行情况[EB/OL].http://www.xianjj.com/jjcontent.jsp?urltype=news.NewsContentUrl&wbtreeid=10981&wbnewsid=15183,2015-01-13.

[29]陕西传媒网.昨日西安机动车保有量突破二百万辆[EB/OL].http://www.sxdaily.com.cn/n/2014/0704/c266-5463916.html,2014-07-04.

[30]刘治彦,岳晓燕,赵睿.我国城市交通拥堵成因与治理对策[J].城市发展研究,2011,18(11):90-96.

[33]陆化普,张永波,王芳.中小学周边交通拥堵对策与通学路系统规划设计研究[J].城市发展研究,2014,21(5):91-95.

[32]凤凰网.圣诞平安夜西安部分地区交通管制多条公交线绕行[EB/OL].http://sn.ifeng.com/shanxidifangzixun/xian/detail_2013_12/24/1632313_0.shtml,2013-12-24.

[33]西部网.尚德路、西新街、尚朴路车辆乱停乱放现象依旧[EB/OL].http://news.cnwest.com/content/2014-03/21/content_10898432.htm,2014-03-21.

〔责任编辑 程琴娟〕

Study on spatio-temporal distribution of Xi'an traffic congestion based on micro-blog

CHEN Hongfei1,ZHANG Xinping1,ZHAO Yanhui1,LIU Guang2,SUN Jiulin1,3*
(1School of Tourism and Environment Sciences,Shaanxi Normal University,Xi'an 710119,Shaanxi,China;2Network Information Center,Shaanxi Normal University,Xi'an 710119,Shaanxi,China;3Institute of Geographical Science and Natural Resources Research,Chinese Academy of Sciences,Beijing 100101,China)

Sina micro-blog data of Xi'an city in the past year was obtained by self-developed data ripping software,and the micro-blog data that expressing traffic congestion was selected by text analysis.Through multiple time scales analysis,the distribution of traffic congestion in the month,week and day were obtained.By using dot density analysis tool and visual processing in ArcGIS 10.2,the spatial distribution of traffic jams were obtained.The results show that,in time scales traffic congestion has the closest connection with residents weekday commuting,holiday travelling,etc.and in space scales,traffic congestion has the closest connection with commercial areas,schools and other high traffic density areas.The study proved that the feasibility of using social media data to study the urban traffic congestion.

micro-blog;Xi'an city;traffic congestions;spatio-temporal distribution

F294.3

:A

1672-4291(2015)06-0083-06

10.15983/j.cnki.jsnu.2015.06.463

2015-05-11

国家自然科学基金(41001077);陕西师范大学院士创新项目(999521)

陈宏飞,男,讲师,博士研究生,主要研究方向为社交媒体大数据。E-mail:chenhongfei@snnu.edu.cn

*通信作者:孙九林,男,研究员,中国工程院院士。E-mail:sunjl@igsnrr.ac.cn

猜你喜欢

高峰西安市路段
冬奥车道都有哪些相关路段如何正确通行
病毒病将迎“小高峰”全方位布控巧应对
部、省、路段监测运维联动协同探讨
A Survey of Evolutionary Algorithms for Multi-Objective Optimization Problems With Irregular Pareto Fronts
亲子创意美工展
石庆云
西安市第四医院
基于XGBOOST算法的拥堵路段短时交通流量预测
123的几种说法
基于CA-Markov模型的西安市热环境模拟研究