用大数据改变城市
2014-04-29
我们的城市变得越来越繁华,问题也越来越多,如交通拥堵、污染等。随着传感器技术的发展和大规模的计算环境的成熟,我们有了很多大数据,如果使用得当的话我们可以利用大数据解决大城市的问题。
城市里面有哪些大数据?有了高速公路与房子连续多年的数据累计,我们就会知道这个城市是朝哪个方向发展;有了北京市酒吧和电影院的数据(兴趣点数据),我们就能知道城市里有哪些商业在衰亡,有哪些商业在发展,有哪些商业模式在变化;有了气温、气压、湿度,这些气象数据,我们就能知道空气质量的变化;有了出租车GPS的热度数据,我们就可以分析城市里人是怎样移动的。
我们做了一个城市计算框架,它包括四个环节,第一,城市感知;二,城市管理;三,城市数据的分析和挖掘;四,服务提供。这是一个多数据分析框架,它的数据种类非常多,任务也很多,可以是改进城市规划,也可以缓解交通拥堵,在一个任务中我们要同时用到多个数据,对数据要进行整合分析。
以空气质量分析为例。现在很多城市都建了空气质量监测站,每个小时发布一些数据,告诉大家这个地方空气质量是多少。我们国家的站点数目有限,北京六环以内22个站点已经是全国最多了。一方面,站点成本昂贵。另一方面,城市里的空气质量是不均匀的,每个地方变化也是不一样的。我们不能用一个平均读数来代表整体,也不能通过简单的差值来算出空气质量。
我们利用两方面的大数据来解决这个问题。第一,历史和实时的空气质量数据,包括天气、湿度、气压、气温等等。第二,交通流量数据。这里有多少公园,密度是多少,有多少红绿灯,多少高速公路。结合这些数据,我们就可以算出整个城市里面每个角落的空气质量。我们可以知道,什么时候该关开窗,什么时候该关窗,去哪里跑步,线路是什么样的。也许有人会问这个准不准?我们在9个城市用我们的方法来预测该城市的空气质量,该城市的预测精确度提升了20%,环保部门对这个工作非常重视。
再来看另外一个例子。利用人们的兴趣点数据来分析这个城市里面不同功能区域的分布和它的核心区域所在。开一个超市,我们要知道居民住宅区的居民,开电影院要知道周边的分布。单单用一种数据是不能完全反应地貌的。如两个餐馆在数据库里都是表示是中餐馆,但反应的地域地貌是完全不一样的。一个是住宅区,一个是商业区,它代表的意义是完全不同的。另外,人的移动性也反应了区域的功能。利用兴趣点数据我们能发现城市里的功能区在不断的变化。
我们认为利用大数据进行城市计算前景广阔,我们的目的是达到城市、人和环境三盈的局面。