脸谱网正在绘制世界人口地图
2016-07-12选自美国大西洋月刊2016年2月23日罗宾逊迈耶RobinsonMeyer陈海曼
选自美国《大西洋月刊》 2016年2月23日罗宾逊·迈耶(Robinson Meyer)陈海曼/译
脸谱网正在绘制世界人口地图
选自美国《大西洋月刊》 2016年2月23日
罗宾逊·迈耶(Robinson Meyer)
陈海曼/译
他们正在使用全新的人工智能(AI)技术和大量的计算能力来完成这些地图的制作。
马克·扎克伯格(Mark Zuckerberg)在巴塞罗那世界移动通信大会上发表演讲
美国人居住在错综复杂的地图网络中。键入“汉堡王”(Burger King)到在线框,谷歌会显示出十几个附近的选项,每个都能连接到精确的经度和纬度。
但世界上还有很多地方,十分闭塞,信息不流通。或许这些国家开展了国情普查工作,但可能只有县一级或者省一级的数据可用,没有更详细的数据。
以人口数据为例:超过74亿人口遍布全球。有的人生活在拥挤的城区,有的人生活在与农场相连的小镇,有的人独自居住在丛林边缘。但是其中有很多人口,没人知道他们的确切住址。
现在,脸谱网(Facebook)宣布已绘制出近20亿的人口地图,这种规模胜于以往任何的项目。该公司的连接实验室(Connectivity Labs) 这周宣布,它制作了20个国家(其中大部分是发展中国家)的全新的高分辨率人口分布图。但是要到今年晚些时候,这些地图中的绝大部分才会发布。这些地图如果真的准确,它们就会是大多数国家有史以来质量最好的人口地图。
这些地图值得注意的另一个原因是:如果它们很准确,将预示着一个新的人工智能辅助时代的到来。
在富裕国家,可靠的人口信息被视为是理所当然的事情(甚至有书呆子笑话,要将人口密度从美国地理数据中删除)。
人口分布图在不同领域有几十种应用。城市规划者借它来估计城市密度,用以规划和改善道路状况。流行病学和公共卫生工作者使用它来跟踪疫情或分析人们获得卫生医疗服务的状况。如果有灾难发生,人口地图可以用来确定应该为哪些地方优先提供紧急援助。
脸谱网和新殖民主义
脸谱网对这种数据的兴趣事出有因。全球大约有40亿人还没有使用脸谱网,这事关该公司的未来发展前景,所以它对地图的兴趣,有基础设施方面的原因。该公司想知道,对于这些地方的人,用哪种方法上网最好:使用光纤,还是无人机、卫星或高空气球?
以下就是脸谱网为什么会选择这些国家的部分原因:20个国家的一些农村地区,人们仍然无法上网。这20个国家,包括尼日利亚、肯尼亚、乌干达、土耳其、乌克兰、乌兹别克斯坦和印度。随便说一句,脸谱网的免费网络服务Free Basics 产品刚刚在印度被判了死刑。Free Basics和连接实验室都隶属于Internet.org,这个组织(经常以营利为目的)致力于扩大网络以及脸谱网服务的覆盖范围。
但是,在所有这20个国家中,脸谱网是怎么做出更好的人口地图,超越了当地政府水平呢?他们又没有像谷歌街景车那样到处考察转悠,因为脸谱网拥有不可思议的计算能力。
这些地图其实是这么制作的:首先,脸谱网的连接实验室要拿到当前最可靠的世界人口信息,这是哥伦比亚大学(Columbia University)提供的一个数据集,被称为“全球人口网格”(Gridded Population of the World)。它综合了各地的人口普查数据,并把数据调整到相同的年份。虽然它是全世界目前最优质的人口地图,但它的分辨率不怎么高:根据脸谱网所言,一个网格可以代表城市地区的几平方公里,也可以代表农村地区的几万平方公里。
然后,脸谱网又从数字地球公司购买了大量的高分辨率卫星图像。目前太空中大部分私人的高分辨率地球观测卫星都是由这家公司经营的。当你在谷歌地图上看自己的房子时,你通常是(但并不总是)通过数字地球公司的四个轨道镜头之一看到的。
数字地球公司的图像大多数属于“小度量的”,也就是说,网格的一条边,不是数百公里,而是50厘米。脸谱网的开发人员训练该公司的神经网络算法,让它识别在这些数据中,一栋建筑物从上面看起来是什么样子。然后开始进行识别。该软件根据它能看到的建筑物数量来估计城市人口密度,并且进行推算,把当前最佳人口数据分配到居住区中。
“他们设定了一个相当基本的假设:如果看见到一栋建筑物,必定就有人在那里。”哥伦比亚大学地球科学家说罗伯特•陈(Robert Chen)说。他是脸谱网所使用的基础数据集“全球人口网格”团队的主管。
你可能觉得这种方式听上去很简单,其实它本来就这么简单。它仅仅需要访问神经学习软件,需要耗用大量计算能力。脸谱网估计它分析了20个国家的2160万平方公里土地,“为此,我们用神经网络处理了146亿张图像; 这是脸谱网每天分析的所有图像数量的十倍多”。
罗伯特•陈警告说,脸谱网的数据不能被用来计算和当地居民有关的城市密度。但是,“在其他很多情况下,这些数据十分宝贵。”他说。
脸谱网还没有发布这些地图的最终版本。它说,最终版本将在今年夏天发布。在发布之前,罗伯特•陈的团队将对它的准确性进行判定。虽然脸谱网的早期结果令人鼓舞,罗伯特•陈说,他仍然不知道这项技术会有多么精确,也不知道适用性是否广泛。 “我们只看到了它的部分状况。”他说,但是,如果该技术的效果令人满意,脸谱网的这个项目就会新增另外6个国家。
如果事实证明这些数据很有用,那么连接实验室的成功就会标志着一个重大胜利的到来,因为长期以来,开发人员在使用卫星数据时一直面临着一个阻碍:用算法解析图像。
在未来的五年里,硅谷投资的卫星公司将向公众发布大量影像,远远超过以前的水平。这些影像的成本会比以往任何时候都更加便宜,而且也更加“新鲜”:由于卫星制造上的进步,以及火箭成本的下降,一些公司承诺提供每周六七次的重访问率(revisit rates)。
如果公司,尤其是金融公司学不会如何用机器破译这种新的数据,它们就不会有什么价值。公司必须懂得如何从影像中抽取信息,而不需要人员坐在桌子旁埋头苦干。目前,像天空盒(Skybox)和笛卡尔实验室(Descartes Labs)这样的初创公司表示,他们已经在这方面取得了一些进步。如果脸谱网制作的地图真的成功了,那么这个目标的可行性将会得到进一步的证实。
原文标题:Charting Our Water Future