破解智慧城市大数据获取的“三十六计”

2019-09-04□胡敬

科学中国人 2019年12期

□ 胡敬

几十年来，纵观世界范围信息化的发展，大致经历了3个阶段：从1941年第一台电子计算机的诞生到1995年，是以单机应用为特征的数字化阶段；从1995年到2015年，是以联网应用为特征的网络化阶段；从2015年至今，开启了以数据的深度挖掘和融合应用为特征的智慧化阶段。应该说，是大数据催生了信息化的3.0。与此相伴，“智慧城市”也应运而生，旨在融合大数据、物联网、云计算、人工智能等一系列最新的信息化技术，打造智慧城市的大脑，提高我们的生活质量。

随着智能手机的普及、廉价及功能的极大丰富，以及无人机、无人车等智能移动终端的广泛商用，传统“以物为中心”的物联网架构逐渐暴露了移动性差、部署成本高、响应时间长等问题。为了更好地进行物联网类大数据的采集，进而有效地提升大数据驱动下的“智慧城市大脑”，多年来，北京理工大学刘驰教授团队专注于面向智慧城市的“人机协同”群智大数据采集方法研究，为新一代“智慧城市”蓝图提出自己的“三十六计”。

无人机群组成“空中通信生命线”，保障7/24高效数据传输

当人们的生活已经习惯了使用智能手机，大到各国元首召开远程视频会议，小到人们日常查询天气、打车，看不见的高速通信网络日夜为我们服务，让我们足不出户就可以遍览大好河山，和远隔万里的朋友面对面谈笑风生。但是，当暴雨、地震、洪水等一系列难以预料而又破坏力极强的灾难降临时，地面通信基础设施遭到损毁，智能手机无法工作，而数量有限的搜救人员面对广阔的受灾区域往往显得心有余而力不足。如何切实有效地恢复地面通信成了智慧城市7/24不间断服务的关键。

刘驰团队创新性地提出了基于分布式深度强化学习的多无人机通信覆盖技术。无人机彼此之间借助WiFi等无线网络保持联通，其中少数可和通信卫星连接，共同为地面用户构建与外界相连的“空中生命线”。由于通信覆盖区域面积大，无人机数量较少，需要动态调整无人机的方位实现动态部署。与此同时，无人机运动中的电量消耗是延长网络生存时间的关键，这样在保持无人机群的适当移动不放过一个死角的同时，也需减小移动带来的电量消耗。再者，无人机网络需要保持时刻联通，这样保证了数据链路上通下联。具体地，刘驰团队突破传统深度强化学习技术，如DQN方法只能处理非常有限的离散动作空间的限制，在连续动作空间控制actor-critic方法的基础上，定义了一个新的能效利用率指标，来综合考虑平均通信覆盖率、通信覆盖公平性、无人机群联通性及能耗。刘驰团队提出了一种无人机群控制新方法——DRLEC3（DRL-based Energy-Control for Coverage and Connectivity），并且通过大量的仿真实验证明了它的有效性、鲁棒性和优越性，在使用深度强化学习训练无人机群提供通信覆盖的智能控制领域走在了前列。相关成果连续发表在本领域顶级期刊IEEE JSAC和IEEE Trans.on Mobile Computing上。英国爱丁堡大学的研究团队在IEEE Communications Surveys & Tutorials评价这项研究“能够动态学习环境状态，并与主流算法相比取得了突出的性能优势”。

智能手机变成“神奇口袋”，群策群力采集物联网类大数据

群智感知的感念最早由美国Dartmouth College的A. Campbell教授在2008年提出，即“People-centric sensing”（以人为中心的感知），旨在破解传统物联网需人为部署传感设备带来的弊端。刘驰团队是国内较早开始此类研究的团队，旨在解决以下关键科学问题：如何评判参与者提供的感知数据的质量，并满足任务发布者的需求？如何保障参与者、任务发布者及本系统运营者三方的利益？刘驰团队发表在IEEE INFOCOM、IEEE Trans. on Mobile Computing等本领域顶级会议和期刊上的文章，得到了国际同行广泛引用并积极评价：是“最早将信息质量（Quality of Information）引入到群智感知系统激励设计的工作之一”（IEEE Fellow、美国密苏里科技大学Prof. S. Das教授团队）；是一种“具有代表性的工作，来提出一个群智感知网络管理框架”（美国南佛罗里达大学研究团队）。

刘驰团队提出了一种保障感知数据质量的实时激励机制，该机制兼顾群智感知平台和参与者的双方利益，允许平台提供额外奖金来进一步激励优秀数据提供者。通过在若干真实数据集上的广泛模拟，刘驰团队证明了所提出算法具备数学上的真实性、个体合理性、预算可行性和高效计算性等优质特性。

通过合理的参与者选择与在线激励，智能手机真正地成了一个“神奇口袋”，而任务发布者仅需支付一定的报酬，就可以获取过去难以获取的城市大数据。

无人设备自主获取城市“点点滴滴”、人机协同群智感知技术初见端倪

传统的群智感知系统充分利用了人所携带的智能终端进行城市大数据采集，这比提前部署传感器已经智慧了一些，但人类活动不可能做到全区域全天候覆盖，且考虑到不稳定的人为因素。随着无人机、无人车等技术的日趋成熟，商用化成本逐渐降低，“忠心耿耿”的无人设备为“人机协同”群智感知这一新技术的发展铺平了道路。自2017年起，刘驰团队是国内外最早进行此项课题的团队之一，并迅速取得了突破性进展，研究成果连续发表在IEEE JSAC、IEEE Trans. on Mobile Computing等本领域顶级期刊上。

刘驰团队利用携带丰富传感器的无人移动终端（如无人车、无人机）在城市中进行数据采集，这些无人移动终端均配备了“设备—设备”的通信接口（如WiFi、NB-IoT等），它们通过相互通信来获取必要的信息。无人设备根据各自学习到的策略在一个区域中自主移动并收集数据。但是，它们所携带的电池是有限的，而增加电池的尺寸会进一步增加重量，这对无人机而言尤其致命。同时，所携带的传感器的感知范围和感知精度均受限，城市中也存在很多障碍物（如建筑、道路维护路段等），无人移动终端需学会避障。最后，通过部署后端中央控制中心来调度无人设备会十分低效，因此需设计分布式导航方案。

面对这样复杂的群智感知任务，刘驰团队创新性地提出了“e-Divert”调度算法。其在传统actor-critic方法的基础上，通过引入长短期记忆模型LSTM对时间轨迹特征进行提取，并辅助卷积神经网络CNN做到时空数据分析。同时，采用了Ape-X机制，为智能体创造“分身术”，从而在环境的训练副本中实现更广泛深入的探索，优化了经验复用机制的性能。实验表明，算法在保证合作策略的同时，有效地提取了当前状态序列的时空特征，进而学会了类似“瞻前顾后，扬长避短”的行为策略。

面向智慧城市的人机协同群智感知系统

除此之外，为了保障系统工作过程中的数据完整性、数据安全性和数据可靠性，刘驰团队又提出了一个结合Ethereum区块链的深度强化学习框架。它既可以帮助每个移动智能终端感知附近的数据点，从而实现上述高效的数据采集效果，同时也使区块链在不同终端之间共享数据，有效地保障了数据的安全级别。

展望未来，“人机协同”群智感知技术或将大放异彩

智慧城市迅速发展的关键在于物联网类大数据的有效获取，用来补充互联网数据在物理空间表征中的信息缺失。展望未来，在“人机协同”群智感知技术这一新的研究方向下，刘驰团队计划从关键理论和场景技术两个方面进行攻关。具体地，在关键理论方面，将尝试通过设计高效记忆机制来更好地利用人机协同条件下移动轨迹中的时空信息；在场景技术方面，将深入研究多任务深度强化学习技术，探索不同城市内群智感知任务的知识迁移、任务与激励分配等核心技术。

多年来，为了破解智慧城市中物联网类大数据的获取技术，北京理工大学刘驰教授团队一直在坚持不懈地努力，也一直走在业界的前列。刘驰团队的终极目标是实现真正完备的人机协同群智感知系统，为“智慧城市大脑”的发展提供源源不断的数据资源，为大数据、云计算、人工智能等技术与智慧城市中的实体经济深度融合提供有力支持。到那一天，技术走进千家万户，百姓的生活质量会得到进一步提升。能够助力美好中国的发展，刘驰团队也会因对技术的执着追求取得的成果而流露出一丝欣慰。