PNT智能与智能PNT
2022-07-05刘经南罗亚荣高柯夫
刘经南,罗亚荣,郭 迟,2,高柯夫,2
1.武汉大学卫星导航定位技术研究中心,湖北 武汉 430079;2.湖北珞珈实验室,湖北 武汉 430079
1 宇宙演进的高级阶段:生命体与智能的产生
现今物理学研究认为:宇宙诞生于一个体积无穷小、质量无穷大、温度无穷高且无时间的奇点。宇宙大爆发瞬间,产生运动变化的物质、能量、信息和表征它们的空间、时间,统一构成了初始宇宙,开始了其138亿年来的持续演进膨胀[1]。宇宙诞生本身属因果关系,奇点是因,爆炸产生宇宙是果。因果铁定有先后次序,因在先,果在后,先后顺序的量度即时间。空间、时间是描述物质、能量、信息存在和变化的状态参量,当代绝大多数物理学家和数学家都认为时空总是一体的[2]。物质和能量及其相互运动或作用产生的信息,三者的存在状态是由空间位置、尺度和方位来度量的,其演进变化是由三者所据空间变化顺序来表征,即时间。时间有时刻和间隔之分。
物质、能量、信息及其相互作用,促使地球生成大约5亿年后逐渐演进出生命体。只有生命体才能感知物质、能量作用变化中释放出来的信息,从而认知三者关联与变化的时空关系对于自身存在的利弊。生命体这种趋利避害的行为能力即智能,这种智能可称为自然智能。自然智能的进化持续推进了生命体适应环境迁移和变化的生存能力,使生命体朝着由种类单一向繁多、种群由低级向高级演进,形成了地球生命树,最后进化出具有高级智能的人类,如图1所示。
图1 地球生命树演化[3]
人类有感知宇宙环境、学习认知其现象、规律和机理并传承给后代的智能。例如,爱因斯坦提出的著名质能方程E=MC2(E、M为能量和质量,光速C含有时空信息和物质的物理属性,C=λM·fM,λM、fM分别为物质对应的波长与频率),不仅是描述物质、能量之间转换关系的基本关系式,还将宇宙由物质、能量、信息、空间和时间构成,以及其转换规律统一于一个公式表达。其中,物质发出的光波波长和频率就代表了该物质独有的物理性质及其空间波长与时间频率特性。进而表明:物质、能量和信息都可以通过空间和时间这两个参量窗口来研究。
因此,地球生命体和人类社会的物质、能量和信息的特征,大到宇宙宏观尺度,小到生物细胞和微生物介观及原子微观尺度都可以在时空域内表达。这就是人类的智慧所展示的对宇宙、地球和人类自身的认识和思考结果。可以说,智能和智慧是生命体的趋利避害本能,为生存和繁衍所进化出来的创造力。这种创造力既是生命体进化的加速器,也是人类社会产生不同类型地球文明的原动力,更是人类赖以认知宇宙并向宇宙文明演进永不停歇的发动机。
2 自然智能与人工智能
2.1 自然智能的内涵和特点
自然智能(natural intelligence,NI)是地球自然界进化出来的改变自然界的能力。即自然界的物质、能量互相作用,演化升级,直到在一定的物质和能量条件推动下,进化出有新陈代谢功能的生命体后所产生的适应环境的能力。只有生命体才能感知环境中物质与能量作用变化中的信息,来判断对自身生存的利弊,自主决策并通过新陈代谢与环境交换物质和能量,以适应环境变化更新自我,甚至局部调控和改变外界环境来改善生存空间。
动物界自然智能的特性可以概括为:接受外界信息并感知其变化的能力;记忆该变化的物理、化学、生物性质和时空位置特征及由此而生的自学习能力;长期持续对外界复杂情景的趋利避害,形成喜好和厌恶等情绪的能力;在学习、记忆和经验的基础上,认知形成如人类推理思考和决策的能力;随着环境的变化,具有自适应、自组织、自修复、完善自我,乃至调控周边局部环境状态的行为能力;从感知世界、认知世界到决策和实施调控行动全过程的低耗能特点。如人体总耗能每天2700~3000大卡,大脑耗能占人体总耗能20%[4],约20 W就能进行复杂的思考任务。与之相比,战胜柯洁时的分布式网络上的AlphaGo,耗电功率约1 MW,所耗费的能量相当于5万个人类大脑的消耗[5]。
自然智能在植物界的研究还处在初期阶段,是人类需要补课和重视的方向。许多植物研究试验显示:如果把智能理解为趋利避害的生存适应能力,那么植物同样拥有类似动物的视觉、听觉、嗅觉、触觉和味觉等感知智能,如向光性、向养分性和根系向水性[6]。成熟的果实会释放乙烯使得周围的果实“嗅”到并做出快速成熟的行为。植物还有交流智能:如含羞草被触摸会闭合;非洲金合欢树被昆虫啃噬后随即释放特殊气味预警,其叶片中单宁酸含量就会直线上升,周围几十米范围内的金合欢树也能接到信号,并在5~10 min内合成大量单宁酸以备阻敌[7]。植物没有大脑,但有感知传递信息的“神经”功能,发达的根系网络类似于神经网络可以感知、传递信息,根茎接合部同时最接近地下地上两个不同的环境,能以最快速度和最多信息量同时感知、认知和处理地下和地上两个时空域物质能量变化情况,为最有利、最节能和省时的调控位置。达尔文曾猜测植物若存在感知调控的相关中枢应该在根茎接合处的根部;曾提出植物“根脑”的猜想,认为植物具有类似低等动物简单大脑可调控其肢体的部分功能[8]。这似乎符合自然智能节能和趋利避害原则。
但现代更多的研究也认为:光合作用是植物与外界转换物质、能量和信息的过程,是动植物生命延续的食物链最基础的能力,因而也是自然智能的基础。叶绿体通过光合作用生成新物质的自养型植物,无须进化出很耗资源的大脑神经系统来传递信号和处理信号对肢体进行协同调控。因为根植地下的植物应对环境变化,相对动物需要每时每刻应对的外界环境变化缓慢得多,只有与天气、阳光、水分、养分相关的变化,依自然智能节约资源的原则,其全身细胞通过细胞液的信息素或激素可就地感知变化与做出反应调控,是一种更省资源的具身智能[9]。但植物通过叶绿素,利用太阳光、二氧化碳、水和来自土壤的养分,制造出淀粉、酯类和蛋白质,还释放氧气等生命体所需的物质能量且耗能很低的原理,至今仍未完全研究清楚,若研究成功,将是划时代的颠覆性伟大发现。
如果把生命体与环境的互动理解成一个随机过程,那么生命体适应环境的趋利避害策略,即自然智能,则内化为基因,迭代演进,以利于个人或种群生存。总体而言,自然智能的演化还遵循了以下几点原则:
(1)资源、能源的低消耗原则。自然智能和当前人工智能之间的一个巨大差异在于它们的资源和能源消耗。人脑仅消耗约20 W的功率,而超级计算机动辄以兆瓦的功率运行。计算机在刚性同步时钟上运行,每个时钟周期,每个晶体管必须可靠地翻转状态,这样的精确度需要大量的资源和能耗维持。而生物的细胞分子或神经元的信号传导和处理看似不够精确,然而,其中每一步都足够可靠,以使最终结果足够好。随着后摩尔时代面临的芯片算力瓶颈,自然智能的超低能耗信息处理机理值得深入研究和借鉴。
(2)生态系统的共生协调原则。共生协调是自然界所有生物群体共生合作、需求互补、协同进化、协调共荣的普遍原则,如真菌与植物根系共生,协同促进养分吸收和植物生长;多种细菌和病毒寄生于人类等大型动植物体内后,通过长期博弈后互相适应,形成多种菌类、病毒类与所寄生的宿主互利共生甚至基因吸取的相融格局,构建出动植物体内与微生物互相依赖的复杂生态平衡体系。这彰显了高等和低等生命体间除了竞争博弈,还有共生互利、相互赋能、协同进化的一面。
(3)生态演进从局部最优到总体最优原则。不同的自然生态系统中有着不同的生物主体和与之对应的环境、资源。地球生命圈是人类已知最大的自然生态系统,由无数大小不一、形态各异、粒度复杂的自然生态系统共同组成,这些系统相互竞争又协同共生,与空气、水域、土地等地理环境资源持续互动,通过个体或群体生态在微观和群体粒度上的局部最优,涌现出地球多样性生态在宏观粒度上的总体最优。此外,即使多次的巨大地质、气候、天体灾害造成了生物大灭绝,但幸存生命都能绝地复生、适应变化、基因突变,演化出新一代的生命大爆发,促进生命形式的多样化和朝高级方向进化。这是属于地球的星球级自然智能体现。这些自然智能的演进原则也是人工智能研究发展应该得到遵循的。
2.2 从自然智能角度定义人工智能
人工智能的定义最早出自计算机科学理论奠基人图灵(Alan Mathison Turing)在论文《计算机器和智能》中提出的著名“图灵测试”:如果一台机器能够与人展开对话(通过电传设备),并且会被人误以为它也是人,那么这台机器就具有智能。代表人工智能第一代的符号派的司马贺(Herbert A.Simon)认为:人类智能的基础是知识推理,知识基本元素是符号,机器上对符号的操作可实现知识的推理,即为机器智能。另一位人工智能之父马文·明斯基(Marvin Minsky)则将其定义为“让机器做本需要人的智能才能够做到的事情的一门科学”。所以,他说要让计算机能像人一样看懂,听懂,语言交流,思考和运动。这些大师们早期人工智能的定义开辟了人工智能研究发展的历史,也提出了相应研究途径,为人工智能跨越时代超前发展做出了奠基性贡献。但是,从自然智能的角度来审视这些定义,似乎都稍偏狭窄,因为其智能的参考对象全以人为主。的确,人的学习、认知推理智能处在自然智能的顶端,而人的感知智能如视觉,除颜色感知丰富以外,视角宽度和影像分辨率甚至赶不上昆虫的复眼;人的听觉的声波频带宽度赶不上许多哺乳动物,也不像海豚和蝙蝠能主动发送可聚焦的超声波,实现目标探测跟踪和运动中定位;人的嗅觉,赶不上许多昆虫和犬科动物,它们能利用嗅觉,区分和发现目标,进行定位导航。
从人工智能的目标对象来看,这些定义也偏于狭窄,全以机器为主。从当前的人类发展需求出发,环境如建筑、小区、网络;社会如国家、城市和乡村治理;基础设施如道路、管线和网络等都要智能化、智慧化,甚至包括人类本身也想用生物智能和人工智能来增强自身。这些定义对人类的认知思维模型的复杂性认识偏肤浅。司马贺的符号化的知识模型,适合偏理性的思维,在推理智能的公式证明方面,取得过一些成功。但人的思维还包括感性思维、形象思维和顿悟等,是难以符号化的,可能还更丰富和更富有创造力。最近,因研究机器学习神经网络模型获图灵奖的得主杨立昆(Yann LeCun)就多次指出:“尽管只有8亿个神经元,但猫的大脑远远领先于任何大型人工神经网络”。他指出:因为猫和人类大脑共同基础是基于对世界的理解高度发达,基于对环境的抽象表征,形成模型,如预测行为和后果[10]。因此,复杂思维模型的建立是当前自然智能和人工智能研究共同的挑战。
从自然智能出发,人工智能也可定义为:人们学习、探索、研究和模仿自然界生物的多样性智能并将它们模型化部分地赋给人自身、机器和环境,使其所产生的能力。按照这个人工智能定义,人工智能的分类按自然智能的演进过程和特点可分类为:
(1)感知智能。主要发现或探测目标物体的利弊性质以及与自己的时空位置关系,有被动感知,如包括视觉、听觉、嗅觉、触觉、味觉、热、磁和电磁波等感知智能;还有主动感知,即自主发射次声波、超声波、电磁波等探测目标和自身时空位置的感知智能。
(2)学习记忆智能。学习是生命体感知外界环境信息而影响自身行为的适应性过程,记忆是指学习获得的经验或信息在生命体内存储和提取再现的活动过程。学习类型有接受型学习、发现型学习、训练型学习、理解型学习等;记忆类型有形象记忆、抽象记忆、情绪记忆、动作记忆等。
(3)认知智能与具身智能。在感知、记忆、学习并形成经验的基础上,认识现象的规律,学习和理解其内在的机理,归纳并总结成知识等的能力。有形象思维、抽象思维、推理智能、情感智能、PNT智能(即时空位置认知智能)等。研究认为认知智能不单纯只是神经中枢大脑的功能,是建立在一些生物机体上,与感知、行为动作和情感密不可分,即大脑和身体是一起完成认知的,称为具身认知。具身智能原本是指动物适应环境变化,经亿万年进化,其身体感知和行为肢体器官的形态和功能,已内化为该动物基因调控下的身体发育形态和行为。而近几年具身智能又是人工智能研究中的新概念。有工作感知和类肢体器官的人工智能体也可以在复杂环境下,利用斯坦福大学李飞飞教授研发的深度进化强化学习方法,经多次训练和自己摸索后,随环境变化而实现智能进化甚至“生长”出适应环境变化的肢体器官和功能[11]。
(4)决策智能。在感知现象、认知规律的基础上所采取的趋利避害的思维,系统地分析主客观条件并运用恰当的理论和方法,做出正确决策的过程。有理性决策、感性决策、潜意识决策、无意识决策,如具身决策(embodied decision)[12]等。
(5)交流与语言智能。用语言等交流手段表达认知和情感,进行思维和决策的能力。有语言与文化,语言与思维,言语与情感,语言与心理,语言与脑认知等。动植物没有语言,但也有交流智能,特别是群体性动物,它们用不同声调吼叫或动作甚至舞蹈来交流[13],而植物通过气味或信息素交流。
(6)行为调控智能。即趋利避害以利生存和发展来针对自身或外界的行为调控。包括无意识调控(如免疫反应)、有意识调控、群体协同调控智能等。
以上都是目前通过探索研究能够用某种方式赋给机器、环境甚至人类的自然智能。这些都应该成为人工智能研究的重要内容。
还有一些自然智能,是目前尚无法赋给机器和环境的。如:①意识智能,即分清本我与外界的能力,如自主意识、潜意识等;②自完善智能,如新陈代谢智能、变异、自组织、机体类似器官部件的自修复智能等;③情感智能,情感的生理与行为基础,有语音情感、动作情感、情感的基因影响、情感的环境影响等;④生殖智能,配偶选择中的智能表现,有性繁殖取代无性繁殖中的智能进化(通过基因交叉、互补、突变,以适应环境变化的优生、种群进化、生殖隔离等),确保了生物的种群延续和多样性演进。以上这些自然智能是目前尚不能够赋给机器与环境的,因为赋给机器与环境的是类似自然智能的能力,而不是需要构建在碳基蛋白质和基因物质基础上和亿万年进化出的生命体内复杂网络结构上的自然智能本身。当然,这4种自然智能也应该成为深入研究的对象。因此,本文认为:要研究透、发展好人工智能,一是应该优先或并行研究清楚自然智能的类型和特性,以及与生物和生理模型相关的数理模型;二是研究好如何把自然智能赋能给机器、环境和人类自身的方法和技术。
2.3 交流智能与时空智能对社群性动物和人类进化的关键推动
用变化的声音(人类的语言也属变化的声音)和身体运动姿态变化来交流彼此对外界和相互的感知、认知和情感是社群性动物和人类进化出交流智能的表现。同理,迁徙性动物包括早期人猿科动物,为在跨区域环境中寻找最有益于自身需求的生存资源而进化出各有特色的PNT能力,即PNT智能(或称时空智能),以适应迁徙、觅食或繁殖。而交流智能与时空智能的结合共同推进了这类动物种群的大脑进化和群体智能的演进。
交流能力促使社群性动物的分工与协同能力超群,更促进了由猿到人的进化和语言的产生;而语言的产生,整体上推进了人类大脑快速进化和智能爆发式发展,推进了个体间与群体间理解、协同、指挥、调控,使得群体智能涌现出超越个体层面的智能形态;人类开始形成社会分工和层次组织架构雏形;语言表达沟通能力强、体魄健壮、组织指挥能力强者更易处于领袖地位。
定居、农牧业发展、原始社会架构的形成推动交流智能的多层次发展,促使人类的一支:智人发明了不同形式的文字,这又是一次伟大的人类智能和文明革命,开启了人类文明史。智人用文字记录对天、地、人和社会实践观察及活动;记录认知形成的知识,发明了教育,传承研究思考知识的内涵和本体;促进了不同文明间的交流。
社群性动物和哺乳动物为应对复杂环境变化和生存竞争的需求,迫使PNT能力也不断进化,最终促成其大脑形成了专施PNT快速响应的位置细胞、网格细胞、方位细胞[14-15]和时敏感知细胞(生物钟[16])。
智人借助这些强大时空智能和好新、好探索的基因,随着环境的变迁从非洲先后迁徙到亚洲、欧洲、大洋洲和北美洲、南美洲。行走迁徙和宜居地选择造就了他们更强的PNT认知能力:对太阳、月亮和恒星每天东升西落的周而复始和冬夏两季太阳南归北回的常年观测积累,催生了他们昼夜交替,时、刻、分、秒的周日轮转和日、月、季、年的周年轮回的时间概念;发现了在日月星辰视角的周日和周年的轮回中,方位与高度角如何变化,北极星几乎总是固定于天穹同一位置而不动的;这些现象催使人类产生了以当地天顶、地平圈和北极星为准来表述日月星辰的出现,时间与视线方位和高度角来分区划割可视天球的地平坐标系的抽象概念。在此基础上,还认知了地理纬度与北极星和赤道关系,地球赤道面与其绕太阳公转的轨道平面黄道面的关系,进而分别抽象出以地球赤道为准、由经纬度表述的地理坐标系、天球赤道和黄道坐标系等天体空间表述概念。
正是这些经年和代际观察时空天象的长期变化和规律认知进步,人类进化出抽象思维、数学思维和因果时间关系思维,使智人进化出区别于其他人类和动物的高级智能:数理逻辑智能[17]。以古希腊几位著名哲学家和数学家为代表的数理逻辑智能经过两千多年传承和发展,先后推动了从农业时代到工业时代再到20世纪中叶开始的信息时代和现在开始的智能时代,人类文明进步的4次伟大科学技术革命,造就了人类自然科学的辉煌发展。
同时,在地球的东方,农业文明先进的古代中国以独特的时空思维观,在《周易》中提出了“观乎天文,以察时变;观乎人文,以化成天下”的交流融通、天人合一的自然观和人文观。以当今的话语体系,就是以人与自然的和谐为目标构建“人与自然生命共同体”;以人类共融共享和公平公正为目标构建“人类命运共同体”。无疑,这是当今中国对人类社会进步和未来发展模式贡献的深邃思考和最新智慧。
交流智能和PNT智能的结合,显著加强了社群性昆虫类、鸟类和哺乳类动物,包括人类以最节省个体物质能量消耗的方式和群体协同能涌现更快获取食物质源的能力。如:社群性动物分工清晰的蜂群,成功觅食者以“8”字形舞蹈与群体的其他成员,分享有关产生花蜜、花粉的花源位置的方向和距离的信息,如图2所示。外围环状部分称作回归区;中间直线部分称作摇臀区。蜜蜂会边摇动臀部边飞过这条直线,摇臀的时间表示食物的距离,如1 s=1 km,摇臀时间越长,表示食物距离愈远。而这段直线与蜂巢太阳方位连线的水平方向夹角α,代表食物方向与当时太阳方向的夹角。
图2 蜜蜂舞蹈的移动路径形如数字“8”
这项由奥地利康拉德·洛伦兹(Konrad Lorenz)等3位科学家完成的有关社群动物交流智能与PNT智能结合的研究,是第一个证实了交流智能与时空智能结合的自然智能实例,曾获1973诺贝尔生理奖。本文认为,群体性动物的分工和集体生存方式必然促进不同职能个体间的交流和行为能力,提升它们在复杂自然环境中探寻有限资源的PNT能力。按进化论适者生存原则,这两种能力占优者的生殖竞争力也显然会更强。早期人类的所谓通信靠“吼”,交通靠“走”,指挥靠“手”,表明喜好迁徙、寻找更优生存资源环境的智人就是将通信交流、定位导航和决策行动融合在一起的。交流智能与PNT智能一起参与并推进了人类的进化,使智人逐步脱离了动物的丛林性,进化成地球文明的创造者,现在正在有计划地探索宇宙,向宇宙文明进军。在人工智能研究中,若关注通信网络和PNT技术的融合、协同,也定能促进人工智能融合协同模式的自我进化和升级换代方式的出现。
3 PNT自然智能
3.1 动物界的PNT感知与认知智能
PNT智能是非根植性生命体因生存而进化出的感知和认知智能。定位、导航和分辨时间消耗的感知、认知和决策是所有生命体因生存需求而进化出的本能。
(1)动物的PNT感知。根植性的植物因阳光、水分和养分的需求也有感知时间、方位和位置的能力,动物的PNT感知智能分为主动式感知和被动式感知智能。
主动式PNT感知智能中,动物自身器官功能发出带信号的波对距离和方位感知,对目的地或目标进行判断。例如,海豚有非常复杂的超声波发生器,先用气流冲击由肌肉包裹的鼻腔,通过振动鼻腔组织及末端的“声唇”产生超声波,这些波穿过额隆(头骨前部一块类似声波透镜的脂肪组织),被汇聚成锥形声束,射向前方。当超声波遇到目标物体后会反射回来,回声从海豚的鼻部进入下颌,传到耳骨转化为信号,再经听觉神经传入大脑,大脑进行分析后就可以判断目标的大小、形状、速度、距离和方位。而且,海豚有两个声唇,可以同时或独立工作,发出两股波束,形成需要的波束指向(类似相控阵雷达),不仅可以扩大海豚的“视野”,还能更好地判断背景景深和距离[18]。
被动式PNT感知智能中,动物利用自然信号对距离和方位及时间进行感知,以及对目标或目的地进行判断。例如,沙漠箭蚁的复眼能敏锐地感应到紫外线频段的偏振光。光在大气的传播过程中会形成少量偏振光,且偏振光波的分布具有空间分布的稳定性,这些偏振光就像是画在天空中的罗盘。箭蚁的复眼上,有一部分小眼专门负责探测偏振光。这些小眼通常位于复眼靠近背部一侧的边缘区域,其颜色和形状与其他小眼有着明显差异,在这些小眼上还排列着两组或者3组垂直的微绒毛,正是这些微绒毛上的视色素颗粒帮助捕捉到了偏振光,进而帮助它们进行导航。
(2)动物PNT认知智能。多数昆虫、犬科动物和食腐类鸟类、哺乳类动物还有组合视觉和嗅觉定位、导航、目标跟踪功能,这需要很强的PNT认知能力,不过其嗅觉系统在细胞层面的感知机理研究也还有待加强。此外,候鸟类、信鸽等还具有将太阳偏正光导航、地磁场导航、视觉导航和嗅觉导航综合运用的组合导航能力也是认知智能的导航方式[19]。信鸽在即将归巢区域,还能建立认知地图,通过识别熟悉地标实现快速导航,这是一种典型的认知导航行为。基于生物认知机理的导航,实现认知建图和导航,对于智能PNT发展具有重要的理论研究价值。因此,可以说,PNT还是动物因生存而进化出的认知智能。如乌鸦等鸟类,也在长期对于PNT(时空位置)的感知、认知的经验和学习基础上,在面对如《伊索寓言》中“乌鸦喝水”的情景时,能够辨别水质和沙质、重物和轻物,实现工具使用、情景记忆、精确控制等表现,体现出它们有较高的类比问题解决能力以及认知建模能力[20]。
文献[21]研究发现,神经中枢神经元并不算太多的果蝇头部中还存在着环形排列的方向神经元联结,可以帮助果蝇利用地理标记和回忆等线索粗略确定自身所在位置,像方位罗盘一样为果蝇提供明确的方向信号,使得果蝇可以节省食物搜索时间和轻巧躲避威胁。2017年,日本RIKEN脑科学研究所设计了独特的系统,先固定果蝇头部,让它们观看视频屏幕,当果蝇翅膀挥动时,视频场景也相应运转。在这个虚拟三维飞行空间中,果蝇展示了其导航活动的线索组合:视觉地标信息和有关飞过路径地标的储存记忆进行了匹配与组合,以维持其导航路径的准确[22]。为了进一步研究果蝇的方向神经元如何适应新环境,加州伯克利大学的费舍尔(Yvette E.Fisher)等先后给果蝇两个方向相差180°的光点(虚拟太阳),试验发现,果蝇先飞向第1个光点,此后点亮反向光点,方向神经元能维持对第1个光点的记忆有继续飞向原目标的稳定性,但随即在短暂时间内出现了飞行方向的不确定性。果蝇在调整几次航向后,方向神经元转向反向的光点,又表现出行为的灵活性飞向新光点。说明果蝇视觉感知和大脑方向神经元的记忆与匹配,既能对旧地标位置做出可靠响应,也能在学习场景变化后迅速适应新环境,即方向神经元可以存储并提取场景记忆,还能够通过关联可塑性学习适应新场景[23-24]。
3.2 PNT智能的脑细胞机理研究
科学家一直在探索大脑负责PNT智能的细胞位置和功能,推测可能有一个巨大的网格系统帮助动物和人类形成地理记忆与实景匹配,并在陌生环境下通过距离方位的感知认知实现二维矢量导航。英国UCL神经科学家奥基夫(John Okeefe)1971年通过对陌生封闭环境下的老鼠行为试验,发现了位于其大脑海马区的专管位置记忆的位置细胞[14],如图3所示。1984年美国科学家发现了动物头部指向特定方向时发电最大的神经元,称为头方向细胞[25]。21世纪初,挪威科学家莫泽尔(Edvard Moser)夫妇在奥基夫发现位置细胞的类似封闭小室内做老鼠行为试验,研究发现,老鼠在封闭小室内地面无序行走的多重行走轨迹交点最终形成了六边形的节点网络,而其大脑背侧内嗅皮层的神经元细胞电脉冲测试也发现类似结构的网络,即大脑形成同地面轨迹一样六边形神经元网格细胞结构,研究其作用就是相当于大脑如何建立坐标系,让所有的位置信息都可以坐标化,网格细胞接近正六边形的网格坐标系并不是来自外界的感知输入,而是生成于大脑内部,是大脑对外界空间的内部映象和表征[15]。重复试验也证明哺乳动物大脑内嗅皮层都有同样的网格细胞,如图3所示。位置细胞群可形成对空间某个区域的认知地图,并与网格细胞一起,进行空间信息处理,帮助动物确定空间位置。
图3 位置细胞群形成的认知地图
有关位置细胞、头朝向细胞、网格细胞和边界细胞的研究完成了对人脑中定位系统的认知[26],其中,奥基夫和莫泽尔夫妇因此获得2014年诺贝尔生物医学奖。
研究还发现了动物的认识时间和时间间隔的机理及相应的神经细胞。海马体内不仅存在跟空间位置相关的认知地图,也为时间信息提供了认知地图。研究发现,海马体内存在着时间细胞,海马体通过时间细胞的连续活动来表征流逝的时间信息[27]。在时序的组织试验中,海马区的时间细胞在特定时刻被激活,并形成自组织的序列活动,提供了类似地图的事件时间结构表征,时间信息的表示也以速率和时序编码框架的形式得到支持[28]。
3.3 网格细胞机制赋能人工智能PNT技术的探索
2018年,谷歌的DeepMind团队尝试利用人工智能算法来验证“网格细胞支持基于矢量的导航”这一理论[29]。将动物在陌生环境中运动定位的速度和方向参数作为人工神经网络初始输入,并用一个有视觉感知辅助的循环网络采用深度强化学习开展训练。试验发现,计算机上训练出的人工智能体,产生类似鼠脑进化出的网格细胞的网格化表示,如图4所示。网格单元自发地出现在网络中,如图5所示。
图4 生物试验观察到的鼠脑网格细胞活动模式
图5 人工神经网络自发组织的网格单元呈现与鼠脑神经活动类似的表达
人工智能体在虚拟场景中具备类网格细胞的空间认知能力,并表现出经过多次学习后有矢量导航走捷径最省力的能力,如图6所示。
图6 人工智能体使用网格单元多次后实现最优路径导航
这一研究的人工智能定位方案,与大自然亿万年进化所得到的模式高度一致,为“网格细胞提供欧几里得空间框架,支持基于矢量的导航”的理论提供了有力的支持。诺奖得主莫索尔评论说,“从一种完全不同的角度获得的这种计算机模型最终呈现出我们从生物学中知道的网格模式,说明人工智能可以加速我们对大脑导航认知方面的研究。”
该研究对人工智能研究的启发是:人们从自然界的PNT智能获得的灵感,通过算法赋给机器、环境,可使其能产生类脑智能效果,反过来也对当前人工神经网络可解释性的研究提供了新的思路。当代,利用5G以及北斗等卫星导航系统提供的时空位置服务,结合模仿类脑网格等方式赋能给机器和环境,发挥机器和环境的智能优势,既可增强这类关键基础设施的自身智能化,也可实现支持广域和全球智能协同控制等多种应用领域。
PNT智能作为一种自然界生命体中广泛存在的时空智能,其许多感知机理和认知模式将成为自然智能研究的新热点,不仅满足各种实际应用场景的迫切需求,如深空探测、深海未知区域、沙漠和森林等边远极限场景、医院和餐厅等动态障碍物密集场景,提供新的PNT智能服务模式,还将驱动智能环境感知器件和算法研究,突破当前PNT技术的认知,探索发掘更多自然PNT智能机理并构建出相对应的理论模型和技术实现路线。如:主动或被动式PNT智能感知器件、认知算法、相应地与边缘计算控制器、可穿戴设备、空间极端环境感知设备等实现融合创新,这些将带来巨大的时空智能全球应用发展机遇。PNT智能算法也将突破传统测量测绘方法,将感知、决策、规划、行动等综合自然智能方法与人工智能方法深度融合,服务人类。
4 智能PNT技术
4.1 智能PNT技术的内涵和研究发展趋势
PNT本身是一种生命体感知、探知、认知与生存相关的环境场景时空位置关系并参与生命体趋利避害决策和行为的自然智能。PNT同时也是一种人类用于感知、探知、认知时空位置的技术,是人类反复认知自然界的不同时空现象,以及受生物及自身对时空变化感知、探知、认知启发而发展出来的技术。
经典PNT技术包括指南针、天文、惯性等导航技术,也包括磁场、重力场、地形和影像等匹配导航技术。随着现代技术的发展,还包括无线电技术、光学技术等定位导航方式。如主动式雷达定位导航、被动式罗兰C双曲线导航、激光雷达和红外线跟踪导航定位等技术。而GNSS/北斗卫星导航定位系统是20世纪后半叶发展起来的全球性、全天候、全天时无线电导航技术,当前已经成为人类不可或缺的时空位置一体化服务的新型信息化基础设施。
智能PNT技术是近几年发展起来的PNT前沿研究方向,随着人工智能的热潮兴起、生物PNT智能和PNT脑认知机理的揭示,智能PNT也成了一个需求和研究热点。当前主要有以下4类需求:一是陆海及高空深空环境下运行的各种交通工具,包括车辆船舶和飞机等载体的智能PNT需求,其特点是场景变化多,需求量大,服务面广;二是大型公共建筑室内、地下和矿井下智能PNT需求,特点是需要新型时空信息基础设施提供服务;三是涉及区域、城市、乡村建设发展和管理治理的智能PNT服务需求,特点是需要通信网络与PNT设施的高度融合,能提供应急与安全又开放与保密的国家、社会、大众多种智能PNT服务;四是涉及国家大型基础设施,包括空天和安全应急的基础设施,如铁路、公路、桥梁、隧道和空天设施等,特点是满足从设计、建设到运维、管理的智能PNT服务需求。
从智能PNT技术发展的模式看,也主要有4种。
一是探知PNT自然智能感知模式,包括PNT感知、认知智能两个方面。例如,对昆虫、哺乳类动物、食腐鸟类的嗅觉感知距离和方位等能力和机理的探知;昆虫和鸟类利用大气散射的太阳偏振光偏振轴随太阳方位变化来确定飞行方向和时间的机理。这些都是当前科学家努力寻求的自然界PNT感知的新型信号来源。
二是仿生和类脑PNT智能研究模式,包括对动物个体和群体PNT智能感知器官仿生研究、认知算法研究和类脑PNT智能研究3个方面。仿生算法中有模仿生物的群体合作模式而实现分布式群体的协同感知、规划和控制涌现等PNT智能及其在智能PNT技术中的应用。而人脑具有学习、建模、理解、推理和交互等PNT功能,通过人工智能技术实现类脑PNT智能,使机器具备类似人类大脑相似的导航功能[30]。
三是用人工智能增强或赋能PNT的模式。应用人工智能,如深度学习、知识图谱、强化学习等人工智能技术,将数据综合处理算法进行方法论上的扩展和创新,将大量数据中隐含的物理世界内在规律中的PNT智能,通过多源环境感知、数据融合、认知推理、自主规划和群体智能等方式赋能给机器和环境,形成智能PNT相对于传统PNT的智能优势,最终赋予机器和环境自然智能的特性和能力。
四是综合利用自然智能和人工智能解决时空信息基础设施智能化需求的模式。对于提供时空位置服务的PNT基础设施,若其从设计、建构、运管维都能实现对环境现象感知、学习记忆、认知、问题分析、决策和调控等自然智能基本要求,则可被视为是智能化PNT基础设施。
泛在测绘和定位导航授时可将PNT生物智能赋予人自身、机器和环境,让其拥有或者增强PNT智能优势,即有增强人自身PNT智能、赋能公共服务的基础设施、赋能行业应用3类。GNSS/北斗的PNT技术是人类学习PNT智能后用电磁波代替自然界天文定位的恒星信号构建的PNT基础设施,本身也将需要靠智能技术赋能使其建设、运维、管理智慧化。从用户侧来说,一般采用只收不发的终端被动感知模型实现PNT智能应用,即融合地基或天基通信在区域、广域乃至全球感知精确时空位置信息后,在各行业领域实现符合需求的智能PNT应用。智能PNT以PNT智能的实现为核心目标,以类脑和仿生PNT智能技术、人工智能技术为核心手段,从PNT感知、认知、规划、决策、交互等角度完成更加符合PNT智能特性的新型智能发展范式。因此,智能PNT的内涵是,借助各种手段把类生命体的PNT智能模式和方法赋予各种用户的PNT技术。
4.2 仿生化PNT器件的研究
仿生导航是模仿生物导航机理来实现智能导航的研究领域。与生物导航相关的重要感知器官以及大脑中记忆、推理等意识活动都是该领域研究模仿的对象,因此仿生导航领域主要是对仿生导航传感器及其相应算法实现的研究。仿生导航具有成本低、体积小、功耗低、抗干扰能力强等优势,适合如海洋、沙漠和丛林等复杂环境下的自主智能导航。
从PNT的信息源上,学习分析生物所具备的PNT智能的机理,可将其利用自然信号的机理工程化后,赋给机器。根据获取的可利用的机会信号,可将实现PNT智能的信号源分为电信号、磁场信号、重力场信息、偏振光信号、可见光信号、声信号和化学成分的气味信号等。复眼和动态视觉等多种信号敏感器官,例如蝙蝠利用自主式超声波导航,海星根据复眼视觉系统感知进行被动式海底导航[31],信鸽可同时感知地磁和太阳偏振光轴东升西落的方位变化进行定向导航[32-33],同样沙蚁、蜜蜂和帝王蝴蝶等昆虫也通过感知偏振光实现导航[34-36]。动物PNT智能都是服务于其寻找资源和安全保障,其目标和任务线明确。动物PNT智能具有自然智能低耗能、高效率、自适应、自组织、自完善、自我更新的特性。动物PNT智能极大促进了仿生导航传感器技术的发展,丰富了智能PNT的内涵,使得在没有GNSS信号等环境中,能源有限的微小智能体也能获得PNT智能。
仿生导航传感器技术并不是新鲜领域——相机、惯性导航单元和声呐等传感器都是对生物的视觉、运动感知和声波感知的相关器官与能力的模仿。除了这些以外,仿生光罗盘、仿生磁罗盘和仿生复眼等仿生传感器可以像生物一样感知偏振光、地磁信号或拥有全视场视觉。PNT器件智能化的重要方向之一是仿生导航传感器的发展。当前主流的智能仿生导航器件主要包括仿生光罗盘导航技术、仿生地磁导航技术、仿生声学导航技术、仿生复眼导航技术和动态视觉仿生导航技术,与此对应的PNT器件主要包括仿生光罗盘、仿生磁罗盘、仿生声呐、仿生复眼和视觉相机[37]。
受沙蚁导航方式的启发,法国团队开发了一款天体罗盘并将其应用于室外机器人的自主导航,它可以计算出紫外线范围内移动机器人的航向角,使得机器人即使在GNSS或者磁强计失效的情况下也能补偿惯性传感器的漂移[38]。进一步,该团队设计利用太阳偏振光导航的六足机器人AntBot,该机器人主要携带一个光流传感器和一个天体罗盘,其中天体罗盘由装有旋转线性偏振器的紫外光二极管组成,通过两个传感器的数据确定入射光的偏振角从而确定太阳的方向,即使在紫外线指数很低的情况下都能为机器人的行走提供航向[39]。香港理工大学模仿人类视网膜工作原理开发了一种新型类视网膜视觉传感器,能够有效感知199 dB范围的光线,能为弱光、雨雪等条件下运行的智能体提供强大的终端感知能力[40]。
4.3 人工智能增强几何算法型PNT技术
人工智能技术在信号处理、图像感知、行为预测等方面的突破也将促进PNT技术的发展。传统“几何算法型”PNT技术,通过测量传感器以及精确的测量模型获得空间几何信息,是一种以模型驱动为主的计算思路。这种思路容易存在两个问题:一是当环境复杂或载体运动学模型复杂时,人工难以建立准确的模型,从而影响计算位姿、构建地图等的稳健性。比如轮式载体在平坦道路上进行惯性航迹推算的模型就比较容易建立,而人体在城市环境下行走的模型就很难精确构建。二是为了提高稳健性,人们往往针对具体场景和载体,增加大量的约束、观测和先验条件,使模型精细化。但这样一来又会影响模型的泛化性。比如车载组合定位的模型就不能直接迁移泛化到四足机器人定位上。
以机器学习为代表的人工智能技术带来了一种数据驱动的计算思路。大量观测样本构成样本空间,其“真值”构成标记空间。机器学习能在其中寻求一个假设,使得其逼近样本空间到标记空间的真实映射。这一类假设往往难以用解析式的、模型化的方式来表达,而可通过人工神经网络等方法的强大表示能力去拟合。对于PNT问题,笔者把传感器观测看作输入端,把对环境目标的理解或自身位姿的估计看作输出端,神经网络经过训练后可以直接建立这两端的映射联系,被称为“端到端”的方法。因此大规模数据训练学习可以对传统几何型PNT技术进行很好地补充,从而形成“模型+数据”共同驱动的新思路,实现复杂环境下的适应性导航和稳健性导航。
在采用惯性传感器进行机器人位姿估计任务中,文献[41]针对传感器零偏以及噪声参数不能无检校直接获得的问题,利用最接近观测时的数据进行学习并修正取得较好低噪声估计结果。在融合视觉信号等多源定位任务中,经典解决方案大都利用了视觉几何模型和简单的几何特征点[42]。而人工智能算法能对视觉数据进行更好地特征提取和匹配,以端到端的方式提取稳定的、有利于场景长期匹配的特征,实现受干扰或遮挡环境下的视觉导航[43]。文献[44]提出了以深度学习直接估计位姿的视觉惯性里程计。文献[45]提出了无监督学习的视觉惯性里程计,可以通过几何约束等关系自行生成监督信息实现自我训练。深度学习还能有效应对传统多源融合方法中数据干扰的问题。文献[46]用深度学习实现了视觉和惯性传感器的多模态特征融合,该方法在二者存在标定误差和同步误差的情况下仍然能有效工作。
此外,作为机器学习算法中重要的一类,强化学习算法也被应用于定位定姿等PNT问题中。通过将观测变量的误差定义为强化学习框架中的惩罚项,状态估计问题可以被看作是一种延迟奖励问题。文献[47]使用策略梯度法来学习非线性状态估计器中的反馈增益,并在动力学模型未知的情况下完成了状态估计。文献[48]使用强化学习方法来实现基于惯性传感器和磁力计的姿态估计,通过将误差状态的随机微分方程建模为马尔科夫决策过程,使得该姿态估计问题的误差收敛得到保证,在任意初始姿态角的试验中取得最好的性能。
4.4 人工智能和类脑智能的混合地图构建技术
传统室内外视觉SLAM中,相机前后帧的数据关联尤为重要。由于真实场景发生变化或相机复杂运动,导致数据关联仍然存在许多挑战:①光照变化。强光或直射光容易在图像上产生噪声,弱光会导致场景可见度较低。动态光照会使得同一场景前后呈现出的外观大不相同,尤其是来自倒影、阴影、光斑等物体的特征,在不同光照条件下也会发生变化。②复杂运动和视角变化。当相机出现连续剧烈抖动或快速移动,导致采集图像模糊、失真时,被提取出的几何特征已经不能反映真实场景,也就无法进行数据关联。在相机视角出现复杂的旋转、倾斜,也可能会导致数据关联失败。③场景动态变化。传统视觉里程计都基于静态场景假设,本质上就是以静态路标点为参照物估计自身运动。动态场景可分为高动态和半动态,高动态指相机视野内存在实时移动的物体,而半动态指场景中有物体在某段时间间隔前后被移动。在这些场景中,如部分路标的临时性移动,会使系统误认为是相机自身运动造成的,从而导致错误。④场景特征相似下的图像区分。数据关联是基于图像特征的。当不同场景或目标的外观、结构高度相似时,也可能引发错误的数据关联。⑤时跨过长导致特征变化。当在长时间跨度下建图或进行地图更新时,场景或目标可能会发生较大的外观变化引起关联出错,例如,天气变化、季节变化、陈设变化等。人工智能技术可以增强系统对环境的感知能力,提升系统对有效数据的关注,或模拟生物自然进化形成的对外界的感知和处理机制,从而解决数据关联的上述局限性。
在视觉SLAM任务中,原始数据来源为图像,利用人工智能的图像目标识别、检测和分割技术,可挖掘图像中更深层次的语义信息,以提升图像特征提取、匹配的精确度,用于构建带有语义的地图,增加建图的智能化。几何地图可以利用人工智能算法增加地图中目标物体的类型、空间位置及物体间的关系等语义信息,语义信息有助于机器人与环境进行交互,符合人类的学习和思维习惯,即用类人脑思维模式增强机器人导航时人机交互能力。
早期的语义地图利用性能和准确率较高的条件随机场,以及效率和泛化能力较强的随机森林等机器学习算法提取场景中的语义标签,然后进行语义标注,但此方法的精度和效率仍有待进一步提升。使用深度学习技术融合SLAM的建图是当前语义地图构建的研究热点。根据处理方式分为像素级语义建模和物体级语义建模。像素级语义建模是指使用图像分割算法对图像的像素进行判断,并将提取到的像素语义信息映射到3D点云中构建语义地图。这种分割可以区分目标类型而无法区分属于同一类型的不同目标实例。物体级语义建模是指对图像中的实例进行分割,并将提取到的实例级信息映射到3D点云中构建语义地图,因此语义地图中会包含实例级语义信息,可以区分属于同一类别的不同物体。物体级语义地图中,对于物体的表征可以采取不同的建模方式。CubeSLAM主要是通过消失点采样等几何方法直接获取物体的3D立方体模型[49]。QuadricSLAM则利用数学上更加紧凑的二次曲面模型表征物体模型[50]。因此这些物体不仅包含语义信息,还包含精确的大小、位置和姿态等空间信息。这样的语义地图不仅有利于增强机器人对环境的理解,而且能辅助机器人的任务规划和导航避障,最终提高整个系统运动规划的稳定性和连续性。
4.5 在陌生环境中学习如何导航
传统导航基于地图和实时高精度测量,形成对环境的实时感知理解,在构建好的地图上确定自身位姿以及规划未来的路径。而预先绘制高质量地图的成本昂贵,同时由于环境的变化,地图内容也会老化。此外,机器人在救援搜索、地下勘探、海洋探测等未知环境下也不可能提前获得任何先验知识,只能边进行未知环境的探索边加强对环境的认知和记忆。将深度学习感知能力强和强化学习决策能力强两个优势相结合的深度强化学习的智能PNT技术,可以让导航主体与环境边交互边学习从而得到更优的导航策略,是解决无图导航问题的主要方法。这类方法更加接近生物智能中的导航规划能力,它结合了当前人工智能中联结派、符号派和行为派3个方向对智能PNT进行了全面的深化,即以连接派的深度学习为手段加强对环境的感知和认知,以符号派的知识图谱为手段增加智能体的导航常识,以行为派的强化学习为手段让智能体积累经验,为其自主运动提供行为和实时运控,是一种集现今人工智能3个主流方法优势达成的、非常接近人类类脑思维方式的无图导航方法。
基于深度强化学习的导航任务主要有目标驱动视觉导航、视觉语言导航、视觉对话导航和具有人类意识的导航几类,是当前研究的热点。从实际出发,凡是在见过的场景或者相似的场景中,机器人可以更便捷经济的方式实现自主导航,可省去对高质量地图的依赖,也提高了对动态变化环境的适应性。因此上述导航任务在救援机器人、家庭服务机器人、餐饮服务机器人、智能轮椅等领域也具有广泛的应用前景。
目标驱动导航包括点目标导航、对象目标导航和区域目标导航。目标往往是由图像形式给出[51],因此这一类导航也被称为视觉导航。点目标导航任务中,智能体被初始化为随机的起始位置和方向,然后自己能导航到目标位置,目标位置由其相对于起始位置的坐标表示[52]。因此该任务需要智能体精确推算导航轨迹的距离和方向。对象目标导航任务中,智能体也被初始化为一个随机的起始位置,要求智能体能找到一个特定的对象,例如电视机或者遥控器[53]。如果智能体能自主到达至目标对象一定距离内,并被成功识别与确认,则认为导航成功。区域目标导航使目标导航的局域化,即智能体导航到一个指定的房间,例如卧室或者厨房[54]。如果智能体到达了目标房间内,则认为导航成功。由于房间的概念是高级语义,这就要求智能体根据家具的种类、房间的布置等视觉细节对场景有精细的理解。
在自然语言处理和计算机视觉深度融合背景下,视觉导航得到了更进一步的探索,出现了视觉语言导航和视觉对话导航等新型导航任务。在视觉语言导航任务中,智能体模拟真实环境下机器人服从人类语言指令的过程,旨在训练一种能够一步一步按照人类语言所给出的一系列指令来完成导航任务的智能体,使得智能体能够在不同的阶段执行对应的指令,准确形成轨迹并完成导航任务[55-57]。如果智能体能按照指令在预期目标附近停止,则认为导航任务成功完成。视觉语言导航任务的特点在于,智能体的行为以完整的、复杂的自然语句为输入,而不仅仅是最终目的地的一个简短描述,从而需要对自然语句展开准确理解和含义认知,并结合当前的环境观测来决策下一步行为。
视觉对话导航除了视觉语言导航所面临的挑战外,还需要处理好人机对话中一系列有关时态背景的语言意图。在视觉对话导航任务中,须引入智能体向用户询问问题的记录(即对话历史),训练一种具有持续对话能力的智能体,使得该智能体能够用语言描述自身的观测,并根据人类的回应进行下一步的导航动作[58-60]。其特点是智能体要有认知环境空间结构、提取视觉观测目标以及与人开展语言交互的能力。
在陌生或无图环境中,知识图谱应用于基于强化学习的视觉导航也成为研究热点,其特点主要是模仿并记忆人类导航经验,提供智能体导航环境目标空间位置关系的先验知识,赋予智能体推理未知目标的联想能力,提高视觉导航在未知场景或未知目标的可迁移性[61]。即使对人类来说,在一个有结构的室内环境中导航也比在一个没有上下文信息的迷宫中容易得多,这表明房屋布局、物品摆放常识等将有助于导航。例如,室内环境通常有不同的结构,如房屋的功能区域和布局。有了这样的结构知识,智能体可以更有效地探索环境,避免被困在不相关的位置。就好像沙发通常是在客厅里的,智能体不应该花太多时间在厨房里找沙发。这些常识普遍性地存在于人们的生活空间中,将其引入到机器学习中将有效提高PNT智能的泛化能力。越来越多的研究开始利用知识图谱来帮助执行视觉导航任务。文献[62]将知识图谱作为固定的空间特征向量,嵌入到强化学习的输入中,形成对整个导航环境的空间结构认知,提高导航泛化能力;文献[63]将知识图谱参与到强化学习值函数的估计中,提高了在空间中搜索目标的效率。
在上述无图或陌生环境下的导航任务中,一般假设环境是静态的,而在服务机器人、餐饮机器人等应用场景中,不可避免地存在着大量移动的人,属于人机共存的环境,因此在动态人群中模仿人类导航行为,安全高效地完成导航任务也十分重要,此类任务称为具有人类意识的机器人导航[64]。文献[65]提出了SARL算法,该算法用马尔科夫决策过程对人类运动的预测建模,机器人通过学习经验来理解拥挤的场景,并在利用图神经网络对机器人与人群之间的交互进行编码,最后使用深度强化学习来学习导航策略。文献[66]面向室内环境中人类意识机器人导航,提出了一个系统来训练针对局部规划器的神经网络策略。文献[67]用图神经网络来聚集智能体和人、人与人、智能体与障碍物之间的交互特征,从而推断智能体邻近的人相对于它未来运动的相对重要性,通过对人群和智能体的运动预测,建立用于路径规划算法的模型,提高智能体到达导航目标的时间和效率。文献[68]提出一种新颖的导航图灵测试(navigation turing test)来学习如何评估并量化类人导航与人类行为相似的程度。
解决无图或陌生环境中的人类感知机器人导航需要融合仿生导航、类脑导航和多类人工智能派别理论方法于一体,还需要融合交流智能乃至人类语言智能与PNT智能方法于一起,才能实现接近人类思维模式和可能实现具身智能自主进化的导航模式,应当是当前智能PNT技术研究最为前沿和最为活跃、最富挑战性和最为需求旺盛的研究发展方向。
4.6 群体智能导航
在智能PNT技术研究中,群体智能(swarm intelligence)是指一定数量的智能体之间通过局部感知和相对简捷的交互方式,完成个体不易实现的任务过程中所涌现出的复杂、强大的集群宏观行为。群体智能从算法上说已经有些成熟方法了,目前主要有仿生算法和非仿生算法,而仿生方法分为仿生行为算法和仿生过程算法,常见的仿生行为算法包括蚁群优化算法和粒子群优化算法等,常见的仿生过程算法包括人工免疫算法和进化算法[69]。群体智能可以归结为行为主义人工智能,属于受生物群体智能启发而模拟生物群体智能的算法,是新一代人工智能的重要研究领域,也是单体智能未来发展的趋势之一。为了降低深度强化学习方法对超参数调优的敏感性并提供稳健的探索策略,文献[70]提出一种将进化算法中的遗传算法与离散和连续的动作空间深度强化学习算法相结合的方法,在室内轮式机器人的避障导航任务以及波浪环境下的水下无人潜航器的导航任务中得到验证。可见在无图导航场景的连续和离散动作空间方法中,将会有更多的进化算法与深度强化学习方法结合。文献[11]提出的深度进化强化学习框架(deep evolutionary reinforcement learning,DERL)就可以为具身智能体(embodied agents)提供在多个复杂环境中执行目标驱动导航任务。
机器人规模化集群作业成为发展必然,多个机器人之间以及机器人与环境之间的交互变得更加复杂,需要更智能的集群工作方式。在高精地图构建方面,为了降低大规模数据采集的成本,提高地图的绘制和更新速度,文献[71]提出多智能体协同高精度地图构建的制作和更新框架,既保障了速度又降低了成本。在多个机器人的路径规划方面,群体智能算法因为其集群的智慧和自然的适应性,广泛地应用于集群中智能体的路径规划。同时机器人规模化集群作业不仅要求调度系统能够接入各种类型的机器人,在统一的环境下完成作业调度,还需要多机器人的智能化调度算法,找到全局无碰撞、时间最短、距离最短、效率最高的调度。文献[72]提出基于深度进化强化学习的去中心化部分可观多智能体(decentralized partial observable multi-agent,DPOMA)路径规划算法,以学习在混合动态环境中最有效的局部规划策略,在面对大量非合作的动态障碍物时能够提高的成功率和性能。
PNT智能技术是群体智能的基础。人工智能算法能让整个系统不断优化,群体智能化程度越来越高。智能PNT赋能群体机器人时空位置精准感知,可实现机器群体时空位置协同控制。利用主动感知或被动感知的PNT技术,规模化移动智能机器群体或智能微尘等能像蜂群、蚁群、鸟群一样开展群体协同,分工、互补、配合完成某项任务,属群体智能型PNT。以北斗为代表的PNT智能技术在群体智能中充当着重要作用。例如,基于北斗地基增强的RTK服务能为智能体提供厘米级高精度定位,因此北斗高精度定位能使群体智能体系统实现去中心化的实时精准高精度定位[73]。又比如,北斗卫星导航系统提供的高精度时间授时精度达到了纳秒级[74-75],因此北斗高精度授时服务能为群体智能体中的多个智能体之间提供时间同步服务并且起到时间戳触发作用,有效地避免多个智能体的传感器数据之间的干扰,提高群体智能协同能力。
受人群导航时的合作本性启发,人行道、走廊和广场等场景中的多智能体合作导航也成为研究热门。文献[76]使用卷积神经网络和图神经网络结合为多智能体导航学习一个动作策略,其中卷积神经网络用来从环境的局部观测中提取特征,图神经网络基于这些特征来计算多智能体的动作策略。虽然上述方法考虑了安全和避免碰撞,但该方法仅仅将人视为障碍。针对连续域中多个非通信智能体之间的去中心化导航,文献[77]提出一种受人类思维范式启发的合作碰撞避免模型,它可以同时实现基于常识的符号推理和基于数据的轨迹生成,使得多智能体间能耦合推理和控制,即智能体能够预测自身行为对其他智能体的影响,在推理出其他智能体意图的导航策略的同时生成到达自身目的地的轨迹。
4.7 全球性时空信息基础设施智能化的思考
全球性或广域性时空信息基础设施,如GNSS或地基增强系统等都可以利用人工智能来实现智能化的设计、建设、运控和维护甚至智慧化服务,这也是未来国际上GNSS技术发展的竞争焦点。中国综合PNT[78]主要解决了北斗/GNSS脆弱性问题,其智能化发展还应该对生物PNT智能早做基础研究并开展学习和模仿,向类生物PNT智能和类脑PNT智能技术,以及人工智能技术融合道路发展。作为提供时空位置服务的PNT基础设施,智能化北斗系统从设计、建构、运管维都能实现智能或智慧化。特别是对环境变化影响有自评估能力,并自主可控地实现对有意无意侵害的预报预警,还能赋给其系统和子系统趋利避害的能力;对运行故障有自定位能力;对常规型故障有自修复能力;对提供的服务信号、数据、产品有质量评价指标和指标可靠性评估;如果需要,对各类用户还应有行为感知和认知预示能力。
智能化北斗系统未来发展一定是全球性跨时空域需求的时空智能赋能模式,值得探索的方向包括以下几点。
(1)我国下一代综合PNT为防范PNT固有的脆弱性提出的“弹性架构”[79],其核心和基础之一应有类似动物的免疫功能体系。如仿生的人工免疫体系(artificial immune systems,AIS)及相应的免疫计算(immune computation),如免疫计算中的“反向选择计算(negative selection computing)”模仿生物体中训练过程和检测过程的免疫细胞机制,无须先验知识即可利用正常样本来识别入侵、干扰、异常等问题,包括卫星荷载受环境因素干扰产生的完备性智能检测,以及卫星荷载和定位导航接收机防欺骗和病毒的免疫智能算法。
(2)生物时空智能不仅能利用自然信号如地磁场、重力场、大气散射后的阳光甚至月光形成的大气偏振光、热辐射、气味等开展时空位置感知认知,而且也能产生能定向聚能的超声波、电磁波主动感知引导追索目标,如根据用户需求向局部区域发送聚能的PNT信号。因此,开展自然信号和生物PNT智能基础研究和技术攻关是未来智能PNT的构建的技术制高点、突破点,也是走向融合的PNT基础设施所必须具备的。
(3)脑认知的量子PNT技术也是智能PNT的战略制高点、突破点。精密量子测量技术将提供精确度和稳定度更高的原子钟,基于对原子的量子调控技术将提供超高精度的量子陀螺、加速度计和重力梯度仪[80]等,它们为长航时自主导航、海洋和空间大地测量和资源勘探提供变革性技术装备。
(4)围绕候鸟、昆虫对大气散射阳光甚至月光后的蓝光、紫光和紫外光的偏振轴随时间转向的感知机理、时空特征认知开展研究和设备仿真;高空、近地轨道飞行载体的阳光和大气散射偏振现象及其时空特征也应成为研究内容之一[81],目的是为地面测站和卫星运行中自主时空位置确定寻找新方法;另外,还应探索宇宙射线μ介子的新型导航技术,解决高纬度地区以及隧道水下等场景中的导航定位问题[82]。
(5)持续发展中子星X射线信号的卫星接收和深远太空的时空系统时空位置定位理论和方法研究。支持同时探测地球磁场和重力场精细结构的卫星群方案研究和优于10 m分辨率的地球磁场重力场匹配定位研究。
(6)目前,满足地下或封闭空间,特别是海洋空间、网络空间和近地空天PNT构建需求和目标智能PNT探测需求,既是长期又是紧迫的战略重点。地球及其邻近空间是综合PNT构建对象,包括不同空域和时域形态,即陆、海、空、天及网络空间与地下空间,还有自然规律变化和人为划分的不同时域,因此,应加强陆、海、天、空、网多域PNT能力的一体化研究,即综合PNT不仅要满足多时空域和跨不同时空域的需求,还要满足上述空间全时空域的联合或协同PNT需求。
5 结论与展望
PNT智能即时空智能是自然界生命体寻找生存资源长期演进出来的感知认知与时空位置相关的智能,与生命体其他类型智能融合互动,以精准的时空位置判断作为决策依据和行为参数,直接参与生命体趋利避害的决策和调控,既维护生命体的生存,又推进生命体的进化。而随着人类对时空智能的认知水平提高,促进了对地球和宇宙中的物质、能量和信息与时空关系的深度认知,发展出时间空间相关科学理论,发明出与时空位置有关的感知探测技术。这些PNT技术是人类长期利用自然信号以及人工信号来感知并认知物质、能量、信息及其与时空位置关系的工具方法和装备体系,当前已发展到构建全球性甚至为未来太空探测提供时空位置服务的基础设施阶段。
智能PNT技术的发展途径应该多从广泛生命体的PNT智能中寻找源头、思路和启发,同时也应吸取当今人工智能的研究精华。无疑,类生命体PNT智能和类脑PNT智能及其与人工智能的融合是当前和未来智能PNT的研究前沿、制高点和突破点。
我国提出的综合PNT系统和其弹性构架目的是解决全球脆弱性问题,进一步还可解决陆、海、天、空、网多域的时空位置服务问题。今后发展方向应该是成为智能化的时空位置信息服务基础设施。智能化长远目标是能在不同时空域环境中具有自然智能最省资源与能量的特性;能自适应多域转换的环境变化、能有预警环境灾害,以及防护和免疫外界入侵的趋利避害能力;在预设或可预估情况下有自修复能力;作为时空位置服务基础设施,自身与通导遥子系统之间和多个独立功能体之间,应该具有群体协同智能,并与其他通信、遥感类基础设施系统之间,也应该具有全局性最优的协同智能。
总之,未来目标是:深入研究好PNT自然智能,不断地开发出智能PNT人类技术。