APP下载

物理层AI关键技术探讨

2022-07-18韩双锋刘志明刘光毅王晓云

无线电通信技术 2022年4期
关键词:物理层信道无线

韩双锋,刘志明,杨 坤,刘光毅,王晓云

(1.中国移动通信有限公司研究院,北京 100053;2.中国移动通信集团河北有限公司,河北 高阳 071500;3.中国移动通信集团有限公司,北京 100033)

0 引言

随着5G标准化和产业化的快速发展,面向2030+,预计6G有望在5G的基础之上全面实现数字化,推动社会走向“数字孪生,智慧泛在”的愿景[1-2]。以机器学习和深度学习为代表的人工智能(Artificial Intelligence,AI)技术近些年在自然语言处理和图像识别等多个领域实现了快速发展,已经开始深度融入人类生活,助力实现6G愿景[3-4]。

无线通信系统中存在大量种类丰富的数据,例如无线信道、空口信令、网络环境、用户喜好、业务特征等。现阶段将AI技术应用在无线网络中将有助于更精准地预测业务特征、用户移动性、用户行为、信道环境等信息,最终通过智能资源管理与调度机制保证更好的服务质量和用户体验,实现更好的公平性和系统资源利用率,促进无线通信网络的开放与智能[5]。长期来看,基于AI的无线网络设计有助于实现通信协议的自动升级,从而有效降低网络部署与运维成本,实现移动通信产业的可持续发展。

目前业界对无线网络AI技术已经开展了深入而广泛的研究,例如ITU的机器学习焦点组研究机器学习在未来网络的应用场景、潜在需求,用于移动网络优化的机器学习算法、数据结构和个人信息保护等,以及支持机器学习的未来网络架构、接口、协议等。3GPP也开始了AI在核心网、网管网优、接入网等领域的标准化工作。例如在核心网中基于网络数据的收集和分析,研究如何引入AI能力进行网络优化,包括定制化的移动性管理、5G 服务质量增强、动态流量疏导和分流、基于终端业务用途的流量策略、业务分类等。还有在RAN侧研究数据的收集过程以及利用分析结果进行网络优化的信令过程。

物理层AI技术近年来已取得显著进展[6-10]。大量研究表明,将AI技术融入到新型编码调制、多址、波形设计、预编码、信道估计、信号检测等物理层模块设计中,可带来显著的性能增益。3GPP已经启动物理层AI 的研究项目,业界在物理层AI算法和典型用例等重要课题上也开展了深入研究,为将来物理层AI技术的实际应用打下了重要基础。

不可否认的是,物理层AI技术是一个新兴研究领域,业界对其还有很多的疑惑和问题。例如其最主要的应用场景是什么?训练数据集如何获得,仿真还是实测? 如何提升AI算法的泛化性?评估准则、评估指标和传统的通信系统有何不同?物理层AI的性能极限是怎样的?AI算法的功耗和成本是不是会引入巨大的投入?AI算法是设备商私有还是公开透明?AI算法未来的标准化和产业化前景如何,要满足怎样的条件才可以顺利落地?

本文首先分析了物理层AI面临的问题和挑战,然后对AI算法设计、数据集建立、评估准则和指标、泛化性提升等方面进行系统阐述,并提出了提升AI 算法泛化性的几种方案,最后提出了几点未来的研究方向和标准化演进思路。

1 物理层AI研究面临的挑战

虽然物理层AI的研究日益蓬勃发展,但仍然存在大量的问题和挑战,需要业界持续深入研究和突破。

① 业界在数据集的构建上还没有达成一致的意见,不同研究机构采用的数据集并不统一,AI模型和训练参数往往也不公开,导致研究结果难以相互验证;

② 目前主流的物理层AI算法都是来自于图像与语音处理领域的经典算法,由于无线信道具有自己独特的特征,如何将经典AI算法与无线数据以及无线领域专家知识进行有机融合还是非常开放的问题;

③ 无线通信系统的显著特征是通信场景复杂多变(室内、室外、高铁等)与业务形式多样(语音、视频、图片、网络语音等),如何让物理层AI方案在有限算力前提下适用于多种通信场景与业务形式,是业界目前需要克服的重要挑战;

④ 物理层AI未来标准化和产业化落地的先决条件是在什么场景下可以带来怎样的性能增益,在综合考虑算力、功耗、数据集构建开销、无线信令开销等成本的前提下,AI方案对比传统设计是否有性能增益等重要问题还缺乏系统科学的分析与论证;

⑤ 泛化性是AI算法的固有问题,业界在泛化性定义、评估准则与评估指标等方面还没有达成共识,3GPP等标准化组织已有的用于评估无线方案性能的方法体系也不能满足系统性评估物理层AI方案的需求。

2 物理层AI算法设计理念和泛化性

针对某个或者多个无线通信场景和应用性能提升(例如室外环境中的信道估计)的AI算法设计,首先考虑数据集的建立,数据集应该涵盖所涉及的所有场景。根据数据集,进而优化设计AI算法设计,使得系统的性能最好。评估多个场景的AI算法性能时,评估准则和指标是非常关键的,尤其是和传统的非AI方案相比,如何拉齐评估基准(例如功耗、成本、复杂度、时延、空口资源开销等),将直接决定设计的AI算法性能是否优秀。3GPP等标准化组织讨论的基于AI的物理层增强也是应该全面评估AI算法与传统算法的开销和性能,进而决定引入AI技术对于系统来说是否有价值。此外,算法设计、数据集建立、评估准则和指标还必须要考虑泛化性的要求,需要联合优化设计。

在满足数据集(数据集大小、数据的特征分布、采集开销等)、模型训练与更新(包括训练和推理时延、复杂度、模型类型和参数规模等)、软硬件资源(所需的软硬件规模、成本等)、功耗(由于引入AI算法所需要的功耗开销)等约束的前提下,AI架构和算法的泛化性定义为对不同业务、用例、通信场景以及优化目标等多个指标的适用性。

如表1所示,通信场景包括室外、室内、城区、高铁等典型场景,业务包括主流的无线通信业务,如话音、视频、图片、流媒体等;用例包括主流的物理层AI技术,例如信道估计、压缩、预测、波束管理、功率控制、无线定位等;评价指标KPI(Key Performance Indicator)包括信道反馈相关的归一化均方误差(Normalized Mean Square Error,NMSE)或是余弦相似度、吞吐量、服务质量、业务体验质量、误码率、中断概率等。

表1 泛化性定义

传统通信系统中针对不同的场景和业务采用不同的传输方案,例如不同的编码调制方案、MIMO模式等。基于AI的物理层功能增强也很难有一套恒定的AI架构和参数可以满足不同场景和业务下不同的指标需求。这就要求在给定的场景、业务、用例和指标需求的前提下,明确AI模型的输入输出关系,然后建立科学的数据集进行训练,形成优化的模型架构和相应的参数。在业界大多数研究成果中,AI算法的泛化性普遍存在问题,尤其是随着终端工作的信道环境发生变化时,用于训练的信道数据集和实际信道环境之间的不匹配很容易造成性能的下降。

3 考虑算法泛化性的评估准则和指标

为了便于与传统非AI方案进行对比,所选评估KPI应当能够全面地反映物理层AI方案的性能与引入的开销。与系统性能相关的KPI主要用途为量化物理层AI方案,相对于传统非AI方案带来的性能提升,可以参考传统非AI方案性能的KPI。以空口AI中讨论较多的FDD MIMO下行信道反馈增强为例,可以选取NMSE或是余弦相似度作为信道恢复精度的度量KPI,对于信道估计,可以选取信道估计的NMSE作为KPI,或是选择链路级/系统级指标(如误比特率或吞吐量等)作为反映信道精度对系统性能影响的度量KPI。前者的优点在于评估较为简单,缺点是无法完全反映引入AI所带来的开销;相对地,后者优点为能反映出基于AI的信道反馈方案对于系统性能的整体影响,缺点为评估步骤更加繁琐。

另外,评估KPI需要考虑算法的泛化性能力需求,例如对于信道预测用例来说,在不同的天线数和不同场景情况下,KPI是要有区别的,既要反映不同场景下的AI能力所固有的差异性,又要体现不同场景下性能的稳定性,不能出现太大的波动。

为了引入物理层AI能力,并具有良好的泛化性,需要全面分析相关的代价和开销。在与非AI的技术方案进行比较时,这些代价需要综合考虑。

AI模型训练和推理复杂度是指AI模型训练和推理阶段带来的计算开销,实际部署中主要关注推理计算复杂度对运行时间的影响,一般以模型训练和推理所需的浮点数运算量为依据。对于在线训练方案来说,训练开销会对方案的时延有明显影响,训练时延是必须要考虑的因素。

训练和测试数据集大小是指因数据采集而产生的相关开销,包含离线开销和在线开销。相比之下,非AI方案则不需要数据收集与训练过程,出于公平的原则应当将该过程的开销计入AI方案的代价中。

用例相关的无线资源开销是指在具体用例中引入AI带来的无线资源开销。以基于AI的下行信道压缩反馈为例,其模型需要在终端与基站同时部署,并要求二者保持同步。该过程将涉及到模型本身的传输,因此需要将相关开销纳入考虑之中。但是对于基于AI的信道反馈等用例来说,只需在终端或基站侧部署模型,不存在模型传递带来的开销。

这部分开销相对很复杂,不同的泛化性要求会造成不同的方案设计以及相应的开销。例如,对于信道压缩反馈的用例来说,如果要求优秀的AI模型和算法泛化性,就需要AI模型与算法根据信道环境的变化实时在线更新,这不可避免地造成无线资源开销的增加。另外,如果终端有较强的模型训练能力,终端侧可以基于实时测量的下行信道信息进行终端侧AI编码器的训练,基站侧的AI译码器可以保持不变,从而可以大量降低无线资源开销。

AI算法所需的硬件成本和功耗大规模AI算法通常需要昂贵的硬件设备,以及巨大的功耗开销,这些是衡量AI算法性能非常重要的指标。由于5G的大规模MIMO系统的功耗问题已经非常严重[11-12],面向未来6G,引入物理层AI 后如果其功耗和成本大幅增加,会影响标准化和产业化落地。

4 数据集构建

AI模型的性能很大程度上取决于其训练数据,如果训练数据集未能充分体现数据特征,则可能导致AI模型的测试性能大幅下降,甚至改变最终的评估结论。物理层AI 的数据集的选择主要有3种方式:① 根据已有的信道模型通过仿真的方式获得,其优点是多场景数据可以比较方便地生成,但是和具体通信场景的数据可能存在较大的偏差;② 通过实际信道测量的方式获得,优点是非常准确,据此训练的AI模型效果最好,缺点是采集开销非常大;③ 仿真模型和实测数据的结合,一般是利用ray-tracing方式得到某个区域的信道模型,然后再结合实测数据构建数据集,这样既可以基于实际的信道环境,又可以降低实际数据的采集开销。

给定场景下采集的信道数据训练得到的模型在信道场景变化时会出现性能下降。一种直接的克服场景迁移中出现泛化性问题的方式是在训练集中包含多个场景下的数据,但由于模型存在归因偏好,会出现某一类场景性能较好,另一类场景性能较差的情况。考虑基于自编码器的下行信道信息的压缩,以CDL信道模型为例,数据集采用uma LOS/uma NLOS/umi NLOS多个场景信道的混合数据进行模型训练。在不同的测试场景下,NMSE的表现如表2所示。可以看出,在不同的反馈开销下,相较于NLOS,LOS场景的性能较差,可能的原因是模型“迁就”样式更复杂的样本(NLOS),对于LOS信道的简单样本无法有效利用其先验信息,这也说明数据集要根据通信场景科学的构建。

表2 不同场景下信道压缩反馈方案NMSE的性能

业界目前关于良好的无线数据集应当具备哪些特征存在一定争论。从运营商的角度来看,一个优秀的无线数据集应当在满足模型性能需求的前提下具有尽可能低的获取开销。虽然在评估阶段,可以使用大规模的数据集来保证测试结果尽量准确;但在实际网络中,数据集获取的开销远非可以忽略的水平,甚至会占用相当多的无线资源。虽然部分数据采集过程可以与数据传输过程分开,并采取一定的错峰策略(例如选择业务量较小的时候进行数据采集),但上述做法仍可能存在与现有部分无线节能策略冲突的可能性(例如大量的数据采集将占用原本基站关断的时间)。因此,数据集构建的基本原则是实测开销要最小化。

一个降低数据集构建难度的思路是设计高度可解释性的AI算法,使其少量关键参数反映信道的特征,例如天线之间的相关性和多径分布等。随着通信信道环境的变化,终端或者基站可以根据实时测量的信道特征快速地更新AI架构参数。这样可以大幅度降低数据集构建对实测数据的要求,而且还可以实时更新AI模型,使其快速适配信道状态。

5 泛化性提升技术

基于前面泛化性的定义,由于无线系统中的数据与无线环境密切相关,且无线环境本身存在不稳定性,再加上实际部署中对于模型推理时间的要求,所以在实际系统中使用单个强大而复杂的模型应对所有无线环境的做法将会面对模型训练与推理开销巨大的挑战。物理层AI模型都将有一定的适用范围,一旦超出这种范围,例如终端由于移动性发生了小区切换,甚至是直接来到另一个城市,则之前使用的模型很可能因出现明显的性能下降甚至导致不可用的情况。为了克服该挑战而使用的各种方案(包括模型更新等)带来的开销均可视为泛化性相关的开销。

相关研究发现,物理层AI方案的性能与适用场景存在一定的折衷关系,同时要求一个模型具备很好的性能与较大的适用场景是极具挑战的目标。在基于深度学习的信道信息反馈中,往往采用自监督学习方式训练自编码器网络,以基站侧解码器重建的信道信息与终端侧的原始信道信息之间的误差最小化为目标进行优化,由于基站侧没有原始信道信息作为标签信息,需要终端将大量原始信道信息样本传输至拥有较强算力的基站侧进行训练,由此引发了大量上行通信开销,特别在信道环境快速变化的情况下,不符合实际系统的实时性要求。本文提出如下几种泛化性提升的方案:

泛化性提升方案1以FDD MIMO系统下行信道的压缩反馈为例[13-14],采用自编码器的AI架构,编码器和译码器需要联合训练。一种提升泛化性能力的方法是根据信道的多径分布情况进行分类,例如LOS径、3径信道、5径信道等。 针对不同的信道类别,首先选择合适的数据集进行训练,然后把AI模型和对应的信道分类告知基站和终端。终端基于下行信道的测量结果选择相应的编码器。随着通信场景的变化,终端总是可以选择最恰当的AI编码器,从而提升了算法的泛化性能力。

泛化性提升方案2设计具有可解释性的AI模型,当信道环境发生变化时,可以基于实时的信道测量结果对AI模型进行小样本训练或者配置。这种方案的难点在于如何根据发送/接收天线的配置和信道环境设计具有可解释性的AI模型。

泛化性提升方案3迁移学习和元学习[15]。前者旨在将某领域或某任务中学到的知识应用在其他目标领域或任务中。通过迁移学习,仅使用少量样本就可以快速获得新的模型。后者是通过多次学习的经验来改善和加快学习。通过元学习,可以通过少量的训练样本快速学习新的任务。

6 未来研究和标准化趋势

虽然业界在物理层AI方面的研究取得了丰硕的成果,基于前面的分析,面向未来仍然有大量的开放性课题。首先是基于AI的全物理层链路(发射机与接收机)的优化设计,目前的研究还比较初步,后续需要根据信道状态和业务需求进行发射与接收神经网络的联合设计。另外,AI算法通常需要大量的训练数据开销和大规模的神经网络,对系统的成本和功耗有很大的挑战,未来迫切需要低训练开销、低成本、低功耗的AI算法实现。由于AI算法的功耗和具体软硬件设计密切相关,软硬件的联合优化设计也是重要的降低功耗的手段。

面向标准化,物理层AI将逐步从物理层具体模块功能增强方面的研究向多模块甚至链路联合优化方面演进。虽然用到的AI算法很可能不会被标准化,但是完全的代码公开(包含模型本身的结构与训练过程)将会成为一个要求,从而让任意参与方可以完整复现其他方面的评估结果。另外,为了便于物理层AI的输出决策信息可以直接作用于基站的调度器,接入网AI模块和调度器之间的接口需要开放,这样可以促进智能开放的网络实现和运维。

7 结论

围绕物理层AI关键技术,本文剖析了AI算法设计、数据集构建、评估准则和指标以及泛化性增强等技术问题的内在关系,给出了物理层AI算法设计中泛化性的定义,提出了系统性能的评估准则和指标,并深入分析了物理层AI 的代价。还提出了数据集构建准则,以及泛化性提升的多种方案,并对未来研究和标准化进行了展望。

猜你喜欢

物理层信道无线
基于K-ML-MPWFRFT的物理层安全传输技术
《无线互联科技》征稿词(2021)
公路联网电子不停车收费系统路侧单元物理层自动测试软件研发
无线追踪3
基于ARM的无线WiFi插排的设计
ADF7021-N在无线寻呼发射系统中的应用
多天线物理层安全传输系统性能分析
基于导频的OFDM信道估计技术
一种改进的基于DFT-MMSE的信道估计方法
基于MED信道选择和虚拟嵌入块的YASS改进算法