一种基于RPC的组态化卫星模拟器故障注入方法*
2021-05-18杨善强李华旺常亮高才栋虞业泺
杨善强,李华旺,常亮,高才栋,虞业泺
(1 中国科学院微小卫星创新研究院, 上海 201210; 2 中国科学院大学, 北京 100049; 3 上海科技大学, 上海 201210)(2019年8月9日收稿; 2019年12月4日收修改稿)
卫星长时间运行在复杂、恶劣的太空环境中,不可避免地会出现故障,有的故障会对卫星的寿命和应用造成影响[1-2]。故障注入能够有效检验系统的容错能力,已经在软件测试领域得到广泛应用。故障注入的基本思想是:应用和环境共同组成系统,环境的范围包含所有不属于应用程序的代码,应用和环境交互的接口处是故障的注入点,通过在故障注入点上模拟实现各类在真实环境中可能出现的故障,观察被测对象的反应,从而检验其对故障的耐受能力[3-4]。
目前对故障注入不同角度和深度的研究已有很多成果,其实现方法和应用场景各不相同:
1)为提高模拟程度,建立基于半物理的实时仿真平台,实现不同层次不同类型故障的单独注入,更加真实地得到故障信息。然而半实物仿真测试环境需要开发硬件设备,搭建硬件连接,测试的及时性和灵活性得不到保证[5]。
2)为精确有效地实现故障注入,通过在源码中添加故障注入代码,在有故障注入请求时就进入相应分支进行故障注入。然而故障注入工具的开放性欠好,很难在此基础上进行再开发和扩展[6]。
3)为注入任意位置任意类型的故障,提高仿真平台的通用性,根据系统配置信息构建存储所有可能的通信链路节点的故障库,通过多元组或文本模型实现对任意位置任意时间的故障注入。但该方法只实现了目标系统链路的离散故障,缺少对连续故障的注入[7]。
以上方法与目标研究系统有较强的关联性,但在面对新的目标系统时故障注入模型的复用程度低[8-11]。本文从提高故障仿真模型的可复用性角度,就卫星系统的仿真测试提出一种基于RPC(remote procedure call,远程过程调用)的组态化模拟器故障注入方法,设计一个内含故障注入的通用卫星单机模型,可以通过通用卫星单机模型的组态化实现不同的卫星单机,同时在配置卫星单机模型时不必考虑故障注入。进一步地,该通用单机适用于不同型号的卫星单机,有效缩短卫星仿真建模的周期。
1 故障注入模型设计
1.1 故障注入模型结构
故障注入模型根据功能需要由通用单机模型、故障协议与故障注入前端3部分组成。故障注入前端负责获取用户输入的故障信息和显示卫星的信息,并且通过RPC调用模拟器的功能函数来封装、组帧故障信息。通过模型拆分,各模块之间通过接口实现,可以有效地增加整个模型的可维护性和复用性。模型体系结构如图1所示。
图1 故障注入模型结构图Fig.1 Structure chart of fault injection model
1)故障注入是故障注入前端将故障信息传递给卫星模拟器,然后获取卫星模拟器对故障信息处理的返回值的过程。为提高故障注入模型的复用性,使之适用于不同型号的单机,设计一种通用单机模型。在通用单机模型中提供模型接口,当为某型号卫星建模时可以直接调用相应接口配置为实际的单机模型(如星敏感器、飞轮等)。
2)为提高故障注入模型的可维护性、可扩展性和代码的易读性,将添加故障信息过程抽象为RPC。使用RPC通信能够使故障注入前端就像进行本地调用一样去调用模拟器的相应函数来处理打包故障信息。
3)同时设计故障注入协议用以对故障前端输出与接收故障信息进行控制,其规定了故障信息的封装方式以及故障注入前端与卫星模拟器之间通信链路的数据格式,是沟通故障注入前端与模拟器的桥梁。
1.2 通用单机模型设计
由于任何数据以及数据交互过程均可抽象为某种数据交互模型,在仿真环境中把数据交互模型称为数据流模型[12]。基于此,设计一个如图2所示的通用数据流单机模型框架,将单机的参数与数据打包动作进行分离,通过参数库、数据打包、逻辑控制3个功能模块描述该通用单机模型。功能模块之间通过接口进行信息交互,单机参数、数据打包以及逻辑动作都是由用户定义,同时故障注入在框架内部完成。
图2 通用单机模型结构图Fig.2 General model structure diagram
为提高单机模型的复用性,对通用单机模型的内部模块做如下约定:
1)参数库中使用三元组(标识符、数据、数据锁)定义单机的参数属性,分别表示该单机收到的指令或遥测数据的身份标识、该参数值和该值是否可以被修改,若此时值由于故障被锁定,则动力学数据无法写入参数库。
2)数据打包模块从参数库中提取数据,进行打包封装、校验,并且当有故障激发,在打包时进行故障注入。
3)逻辑模块读取和更新参数库的内容,同时决定数据包封装和发送的时机,还规定了发送次数。外部可以调用逻辑模块的外部接口。
单机通用模型的3个模块都提供外部接口函数,在搭建具体单机仿真模型时,只需调用相应的接口函数来创建自己的参数库、数据更新函数、数据发送函数即可快速完成单机建模。
1.3 故障协议设计
设计一组故障协议规定模拟器对故障注入前端的故障信息的打包封装格式。并将通用故障协议分为3层:链路层、任务数据层、业务控制层,如图3所示。
图3 故障协议层次图Fig.3 Fault agreement hierarchy
1)链路层协议
链路层是整个故障协议的最底层,所有的上层模块都依赖于链路层,其不关心实际的远程调用逻辑,仅负责信息的收发和编解码,同时为上层模块提供与业务无关的基础服务。
在链路层,数据是以通信帧的形式在卫星单机各模块间流动的,各种数据从产生节点到目的节点需要指定一个传输链路,并且需要规定好通信帧的格式,本文设计的通信帧格式如表1所示。此处,卫星模拟器与故障注入前端之间通过TCP(transmission control protocol,传输控制协议)进行通信。
表1 通信帧格式描述Table 1 Description of communication frame format
2)任务数据层协议
任务数据层主要记录故障注入的数据信息,同时对不同的故障信息设计不同的数据格式封装处理,这里设计6种(协议类、单机参数类、动力学数据类、仿真控制类、指令注入类、外设类)数据格式应对不同类型的故障信息。
这6种数据格式均分为有效载荷区和数据区两部分,有效载荷存放的是需要调用的数据交互方法和同类故障数据的组数计数器,数据区为故障前端输入的故障数据。对不同的故障信息,数据区内部的数据结构不同,如图4所示。
图4 任务数据层数据格式Fig.4 Data format of task data layer
3)业务控制层协议
业务控制层定义一组数据业务,又称为数据交互方法,卫星模拟器通过调用不同的业务来处理故障注入前端传来的故障信息,即将故障信息注入到卫星仿真模型中。
由于卫星中数据交互的任意接口位置都有可能发生故障,因此在本文中将所有的数据交互方法统称为原子故障。原子故障是卫星模拟器的最底层故障,通过原子故障可以组合共同作用实现更加复杂的故障,根据卫星模拟器故障注入的需要,设计表2所示的28种原子故障实现卫星模拟器的故障。
1.4 基于RPC的通信机制
为了提供未来进一步扩展和维护的可能性[13],使用RPC完成对故障注入前端故障信息的封装。RPC是一种基于客户/服务模式的函数调用过程,它将一个服务的请求和执行分别存放在客户端和服务器之中,其本质是在客户端要求远程服务端运行某项服务并获取其结果的过程,如图5所示。它是一种进程间的通信机制,一般承担系统协调与数据交互的责任,并未规定具体的实现方式、平台和语言[14-15]。
表2 原子故障类型表Table 2 Atomic fault types
图5 调用包在远程过程调用中的传输Fig.5 Transmission of the call package during a RPC
通过使用RPC的通信机制,可以将故障信息的封装与故障注入前端分离,这样故障注入前端只需要负责捕获用户输入的故障信息以及显示功能,易于扩展新的故障。
这里将故障注入前端设定为客户端,卫星模拟器为服务端,提供客户端需要的故障信息打包封装函数。通过RPC封装故障前端的故障信息的过程为:当使用者在故障注入前端添加故障信息后,客户端将目标程序的规范和相关参数放置在调用信息包中,并请求RPC网络链路将调用包发送给被调用者,即服务端。一旦服务端接收到这些信息包,服务端会将它们解包获取任务数据,然后根据任务数据中有效载荷标识的业务方法去执行一个完全正常的本地调用,该本地调用会调用服务端中相对应的程序去处理任务数据中的数据。与此同时,服务端的调用进程将被挂起并等待结果包的返回。当服务端中的调用完成时,它将结果包发送给客户端,然后结果包传送回给客户端被挂起的进程,它们将被解包并返回客户端的初始调用函数。
1.5 故障注入流程
基于上述设计模块,故障注入实现流程如图6所示。
图6 故障注入流程Fig.6 Flow chart of simulating faults of satellite
1)在故障注入前端的界面上给目标单机添加故障信息后,通过RPC调用数据交互方法将故障信息、故障单机信息添加到通信帧中,然后发送给模拟器。
2)模拟器接受到通信帧后,分析通信帧的目的地(即目标单机),向目标单机发送故障数据,而单机接收到数据后,在更新或打包单机数据时根据故障类型将故障信息封装到单机数据中。
3)之后模拟器再将单机数据按照表1所示格式组帧,然后发送给故障注入前端,故障注入前端再将收到的通信帧解帧并且通过界面显示。
2 实践验证
2.1 组态化实现星敏感器
通过前文设计的卫星通用单机模型能够组态实现不同型号的单机模型,由于篇幅有限,本文仅以某型号的星敏感器为例讲述使用通用单机模型组态化为实际单机的过程,不同型号、不同单机只是它们的参数库、遥测控包和触发事件的逻辑不同,其他并无不同。基于上述通用单机模型实现单机模型的过程是向通用单机模型框架注册参数、数据包、逻辑,同时定义单机接口的过程。图7所示为组态实现的该型号星敏感器结构图。
图7 星敏感器结构图Fig.7 Star sensor structure diagram
基于通用单机模型实现星敏感器的过程为:
1)搭建星敏感器参数库:输入星敏感器的所有参数,并给这些参数赋初值。
2)构建星敏感器打包模块:首先设置该星敏感器的参数包列表;然后给出各参数包的组成元素,即每个参数包由参数库中的哪些元素组成,以及将这些参数打包的动作;最后设置对遥控指令帧的解帧、提取指令值的动作。
3)注册星敏感器逻辑模块:设置单机参数更新的时机、连接指令与打包动作、连接指令与参数包发送动作。
基于此方法实现星敏感器的花费资源如表3所示。
表3 新旧方法花费资源对比Table 3Resource cost comparison of new and old methods
2.2 故障注入过程示例
表2描述的原子故障是最基本的故障,通过多个原子故障组合能够实现任意位置、任意组合的故障注入,表4列举了一些常见的故障类型。
表4 故障示例Table 4 The fault samples
以2.1节组态实现的星敏感器为例,进行故障注入仿真过程演示,该型号有3个星敏感器,分别以A、B、C命名,除此之外并无差别,这里选取星敏感器A进行展示。
1)注入单机参数故障
图8展示对星敏感器A注入单机参数故障前后的参数值变化,此处注入故障的参数为星敏四元素Q1。
图8 对星敏感器注入参数故障的过程Fig.8 The process of injecting a parameter fault into a star sensor
在正常仿真状态下,星敏A的星敏四元素数值变化范围为(-1,1),如图8(a)所示;接下来模拟星敏四元素Q1未能正常更新的故障,在给星敏四元素Q1注入参数故障1000并锁死后,观察到Q1的值固定在1000而不再更新。当星务软件检测到星敏A发生了故障,根据内部算法放弃星敏A采集到的数据,改用星敏B的数据。由此判定星务软件对星敏故障的应对措施有效。
2)注入遥测帧故障
图9展示对星敏感器A遥测姿态包的第3、4个字节中的某些位注入故障前后姿态包信息的变化。
图9 对星敏感器注入遥测故障的过程Fig.9 The process of injecting a telemetry fault into a star sensor
对星敏感器A发送的遥测姿态包按位进行故障注入,遥测帧故障注入格式为(帧位置、掩码、故障值),遥测帧故障按照下式规则进行注入。
Value=f(value,mask,fault)
=(fault&mask)|(value&~mask),
(1)
式中:value为遥测帧原值;mask为掩码值,按位屏蔽输入的故障值,若该位为1则屏蔽故障,为0则允许该位注入故障;fault为注入的故障值;Value为故障注入后值。
通过对姿态包第3、4字节的数值(16进制表示)按照上述规则进行计算,计算结果如图10所示,与图9展示的故障注入后的数据是匹配的,说明遥测故障注入有效。
图10 数值计算结果Fig.10 Numerical calculation result
2.3 新方法使用前后对比
在设计使用本故障注入模型之前,对某通信卫星建立仿真模型以及故障注入模型时,该通信卫星的陀螺、反作用轮、推力器、星敏、太敏等不同单机的故障源、故障类型都不相同,某一单机的不同故障也需要单独处理,导致该型号的仿真模型代码冗余,一般需要一个月的时间才能完成卫星仿真模拟器的搭建和调试。
而使用基于RPC的故障注入模型,只需调用通用单机模型的接口组态化为不同型号的不同单机模型,该方法已应用于对SVOM、某通信卫星、某遥感卫星的仿真建模中,为这些型号搭建仿真模拟器分别使用了两周左右时间,为这些型号的方案设计验证、星务代码的测试提供了支持。
同时,使用基于RPC的故障注入方法具有故障类型丰富的特点,支持如数据风暴:同一时间点内发送大量有效数据;中断冲突:星务软件触发假中断或中断嵌套。
使用新旧方法参数对比如表5所示。
表5 新旧方法对比Table 5 Comparison of parameters of old and new methods
3 结束语
本文设计一种基于RPC的组态化模拟器标准故障注入方法,通过对卫星单机建立通用仿真模型,对卫星系统进行故障注入。该卫星仿真模型实现的功能如下:
1)虚拟化构建卫星的硬件环境和外部数据源,等效模拟实际卫星的运转状况。
2)在没有故障注入时,故障注入前端向模拟器发送获取数据的请求,模拟器将由动力学更新的单机数据组包发送给故障注入前端,故障注入前端将通信帧解帧获得各单机参数并显示在界面上。
3)在有故障信息注入时,故障注入前端通过RPC调用模拟器端的数据交互方法将故障信息组帧打包发送给模拟器端,模拟器解包通信帧获得故障信息,在单机数据更新和打包时将故障信息注入,然后向故障注入前端发送已被故障注入的该单机数据包。
本方法投入实践使用后,能够有效缩短卫星仿真模型开发周期,对型号的仿真建模从原来的一个月缩短到两周时间。在以后的研究工作中,应继续提炼形成更加标准化的通用模型,使得可以通过配置文本的方式建立卫星仿真模型,进一步提高模型组态化、复用性的程度;另一方面可以从动力学模型、能源热控模型等角度入手,提高模型的仿真精度。