胚胎电子细胞阵列中空闲细胞的配置
2017-11-17王涛蔡金燕孟亚峰刘晓攀潘刚
王涛, 蔡金燕, 孟亚峰, 刘晓攀, 潘刚
军械工程学院 电子与光学工程系, 石家庄 050003
胚胎电子细胞阵列中空闲细胞的配置
王涛, 蔡金燕*, 孟亚峰, 刘晓攀, 潘刚
军械工程学院 电子与光学工程系, 石家庄 050003
空闲细胞是胚胎电子细胞阵列 (EECA)实现自修复的前提,空闲细胞越多,系统的可靠性越高,但过多的空闲细胞也将带来巨大的硬件资源消耗。在航空航天等领域,电子系统追求高可靠性的同时,硬件资源消耗也必须考虑,为优化胚胎电子细胞阵列中空闲细胞的配置,以阵列可靠性和硬件资源消耗为出发点,将多态系统理论引入到阵列的可靠性分析中,优化可靠性计算模型。针对经典胚胎电子细胞阵列,在不同自修复策略下,仿真并分析阵列的可靠性、硬件资源消耗与空闲细胞配置的关系。根据研究结果制定了不同自修复方式下空闲细胞的配置方法,同时兼顾可靠性和硬件资源消耗的要求。同时,研究了确定规模的胚胎电子细胞阵列自修复方式的选择方法。本文研究成果对推动胚胎电子细胞阵列的实际应用具有重要的意义。
胚胎电子细胞阵列 (EECA); 可靠性; 硬件资源消耗; 自修复策略; 空闲细胞; 多态系统理论
随着信息技术的发展,现代电子系统不断向着集成化、复杂化和智能化的方向发展,这就要求电子系统具有更高的可靠性。传统电路容错的设计主要是基于模块冗余的方式,这种容错设计方式实现较为简单,但存在备份模块有限、硬件资源消耗大、环境适应性差等问题[1]。为了提高电路的可靠性和适应能力,减少资源消耗,瑞士联邦工学院于1992年提出了仿生硬件的概念,将生物的自适应、自组织和自修复等功能引入到电路设计中,使电路具有类似的仿生功能。目前,关于仿生硬件的研究主要有演化硬件和胚胎电子细胞阵列(Embryonics Electronics Cell Array,EECA)两种。
胚胎电子细胞阵列是一种基于多细胞组织生长和发育过程而设计的具有生物自适应、自检测和自修复能力的仿生硬件结构[2]。胚胎电子细胞阵列的工作过程是:电路功能分化映射到每一个胚胎电子细胞,所有的胚胎电子细胞共同工作,整个阵列实现功能电路的功能,当阵列中出现故障时,细胞中的故障检测模块就会检测到故障信号,然后通过控制模块启动自修复功能,将出现的故障修复,自修复的本质就是空闲细胞代替故障细胞实现其功能,从而保证阵列正常工作[3]。胚胎型仿生硬件的概念一经提出就受到了国内外学者的广泛关注,目前在理论和应用方面都取得了一定的研究成果。文献[4]介绍了胚胎电子细胞阵列的二维阵列结构,提出了胚胎电子细胞阵列的经典结构设计,并对提出的胚胎电子细胞阵列结构进行了验证;文献[5]利用多路选择器结构实现了胚胎电子细胞阵列结构,为胚胎电子细胞阵列的实现提供了新的结构参考;文献[6]利用查找表(Look-Up Table, LUT)作为功能单元实现了胚胎电子细胞阵列,简化了胚胎电子细胞的结构设计,增强了胚胎电子细胞的功能粒度,有效减少了硬件资源消耗;文献[7]介绍了胚胎电子细胞阵列实现的关键技术,为学习胚胎电子细胞阵列提供了帮助和参考,具有很重要的意义;文献[8]实现了胚胎电子细胞阵列结构容错电路的FPGA验证,实现了对相关理论的实验验证,为后续的相关研究提供了实验支持;文献[9]提出了蜂窝状的胚胎电子细胞阵列结构,丰富了细胞间的连接方式,使细胞间的布局布线更加方便;文献[10]采用基于标记与识别的数据处理方式,提出了一种名为电子组织的自适应可重构多细胞阵列结构,丰富了胚胎电子细胞阵列的自修复方式,提高了胚胎电子细胞阵列的可靠性;文献[11-12]研究了原核细胞阵列结构及自修复策略,有效减少了胚胎电子细胞阵列实现和自修复过程的硬件资源消耗,对于推进胚胎电子细胞阵列的实际应用具有重要意义;文献[13]研究了基于总线的细胞阵列结构和自修复策略,丰富了胚胎细胞间的连接关系,简化了胚胎细胞间的信息和数据传递,有效提高了自修复的效率;文献[14]研究了一种具有多种连接方式的阵列结构,将连接分为相邻连接和不相邻连接,丰富了胚胎细胞间的连接方式,同时提出了一种新的移除进化自修复策略,有效提高了胚胎电子细胞阵列的自修复能力;文献[15-16]从阵列的可靠性出发,研究了胚胎电子细胞阵列的自修复方式选择策略,为实际电路设计提供了理论指导;文献[17]研究了一种多层仿生自修复硬件,解决了现有单层设计的复杂布局布线问题,简化了电路的实现和自修复功能的实现;文献[18]将胚胎硬件的设计引入到三维空间,并进行了相应的结构设计和自修复研究,扩展了胚胎电子细胞阵列适用范围;文献[19]研究了n×n阵列胚胎电子系统应用中的优化设计问题分析,进行了部分优化设计。总的来说,国外关于胚胎型仿生硬件的研究起步比国内早,相关理论知识已经比较成熟,并有部分实现了小型的硬件,如瑞士联邦工学院已研制出具有自修复功能的BioWatch[20]、BioWall[21],欧盟也研制出了POE芯片[22]和Ubichip[23]芯片等。国内的相关研究主要还处于理论研究阶段,相关理论还不是特别成熟,缺乏实际应用研究。
目前,学者们主要致力于对胚胎电子细胞阵列结构、胚胎电子细胞结构、故障检测方式和自修复策略等问题进行研究,关于细胞阵列空闲细胞的数量配置目前研究很少。胚胎电子细胞阵列技术能够有效提高电子系统的可靠性,使电子系统具有自修复能力,适应各种复杂环境,然而硬件资源消耗在胚胎电子细胞阵列技术的实际应用中必须仔细研究。当胚胎电子细胞阵列规模较小时,空闲细胞的数量较少,空闲细胞冗余数量和方式对硬件资源的消耗影响不大。对于大规模或者超大规模胚胎电子细胞阵列,空闲细胞的数量越多,自修复的能力就越强,但是空闲细胞的数量不能无限增加,空闲细胞的冗余方式也不能随意配置,否则将带来巨大的硬件资源消耗。
文献[15-16]已经对二维胚胎电子细胞阵列的可靠性进行了分析,本文将多态系统理论引入到胚胎电子细胞阵列的可靠性分析中,通过状态划分得到了一种基于多态系统理论的胚胎电子细胞阵列可靠性计算模型,在此基础上增加了硬件资源消耗这个指标,更加全面地对自修复过程的性能指标进行分析,得到更加合理的结论;同时为了对胚胎电子细胞阵列结构设计提供指导,提出对胚胎电子细胞阵列空闲细胞的冗余数量和冗余方式进行研究,通过分析不同自修复策略情况下,阵列的可靠性和硬件资源的消耗与空闲细胞配置的关系,提供了一种不同的自修复策略下胚胎电子细胞阵列空闲细胞的配置方法,在硬件资源消耗和胚胎电子细胞阵列的可靠性间找到一个合适的平衡点;同时,根据可靠性和硬件资源消耗关系,研究了已知阵列规模的胚胎电子细胞阵列在不同设计要求下的自修复方式选择方法,对于胚胎电子细胞阵列的实际电路设计具有很好的指导作用。
1 基础知识
1.1 胚胎电子细胞阵列结构
胚胎电子细胞阵列是一种由结构相同的胚胎电子细胞构成的二维胚胎阵列,每个细胞与周围4个细胞通过von Neumann结构进行连接和通信,如图1所示[24-25]。阵列中的每个细胞实现各自的功能,整个阵列的细胞联合共同实现预期的系统功能。
胚胎电子细胞的结构设计如图2所示,每个细胞主要由配置存储模块、地址模块、控制模块、功能模块、故障检测模块及输入输出模块等组成[26]。配置存储模块主要存储细胞自身及自修复过程中需要用到的细胞配置信息,由细胞的地址信息对细胞配置相应的功能。地址模块主要决定细胞在阵列中所处的位置,不同的位置对应不同的环境,细胞的地址信息将决定细胞所表达的功能。控制模块主要控制实现细胞阵列的正常工作和自检测、自修复过程的顺利完成。功能模块是整个细胞的核心,用于实现分配给单个细胞的功能。输入输出模块是细胞相互连接的关系,主要用于实现细胞之间信息的传递。故障检测模块主要功能是检测系统中是否出现故障,如果出现故障,将故障信息传递给控制模块,驱动细胞阵列开始进行自修复[12]。
图1 二维胚胎电子细胞阵列结构
Fig.1 2D structure of embryonics electronic cell array (EECA)
图2 胚胎电子细胞结构
Fig.2 Structure of embryonics electronic cell
1.2 胚胎电子细胞阵列的失效机理和自修复机理
1.2.1 失效机理
失效机理就是引起失效的实质原因,即引起器件失效的物理或化学变化等内在的原因。在胚胎电子细胞阵列中,最基本的组成单元是胚胎电子细胞,所以胚胎电子细胞阵列的失效机理本质上就是胚胎电子细胞的失效机理。
在胚胎电子细胞阵列中,当功能电路的功能映射到了胚胎电子细胞阵列中,每个胚胎电子细胞均有自身的功能。当电子系统工作在航空航天领域时,常处于高温、高压和强辐射的环境中,在这样复杂的环境中,很容易导致胚胎电子细胞内出现开路、短路、无功能或者性能退化等故障,从而导致胚胎电子细胞故障。例如,过电应力、静电放电、机械应力和热应力等都会引起胚胎电子细胞出现开路故障;过电应力、水汽和金属迁移等都会引起胚胎电子细胞出现短路故障;表面离子、芯片裂纹、热载流子和辐射损伤等都会引起胚胎电子细胞出现性能退化。当胚胎电子细胞出现故障时,整个胚胎电子细胞阵列的功能就会失效,此时就需要启动胚胎电子细胞阵列的故障自修复功能,将故障的胚胎电子细胞移除,利用空闲的胚胎电子细胞代替故障的胚胎电子细胞完成相应的功能,从而修复胚胎电子细胞阵列中出现的故障,保证整个胚胎电子细胞阵列的功能正常。
1.2.2 自修复机理
胚胎电子细胞阵列自修复的本质是空闲细胞替换故障细胞代替其完成相应的功能,即当阵列中出现故障时,故障检测模块将故障信号传递给控制模块,控制模块将故障细胞转化为“透明”状态,由空闲细胞代替实现故障细胞的功能,从而保证总体阵列功能不变[27]。
目前,故障自修复策略主要有列(行)移除自修复策略和单细胞移除自修复策略两种。
列(行)移除自修复策略即当阵列中某一细胞出现故障时,该细胞所在列(行)的所有细胞全部变为“透明”状态,仅充当导线的作用,该列(行)的细胞及其右(上)方的细胞整体右(上)移,从而保证阵列的正常工作,具体修复过程如图3所示。
图3为胚胎电子细胞阵列的列移除自修复策略原理。在列移除的胚胎电子细胞阵列中,每个胚胎电子细胞中的配置存储模块均存有该细胞所在行所有细胞工作需要的基因,每一个胚胎电子细胞都有一个自己的地址信息,在胚胎电子细胞阵列中,胚胎电子细胞所表达的基因是由该细胞的地址信息决定的。所以,列移除自修复的基本机理是故障细胞所在列的所有细胞的地址信息的移动和再表达的过程,地址信息直接决定细胞的功能表达,从而保证故障细胞的功能能够继续表达,完成故障的修复。当胚胎电子细胞阵列中出现故障时,故障细胞所在列及其右侧的所有工作细胞列的地址信息均向右移动1位,从而故障细胞所在列就被“透明化”,故障细胞所在列的地址信息传递给其右侧相邻的列,由其右侧的相邻列代替故障细胞所在列,完成其功能,这样就完成了列移除自修复。
如图3所示,细胞(2,3)出现故障,此时故障信息将传给第3列的所有细胞,第3列中所有的细胞将对第2列所有的输出信号不做处理,仅充当导线作用,直接将信号输入给第4列细胞,第4列细胞中的地址模块将第2列的输出列地址信息进行加1,行地址信息不变,从而第4列细胞的地址信息就代替了原来第3列细胞的地址信息,此时根据第4列的地址信息从而选择第4列细胞的功能。因为第4列细胞代替了第3列细胞的地址,所以第4列细胞就开始执行第3列细胞的功能,从而完成故障细胞(2,3)的修复。
图3 列移除自修复策略原理
Fig.3 Theory of self-repair strategy of column elimination
单细胞移除自修复策略即当阵列中的某一细胞出现故障时,只对故障细胞进行移除,具体修复原理如图4所示。
图4为胚胎电子细胞阵列的单细胞移除自修复策略原理。在单细胞移除自修复的胚胎电子细胞阵列中,每个胚胎电子细胞都存有所有工作胚胎电子细胞的工作基因,而每一个胚胎电子细胞也有一个自己的地址信息,通过地址信息选择自己表达的功能。单细胞移除自修复的机理本质上是故障细胞地址信息的移动和再表达的过程。在单细胞移除自修复过程中,当阵列中某个细胞发生故障,该细胞及其右侧的所有工作细胞的地址信息都将向右移动1位,故障细胞的地址信息传递至其右侧相邻的胚胎细胞,由其代替故障细胞完成电路功能,从而完成自修复。当胚胎电子细胞阵列某行中空闲细胞消耗完后,若再次故障,此时就执行移除自修复策略,该行及其上方的所有工作细胞行的地址信息,依次向上移动1位,将故障细胞行“透明化”,由其相邻上方行代替其继续工作,如此循环下去,直到阵列中空闲细胞全部用完。
如图4所示,当胚胎电子细胞阵列中的细胞(2,3)出现故障,阵列启动自修复功能,细胞(2,3)右侧无其他工作细胞,所以细胞(2,3)的地址信息向右移动1位,此时其右侧细胞的地址就为(2,3),代替原来的故障细胞表达其功能,保证阵列功能的正常。当新的细胞(2,3)再次故障时,该行已经无空闲细胞进行自修复,此时开始进行行移除自修复,故障细胞所在的第2行全部变为“透明”,充当导线作用,将第1行的细胞输出信息直接传递给第3行的细胞,此时第3行细胞的地址就变为原来第2行细胞的地址,从而代替第2行的细胞完成其功能,此时就完成了故障的修复,如此循环下去,从而保证阵列能够正常工作。
图4 单细胞移除自修复策略原理
Fig.4 Theory of self-repair strategy of single cell elimination
2 胚胎电子细胞阵列的可靠性分析
2.1 胚胎电子细胞阵列工作特点
在胚胎电子细胞阵列中,因为冗余空闲细胞的存在,使其具有了自修复能力。当胚胎电子细胞阵列中出现故障时,其仍然能够继续正常工作,但是此时胚胎电子细胞阵列内的结构已经发生了变化。
在行移除自修复方式中,胚胎电子细胞阵列中每发生一次故障,阵列中冗余的空闲细胞就少一行,可正常工作的胚胎电子细胞就少一行,当可正常工作的胚胎电子细胞行数少于完成阵列电路功能需要的胚胎电子细胞行数时,阵列就完全失效。
在单细胞移除自修复方式中,胚胎电子细胞阵列中每发生一次故障,阵列中冗余的空闲细胞就少一个,可用于正常工作的胚胎电子细胞阵列的胚胎电子细胞就少一个,当阵列中可正常工作的胚胎电子细胞的数目小于完成阵列电路功能所需的胚胎电子细胞数目时,阵列就完全失效。
2.2 多态系统理论
多态系统[28]主要分为多工作(或失效)状态系统和多性能水平系统。其中,多工作(或失效)状态系统是指系统除了“正常工作”和“完全失效”两种状态外,还具有多种工作(或失效)状态。
多态系统中,一些部件失效或者性能衰退会导致系统部分失效或系统性能下降,从而引起整个系统呈现出多种工作(或失效)状态或性能水平。多态系统理论能准确定义部件的多态性,能透彻分析部件性能的变化对系统性能和可靠性的影响,以及系统失效的渐变过程,因此,在复杂系统可靠性分析和优化设计领域有广阔的应用前景。
胚胎电子细胞阵列在工作过程中,因为具有自修复能力,当阵列中发生故障时,阵列仍然能够正常工作,但是内部结构已经发生改变,因为这种结构的改变,也就使阵列的正常工作具有多种不同的状态,也就满足多种状态的工作系统。在行移除自修复的胚胎电子细胞阵列中,通过阵列中可工作胚胎电子细胞的行数来划分胚胎电子细胞阵列的状态;在单细胞移除自修复的胚胎电子细胞阵列中,以阵列中可正常工作的胚胎电子细胞数目来划分不同的状态。
2.3 运算法则
通过通用生成函数(Universal Generating Function, UGF)方法对部件在工作过程中的状态性能概率分布可表示为[29-30]
(1)
式中:vi(x,t)为部件i在t时刻处于状态x的概率;x为部件i的状态;pki(t)为部件在状态为ki时的状态概率;hki为胚胎电子细胞在状态为ki时的状态性能;i=1,2,…,b,b为系统中部件的个数;ki=1,2,…,mi,mi为部件i的状态个数。
系统的通用生成函数可以通过如下运算获得:
U(z,t)=Ω(vi(x,t),vi′(x,t))=
(2)
式中:f(hki,hki′)为系统的状态性能;z为系统的状态。
根据系统的内部功能块连接结构特点,定义如下运算符:
1) 当hks为hki和hki′的最小值时,定义φ1运算符为
(3)
2) 当hks为hki和hki′的和时,定义φ2运算符为
(4)
定义多态系统的最小任务性能需求为w,则系统工作过程的可靠度为
R(t)=P{H(t)≥w}=
(5)
式中:f(hki(t)-w≥0)为示性函数,当hki(t)-w≥0时,f(hki(t)-w)=1,当hki(t)-w<0时,f(hki(t)-w)=0;H(t)={hmi(t),…,hki(t),…,h2(t),h1(t)}。
系统的平均无故障时间(MTTF)为
(6)
2.4 基于多态系统理论的胚胎电子细胞阵列可靠性分析
胚胎电子细胞阵列中根据可正常工作细胞数量的不同,使胚胎电子细胞阵列在工作过程中具有多种工作状态,这完全符合多工作(或失效)状态系统的要求,所以利用多态系统理论对胚胎电子细胞阵列的可靠性进行分析。
2.4.1 行(列)移除自修复方式可靠性分析
对于一个M×N的胚胎电子细胞阵列,工作的胚胎电子细胞阵列为m×n,行移除自修复过程中,当某行阵列中出现细胞故障时,该故障细胞所在行的所有细胞都将被移除,则对于胚胎电子细胞阵列可以划分为多个状态,划分的状态集为:S{0,1,2,…,k,…,M-m+1}。状态0表示阵列中所有不能正常工作的状态,状态1表示阵列中可正常工作的行数刚好为m,依次类推,状态k表示阵列中可正常工作的行数为m+k-1。假设细胞的失效率为λ,则在工作过程中将一行的细胞看作一个整体,则这个整体正常工作的概率为
pr=e-nλt
(7)
(8)
(9)
(10)
(11)
(12)
分解后的状态如表1所示。
表1 行移除自修复策略下分解后的状态
因此,胚胎电子细胞阵列正常工作的可靠度为
Rh(t)=p1+p2+…+pM-m+1=1-p0
(13)
则胚胎电子细胞阵列的MTTF为
(14)
2.4.2 单细胞移除自修复方式可靠性分析
对于一个M×N的胚胎电子细胞阵列,工作的胚胎电子细胞阵列为m×n,单细胞移除自修复中,当胚胎电子细胞阵列中出现细胞故障时,仅有该故障细胞被移除,则该胚胎电子细胞阵列的工作状态可以划分为多个子状态,划分的状态集为:S{0,1,2,…,k,…,M×N-m×n+1}。状态0表示阵列中所有不能正常工作的状态,状态1表示阵列中可正常工作的工作细胞刚好为m×n,依次类推,状态k表示阵列中可正常工作的细胞数为m×n+k-1。假设细胞的失效率为λ,则在工作过程中,每个胚胎电子细胞正常工作的概率为
p=e-λt
(15)
(16)
(17)
(18)
(19)
(20)
分解后的状态如表2所示。
表2 单细胞移除自修复策略下分解后的状态
因此,胚胎电子细胞阵列正常工作的可靠度为
Rs(t)=p1+p2+…+pM×N-m×n+1=1-p0
(21)
则胚胎电子细胞阵列的MTTF为
(22)
文献[16,19]对胚胎电子细胞阵列的可靠性进行了研究,目前对于胚胎电子细胞阵列的可靠性分析主要是基于n/k系统可靠性模型。基于n/k系统可靠性模型的行移除自修复胚胎电子细胞阵列的可靠度R1(t)为
(23)
对应的行移除自修复方式阵列的MTTF1为
(24)
基于n/k系统可靠性模型的单细胞移除自修复胚胎电子细胞阵列的可靠度R2(t)为
(25)
对应的单细胞移除自修复方式阵列的MTTF2为
(26)
为对比分析两种可靠性的分析方法,选择 6×4的胚胎电子细胞阵列,其中工作的胚胎电子细胞阵列为3×4,假设每个细胞的失效率λ=1×10-6/h。在胚胎电子细胞阵列中,以可正常工作胚胎电子细胞的行数进行状态的划分,单细胞移除是以阵列中可正常工作的胚胎细胞数目进行状态划分,两种划分的原理相同,本文重点以行移除自修复为例,对两种可靠性方法进行对比。
图5为行移除自修复方式下两种不同可靠性模型的胚胎电子细胞阵列的可靠度曲线。随着时间的增加,阵列的可靠度不断下降,两种不同的可靠性模型求得的阵列可靠度曲线完全重合,表明本文提出的多态系统可靠性模型可以正确地求解胚胎电子细胞阵列的可靠性。基于n/k系统可靠性模型可以求解阵列在某一时刻可以正常工作的概率,进而得到阵列的可靠性曲线。而本文基于多态系统理论的可靠性模型不仅可以得到胚胎电子细胞阵列在某一时刻可以正常工作的概率,还可以得到此时阵列处于不同状态的概率,判断此时阵列的工作状态。
表3 胚胎电子细胞阵列的状态及对应的概率Table 3 State and corresponding probability of EECA
图5 行移除自修复胚胎电子细胞阵列可靠度曲线
Fig.5 Reliability curves of EECA with self-repair of row elimination
以t=50 000 h为例,此时胚胎电子细胞阵列的可靠度为0.988 1,对应的各个状态分比为:p0=0.011 9,p1=0.065 4,p2=0.221 5,p3=0.400 1,p4=0.301 2,由此时各个状态的概率可以看出,阵列目前以较高的概率处在状态3或状态4,整个阵列的工作状况比较好。本文提出的基于多态系统理论的可靠性模型可以有效地分析胚胎电子细胞阵列的可靠性,同时可以更加清楚地掌握阵列目前工作的状态,能够为电路的维修决策提供数据支持。同理,基于多态系统理论的单细胞移除自修复可靠性模型分析与此相同。
3 胚胎电子细胞阵列的硬件资源消耗分析
对于胚胎电子细胞阵列而言,硬件资源消耗是衡量阵列结构及工作过程的一个重要指标,通过分析胚胎电子细胞阵列实现、故障检测过程的硬件资源消耗,对阵列的总体硬件资源消耗进行评估。
3.1 胚胎电子细胞阵列实现的硬件资源消耗
胚胎电子细胞阵列主要由工作细胞和空闲细胞组成,而经典的胚胎电子细胞中硬件资源消耗的部分主要为配置存储模块,大约占整个细胞硬件资源消耗的95%左右[31]。在进行硬件资源消耗分析时,主要考虑胚胎电子细胞的基因配置消耗(为简化分析,假设每个细胞的配置信息相同)。
3.1.1 行(列)移除自修复的胚胎电子细胞阵列实现的硬件资源消耗
以行移除为例,对于M×N的胚胎电子细胞阵列,工作细胞阵列为m×N(M≥m)。每行细胞中只需存储该列细胞的存储信息,设每个细胞自己的配置信息为β,则每行中的细胞需要存储该细胞所在列所有细胞的配置信息为mβ,整个阵列的配置信息为MNmβ。阵列中地址模块、控制模块及布线等的硬件资源消耗记为S1,则总的硬件资源消耗为
Sh=S1+MNmβ
(27)
对于同一电路而言,阵列的硬件资源消耗主要与阵列的规模M、N相关。
3.1.2 单细胞移除自修复的胚胎电子细胞阵列实现的硬件资源消耗
对于单细胞移除策略,设有M×N的胚胎电子细胞阵列,工作细胞阵列为m×n(M≥m,N≥n),阵列中的每一个细胞均要存储阵列中所有细胞的配置信息。设每个细胞的配置信息为β,则阵列的配置信息为MNmnβ,阵列中地址模块、控制模块及布线等的硬件资源消耗与行(列)移除中的硬件资源消耗近似,也记为S1,则总的硬件资源消耗为
Sc=MNmnβ+S1
(28)
对于同一电路而言,阵列的硬件资源消耗主要与阵列的规模M、N相关。因为配置信息占了硬件资源消耗的绝大部分,所以设计过程中,单细胞移除修复的硬件资源消耗近似为行列移除硬件资源消耗的n倍。
3.2 胚胎电子细胞阵列故障检测的硬件资源消耗
故障检测模块是胚胎电子细胞的重要组成模块,是实现自修复功能的前提。经典的二维胚胎电子细胞阵列的故障检测方式为细胞内自检,检测主要是针对功能模块和配置存储模块,目前关于控制模块、输入输出模块和布线等的故障检测研究很少。胚胎电子细胞内对于功能模块的故障检测主要是通过模块冗余来实现,对于配置存储模块的检测主要通过使用扩展海明码来实现,是一种基于数字编码的方式,所以主要研究功能模块的故障检测的硬件资源消耗。
在二维胚胎电子细胞阵列中,无论是行(列)移除自修复还是单细胞移除自修复,每个细胞内都具有故障检测模块,现有功能模块主要是使用LUT进行实现,对功能模块的故障检测即是LUT的冗余。因此,设每个细胞内的功能模块的硬件资源消耗为α,则功能模块故障检测硬件资源消耗为α,对于m×n的工作细胞阵列,整体阵列的规模为M×N(M≥m,N≥n),则整个阵列的功能模块的硬件资源消耗为MNα,用于功能模块故障检测的硬件资源消耗也为MNα。
由3.1节和3.2节的分析可知,行移除自修复方式的胚胎电子细胞阵列的整体硬件资源消耗可以表示为
(29)
单细胞移除自修复方式的胚胎电子细胞阵列的整体硬件资源消耗可以表示为
(30)
在胚胎电子细胞阵列的研究过程中,目前主要研究的还是其结构设计、故障检测及自修复方式等。目前的研究主要还处于理论研究阶段,现有关于胚胎电子细胞阵列的研究主要基于Xinlinx ISE Design Suit 12.2 仿真软件进行仿真研究,考虑到胚胎电子细胞阵列的结构设计没有统一的标准,再加上设计过程中布局布线相对复杂,所以胚胎电子细胞的硬件资源消耗缺少相应的理论研究。在胚胎电子细胞阵列中,95%以上的硬件资源消耗来自于基因存储,通常用存储基因的数量来衡量胚胎电子细胞阵列的硬件资源消耗。本文在分析胚胎电子细胞阵列基因存储的基础上,分析了胚胎电子细胞阵列故障检测的硬件资源消耗,相对于仅用基因存储硬件资源消耗的基础上更为精确。
4 仿真分析
针对100×100的工作细胞阵列,假设细胞的失效率λ=1×10-6/h,分别分析两种自修复策略下,阵列的可靠性及阵列硬件资源消耗与空闲细胞配置数量、配置方式的关系,并研究了不同自修复策略下,配置方式与配置数量的选择方法。
4.1 行移除自修复策略分析
对于行移除自修复策略而言,由2.4.1节和3.1.1节的分析可知,阵列的可靠性与阵列的列数N没有关系,而阵列的硬件资源消耗与M、N均有关系,所以在空闲细胞配置时,仅仅配置阵列的行,对阵列的列不进行冗余配置。下面对行移除策略可靠性与细胞消耗同阵列行数的关系进行分析。图6为不同阵列行数与阵列可靠性的关系,图7(a)为阵列行数与阵列MTTF之间的关系,图7(b)为阵列行数与阵列空闲细胞数量之间的关系。
行移除自修复策略下仿真结果如表4所示。分析图6、图7和表4数据可知,随着阵列行数的增加,阵列的空闲细胞数量呈线性增加,阵列的可靠性随着阵列行数增加,在150行之前近似呈线性增长,随着行数的增长,增长速度越来越缓。实际应用时,选择阵列的行数为150,可兼顾阵列的可靠性和细胞数量的消耗。
对于行移除自修复策略来说,阵列的可靠性确定后,就对应确定了一个最小的阵列行数,此时的阵列行数对应的阵列空闲细胞最少,硬件资源消耗最小,这个行数就是满足阵列性能要求的最少的行数。在行移除自修复策略中,随着阵列行数的增加,空闲细胞数量线性增长,但可靠性增加越来越缓,并不是行数越多越好。列移除自修复策略的分析和空闲细胞数量配置选择方法与行移除相同。
图6 行移除自修复策略下不同阵列行数配置对应的阵列可靠度曲线
Fig.6 Reliability curves of array with row elimination self-repair strategy under different number of row configuration
图7 行移除自修复策略下不同阵列行数配置阵列的MTTF和空闲细胞数量
Fig.7 MTTF curve and number of cells of array with row elimination self-repair strategy under different number of row configuration
表4 行移除自修复策略下不同配置的仿真结果
4.2 单细胞移除自修复策略分析
由2.4.2节和3.1.2节的分析可知,阵列的可靠性和硬件资源消耗与阵列的行、列均有关系,因此空闲细胞的配置方式和配置数量均对阵列的可靠性和硬件资源消耗有影响。为了研究空闲方式和空闲数量对阵列可靠性和硬件资源消耗的影响,分别研究相同空闲细胞配置数量情况下不同配置方式对可靠性的影响,以及相同空闲细胞配置方式情况下不同配置数量对可靠性和硬件资源消耗的影响。
4.2.1 不同空闲细胞配置方式与可靠性的关系
已知工作细胞阵列为100×100,选择空闲的细胞数量为30 000,研究不同配置方式对阵列可靠性的影响。图8为不同空闲细胞配置方式与阵列可靠性和MTTF的关系。
单细胞移除自修复策略下不同配置方式的仿真结果如表5所示。由图8和表5的数据可知,阵列的配置方式对于阵列的可靠性也有较大的影响。例如,100×400阵列结构的MTTF可以达到1.185 9×106h,400×100阵列方式的MTTF为1.392 6×104h ,二者相差较大。
通过仿真分析发现,对于胚胎电子细胞阵列而言,空闲细胞配置数量相同的情况下,阵列的行列数对可靠性均有影响,可以通过多配置空闲列数来提高阵列的可靠性。
图8 单细胞移除自修复策略下不同空闲细胞配置方式的阵列可靠性曲线和MTTF曲线
Fig.8 Reliability curves and MTTF curve of array with single cell elimination self-repair strategy under different idle cells configuration method
表5 单细胞移除自修复策略下不同空闲细胞配置方式的仿真结果
4.2.2 不同空闲细胞配置数量与可靠性的关系
已知工作细胞阵列为100×100,选择行列同步空闲的方式,研究不同的空闲细胞配置数量对阵列可靠性的影响。图9为不同空闲细胞配置数量与阵列可靠性、MTTF和细胞数目的关系。
图9 单细胞移除自修复策略下不同空闲细胞配置数量的阵列可靠性曲线、MTTF曲线和细胞数目
Fig.9 Reliability curves,MTTF curve and number of cells of array with single cell elimination self-repair strategy under different number of idle cells configuration
单细胞移除自修复策略下不同空闲细胞配置数量的仿真结果如表6所示。分析图9和表6的数据可知,在175行之前,随着阵列行数的增加,阵列的可靠性近似呈线性增长趋势,当行数大于175时,随着行数的增加,阵列的可靠性增加越来越缓慢;但是随着阵列行数的增加,阵列的细胞数量增长速度越来越快。实际应用时,选择阵列的行列数为175,可以兼顾阵列的可靠性和细胞消耗。
对于相同的配置方式而言,随着空闲细胞行列数配置的增加,阵列的可靠性和硬件资源消耗都将增加,阵列的可靠性先近似呈线性增加,而后随着行列数的增加,增长速度越来越慢;而对于阵列的细胞消耗而言,随着阵列行列数的增加,阵列的细胞消耗增长速度越来越快,为了兼顾阵列的可靠性和硬件资源消耗,在保证阵列的可靠性满足设计要求的前提下,选择阵列的硬件资源消耗最少的空闲细胞配置。
4.3 胚胎电子细胞阵列的自修复方式选择
对于m×n的工作细胞阵列,当阵列的规模M×N确定后(M≥m,N≥n),根据电路设计对于可靠性和硬件资源消耗的要求,对阵列的自修复方式进行选择。根据第2节和第3节关于胚胎电子细胞阵列在行(列)移除自修复和单细胞自修复情况下的硬件资源消耗和可靠性分析,在选择阵列自修复方式的过程中,根据阵列的可靠性和硬件资源消耗分析对两种自修复方式进行评估,结合电路的设计要求,选择阵列的故障自修复方式。
以20×20的工作细胞阵列为例,以行列同时增加的方式冗余(即M=N),不同的冗余细胞情况下的硬件资源消耗和可靠性的仿真结果如表7所示。
表7为20×20工作细胞阵列在不同的行列冗余情况下(表中只列到了M=N=30,其他规模计算方法相同),两种不同的自修复方式所对应的硬件资源消耗和可靠性仿真结果。根据表7的仿真结果,可以根据阵列的设计要求,选择阵列的自修复策略。已知阵列的工作细胞规模为20×20,阵列的空闲细胞行列数为3,即M=N=23,要求阵列的MTTF不小于8.000 0×104h,查表7可知,当M=N=23时,行移除自修复的可靠性为9.327 6×103h,单细胞移除的MTFF为9.765 1×104h,所以此时阵列应该选择单细胞自修复方式。如果要求阵列的硬件资源消耗不能大于S1+2.000×104β+1.058×103α,而此时单细胞移除的硬件资源消耗为S1+1.936×105β+9.680×102α,行移除的硬件资源消耗为S1+1.058×104β+1.058×103α,则此时应该选择行移除自修复方式。
对于胚胎电子细胞阵列,应用到实际电路的设计时,需要提前制定阵列的自修复方式。根据m×n的工作阵列和M×N的胚胎电子细胞阵列规模,利用阵列的硬件资源消耗和可靠性计算公式,计算出阵列在不同修复方式下的可靠性和硬件资源消耗结果,然后根据胚胎电路对于硬件资源消耗和可靠性的要求,选择合适的自修复方式。
表6 单细胞移除自修复策略下不同空闲细胞配置数量的仿真结果Table 6 Simulation results of different number of idle cells configuration with self-repair strategy of single cell elimination
表7 不同M、N对应的仿真结果Table 7 Simulation results of different M and N
5 结 论
1) 将多态系统理论引入到胚胎电子细胞阵列中进行阵列的可靠性分析,多态系统理论能够更加透彻地分析复杂系统的可靠性,可用于胚胎电子细胞阵列的可靠性分析,建立了胚胎电子细胞阵列的可靠性模型,能够从根本上分析阵列的可靠性。
2) 分析胚胎电子细胞阵列的组成和故障检测过程的硬件资源消耗,建立了胚胎电子细胞阵列的硬件资源消耗模型。
3) 在胚胎电子细胞阵列的可靠性模型和硬件资源消耗模型的基础上,研究了胚胎电子细胞阵列在行移除和单细胞移除自修复过程中,空闲细胞的配置方式和配置数量对于阵列可靠性和硬件资源消耗的影响,根据不同的自修复方式制定了空闲细胞的配置方法,对实际胚胎电子电路的设计具有指导作用。
在胚胎电子细胞阵列可靠性模型和硬件资源消耗模型的基础上,研究了固定规模的胚胎电子细胞阵列的自修复方式选择方法,对于实际的胚胎电子细胞阵列技术应用具有很好的指导意义。
[1] ZHANG J B, CAI J Y, MENG Y F, et al. Fault self-repair strategy based on evolvable hardware and reparation balance technology[J]. Chinese Journal of Aeronautics, 2014, 27(5): 1211-1222.
[2] 张砦, 王友仁. 基于可靠性优化的芯片自愈型硬件细胞阵列布局方法[J]. 航空学报, 2014, 35(12): 3392-3402.
ZHANG Z, WANG Y R. Method to reliability improving of chip self-healing hardware by array layout reformation[J]. Acta Aeronautica et Astronautica Sinica, 2014,35(12): 3392-3402 (in Chinese).
[3] WANG N T, QIAN Y L, LI Y, et al. Survey on evolvable hardware and embryonic hardware[C]//2013 IEEE 11th International Conference on Electronic Measurement and Instruments. Piscataway, NJ: IEEE Press, 2013: 1021-1026.
[4] ORTEGA C, TYRRELL A M. Biologically inspired reconfigurable hardware for dependable applications[C]//IEE Half-day Colloquium on Hardware Systems for Dependable Applications. London: IET, 1997: 1-4.
[5] MANGE D, SANCHEZ E, STAUFFER A, et al. Embryonics: A new methodology for designing field-programmable gate arrays with self-repair and self-replication properties[J]. IEEE Transactions on Very Large Scale Integration (VLSI) Systems, 1998, 6(3): 387-399.
[6] CANHAM R O, TYRREL A M. Hardware artificial immune system and embryonic array for fault tolerant systems[J]. Genetic Programming and Evolvable Machines, 2003, 4(4): 359-382.
[7] 姚睿, 王友仁, 于盛林. 胚胎型仿生硬件及其关键技术研究[J]. 河南科技大学学报, 2005, 26(3): 33-36.
YAO R, WANG Y R, YU S L. Research on embryonic system and its key technologies[J]. Journal of Henan University of Science and Technology, 2005, 26(3): 33-36 (in Chinese).
[8] 荣昊亮, 俞承芳. 基于胚胎电子细胞阵列可容错系统的FPGA验证[J]. 复旦学报, 2006, 45(1): 127-130.
RONG H L, YU C F. FPGA validation based on embryonic arrays fault-tolerant system[J]. Journal of Fudan University, 2006, 45(1): 127-130 (in Chinese).
[9] TYRRELL A M, SUN H. A honeycomb development architecture for robust fault-tolerant design[C]//1st NASA/ESA Conference on Adaptive Hardware and Systems. Piscataway, NJ: IEEE Press, 2006: 7-13.
[10] XU J Q, DOU Y, LV Q, et al. Etissue: A bio-inspired match-based reconfigurable hardware architecture supporting hierarchical self-healing and self-evolution[C]//2011 NASA/ESA Conference on Adaptive Hardware and Systems (AHS). Piscataway, NJ: IEEE Press, 2011: 311-318.
[11] SAMIE M, DRAGFFY G, POPESCU A. Prokaryotic bio-inspired model for embryonics[C]//Proceedings of the 4th NASA/ESA Conference on Adaptive Hardware and Systems. Piscataway, NJ: IEEE Press, 2009: 163-170.
[12] 王南天. 基于原核仿生阵列的自修复技术研究[D]. 长沙: 国防科学技术大学, 2011.
WANG N T. Research of self-healing technique based on prokaryotic bio-inspired array[D]. Changsha: National University of Defense Technology, 2011 (in Chinese).
[13] 李廷鹏. 基于总线结构的仿生自修复技术研究[D]. 长沙: 国防科学技术大学, 2012.
LI T P. Research on bio-inspired self-repair technology based on bus structure[D]. Changsha: National University of Defense Technology, 2012 (in Chinese).
[14] 朱赛. 仿生电子系统移除-进化自修复方法研究[D]. 石家庄: 军械工程学院, 2015.
ZHU S. Research on elimination-evolution self-repair method of bio-inspired electronic system[D]. Shijiazhuang: Ordnance Engineering College, 2015 (in Chinese).
[15] ZHANG Z, WANG Y R. Method to self-repair reconfiguration strategy selection of embryonic cellular array on reliability analysis[C]//2014 NASA/ESA Conference on Adaptive Hardware and Systems. Piscataway, NJ: IEEE Press, 2014: 225-232.
[16] 张砦, 王友仁. 基于可靠性分析的胚胎硬件容错策略选择方法[J]. 系统工程理论与实践, 2013, 33(1): 236-242.
ZHANG Z, WANG Y R. Guidelines to fault-tolerant strategy selection in embryonics hardware based on reliability analysis[J]. Systems Engineering—Theory & Practice, 2013, 33(1): 236-242 (in Chinese).
[17] WANG N T, QIAN Y L ,LI Y, et al. Design method for a multi-layer bio-inspired self-healing hardware[C]//2014 Prognostics and System Health Management Conference. Piscataway, NJ: IEEE Press, 2014: 653-657.
[18] 王敏, 张砦, 王友仁. 三维可重构阵列互连资源在线分布式容错方法[J]. 计算机应用研究, 2013, 30(8): 2360-2363.
WANG M, ZHANG Z,WANG Y R. Interconnection resources online distributed fault-tolerant method for three dimensional reconfigurable array[J]. Application Research of Computers, 2013, 30(8): 2360-2363 (in Chinese).
[19] 林勇, 罗文坚, 钱海, 等.n×n阵列胚胎电子系统应用中的优化设计问题分析[J]. 中国科学技术大学学报, 2007, 37(2): 171-176.
LIN Y, LUO W J, QIAN H, et al. Analysis of optimization design inn×narray embryonic system applications[J]. Journal of University of Science and Technology of China, 2007, 37(2): 171-176 (in Chinese).
[20] TEMPESTI G, MANGE D, STAUFFER A, et al. The BioWall: An electronic tissue for prototyping bio-inspired systems[C]//Proceedings 2002 NASA/DoD Conference on Evolvable Hardware. Piscataway, NJ: IEEE Press, 2002: 221-230.
[21] STAUFFER A, MANGE D, TEMPESTI G. Self-repair and self-healing electronic watch: The BioWatch[C]//Proceeding of 4th International Conference on Evolvable Systems: From Biology to Hardware, Tokyo, 2001: 112-127.
[22] TYRRELL A M, SANCHEZ E. POEtic tissue: An integrated architecture for bio-inspired hardware[C]//Pro-ceeding of the 5th International Conference on Evolvable Systems: From Biology to Hardware (ICES 2003), Trondheim, 2003: 129-140.
[23] UPEGUI A, THOMA Y, SATIZABAL H F, et al. Ubichip, Ubidule, and MarXbot: A hardware platform for the simulation of complex systems[C]//9th International Conference on Evolvable Systems: From Biology to Hardware. Berlin: Springer, 2010: 286-298.
[24] MANGE D, SANCHEZ E, STAUFFER A. Embryonics: A new methodology for designing field-programmable gate arrays with self-repair and self-replicating properties[J]. IEEE Transactions on Very Large Scale Integration (VLSI) Systems, 1998, 6(3): 387-399.
[25] 王南天, 钱彦岭, 李岳, 等. 胚胎型在线自修复FIR滤波器研究[J]. 仪器仪表学报, 2012, 33(6): 1385-1391.
WANG N T, QIAN Y L, LI Y,et al. Study of embryonic type on-line self-healing FIR filters[J]. Chinese Journal of Scientific Instrument, 2012, 33(6): 1385-1391 (in Chinese).
[26] 周贵峰, 钱彦岭, 王南天, 等. 胚胎型仿生硬件结构FIR滤波器设计与仿真[J]. 电子测量与仪器学报, 2010, 24(增刊): 61-65.
ZHOU G F, QIAN Y L,WANG N T, et al. Design and simulation of FIR filters based on embryonic bio-inspired hardware architecture[J].Journal of Electronic Measurement and Instrument, 2010, 24(Supplement): 61-65 (in Chinese).
[27] XU G L, XIA Z H, WANG H B, et al. Design of embryo-electronic systems capable of self-diagnosing and self-healing and configuration control[J]. Chinese Journal of Aeronautics, 2009, 22(5): 637-643.
[28] 李春洋. 基于多态系统理论的可靠性分析与优化设计方法研究[D]. 长沙: 国防科学技术大学, 2010.
LI C Y. Research on reliability analysis and optimization based on the multi-state system theory[D]. Changsha:National University of Defense Technology, 2010 (in Chinese).
[29] LISNIANSKI A, LEVITIN G. Multi-state system reliability: Assessment, optimization and applications[M]. Singapore: World Scientific, 2003.
[30] LISNIANSKI A, FRENKEL I, DING Y. Multi-state system reliability analysis and optimization for engineers and industrial managers[M]. London: Springer, 2010.
[31] ORTEGA-SANCHEZ C, MANGE D, SMITH S, et al. Embryonics:A bio-inspired cellular architecture with fault-tolerant properties[J]. Genetic Programming and Evolvable Machines, 2000, 1(3): 187-215.
Configurationofidlecellsinembryonicselectroniccellarray
WANGTao,CAIJinyan*,MENGYafeng,LIUXiaopan,PANGang
DepartmentofElectronicandOpticEngineering,OrdnanceEngineeringCollege,Shijiazhuang050003,China
Idlecellsarethepremiseofself-repairinembryonicselectroniccellarray(EECA),moreidlecellsmeanmorechancesforself-repair,andthushigherreliabilityofthesystem.However,moreidlecellsalsobringhugeconsumptionofhardwareresources.Inthefieldofaerospace,inthepursuitofhighreliabilityofelectronicsystems,hardwareresourceconsumptionmustbealsotakenintoconsideration.InordertooptimizetheconfigurationofidlecellsinEECA,thereliabilityandthehardwareresourcesconsumptionofEECAareanalyzedasthestartingpoint,andmulti-statesystemtheoryisintroducedintothereliabilityanalysisofEECAtooptimizethereliabilitycalculationmodel.FortheclassicalEECA,underdifferentself-repairstrategies,therelationshipbetweenthereliabilityandthehardwareresourcesconsumptionofEECAwiththeconfigurationofidlecellsaresimulatedandanalyzed.Basedontheresearchsimulationresults,theconfigurationmethodofidlecellswithdifferentself-repairstrategiesisformulated,whichcangiveconsiderationtobothrequirementsofhigherreliabilityandlowerhardwareresourcesconsumptionofEECA.Themethodforselectingtheself-repairstrategyfortheEECAwithknownscaleisalsostudied.ThesimulationandanalysisresultsshowthattheproposedmethodscanhavegreatinfluenceonapplicationoftheEECA.
embryonicselectroniccellarray(EECA);reliability;hardwareresourceconsumption;self-repairstrategy;idlecell;multi-statesystemtheory
2016-03-28;Revised2016-08-05;Accepted2016-10-08;Publishedonline2016-10-131112
URL:www.cnki.net/kcms/detail/11.1929.V.20161013.1112.008.html
s:NationalNaturalScienceFoundationofChina(61271153,61372039)
2016-03-28;退修日期2016-08-05;录用日期2016-10-08; < class="emphasis_bold">网络出版时间
时间:2016-10-131112
www.cnki.net/kcms/detail/11.1929.V.20161013.1112.008.html
国家自然科学基金 (61271153,61372039)
*
.E-mailcjyrad@163.com
王涛, 蔡金燕, 孟亚峰, 等. 胚胎电子细胞阵列中空闲细胞的配置J. 航空学报,2017,38(4):320266.WANGT,CAIJY,MENGYF,etal.ConfigurationofidlecellsinembryonicselectroniccellarrayJ.ActaAeronauticaetAstronauticaSinica,2017,38(4):320266.
http://hkxb.buaa.edu.cnhkxb@buaa.edu.cn
10.7527/S1000-6893.2016.0267
V243.1; TP302.7
A
1000-6893(2017)04-320266-16
(责任编辑: 苏磊, 孙芳)
*Correspondingauthor.E-mailcjyrad@163.com