基于生物进化的可恢复回声状态网络模型
2016-12-19王怡鸥丁刚毅刘天元蒙军沈晨
王怡鸥, 丁刚毅, 刘天元, 蒙军, 沈晨
(北京理工大学 软件学院 数字表演与仿真技术实验室,北京 100081)
基于生物进化的可恢复回声状态网络模型
王怡鸥, 丁刚毅, 刘天元, 蒙军, 沈晨
(北京理工大学 软件学院 数字表演与仿真技术实验室,北京 100081)
为解决回声状态网络储备池在遭受随机故障和蓄意攻击等复杂情况下的适应性问题,提出了一种具有生物进化特征的可恢复回声状态网络—3DP-RESN. 基于优先匹配的复制、新增加连接的变异和新增加连接的死亡进化策略,3DP-RESN能够实现从被破坏的网络拓扑中自恢复. 将3DP-RESN、传统ESN(CESN)和被破坏的ESN(DESN)应用于NARMA系统、Henon映射和figure8这3种非线性时间序列逼近任务. 实验结果表明,当储备池发生故障时,3DP-RESN对于3种时间序列的预测精度明显优于DESN,接近甚至高于未遭受储备池故障的CESN,尤其在figure8实验中,3DP-RESN 与CESN、DESN相比,预测精度分别提高了30.56%和7.01%. 此外,3DP-RESN的短期记忆能力也接近于CESN,因此,3DP-RESN具有强大的自适应恢复能力.
回声状态网络;生物进化;可恢复能力;时间序列预测
递归神经网络(recurrent neural networks, RNN)是一种有效的非线性逼近方法,但是RNN训练方式过于复杂,通常会出现慢收敛、过拟合和局部最优解等问题. 针对RNN中存在的问题,Jaeger提出了一种改进的递归神经网络结构—回声状态网络(echo state networks, ESN)[1],其核心是一个由大量随机稀疏连接神经元组成的储备池. 对比BP神经网络等[2-3]传统神经网络,ESN的储备池规模相对较大,通常拥有几十、几百甚至上千个神经元,因此ESN具备强大的非线性映射能力. 目前,ESN被广泛应用于许多领域,如情感识别[4]、煤气预测[5]、风力预测[6]、光谱预测[7]、污水处理的跟踪控制[8]等. 虽然已有大量文献提出了关于经典ESN的改进算法[9-12],但是,在这些ESN的改进算法中,多数研究者将注意力放在了储备池拓扑结构设计、神经元类型的选择和线性回归效果的改善上,到目前为止,很少有关于储备池恢复机制研究的相关报告和文献出现. 实际上,储备池和因特网、交通网络、生物网络等复杂网络拓扑结构一样,需要具备很强拓扑鲁棒性,其网络拓扑结构的可恢复性严重影响着网络性能. 当遭遇攻击或运行出错的时候,储备池性能将严重恶化,甚至可能导致整个ESN运行的中断[13-14],ESN健壮性问题限制了其在实际工程中的应用.
从自然选择的角度来看,再生、变异和死亡可以体现生物进化的内在机制[15-19],本文将该生物进化机制引入ESN储备池恢复过程中,从而使得当储备池遭受恶意攻击或随机故障时,储备池能够自适应地恢复至原来的非线性逼近能力.
1 可恢复回声状态网络模型
不同于Jaeger等[1]提出的随机ESN及其改进模型,本文提出了一种可恢复的回声状态网络模型(restorable echo state network, RESN). RESN的结构由3层组成:一个输入层,一个可再生的进化状态储备池和一个输出层. 当遭受随机故障和恶意攻击时,RESN有重建储备池规模的能力. 在储备池规模恢复状态中,RESN储备池具有优先复制(preferential duplication)、变异(divergence)和死亡(death)的联合自然进化特征,因此称其为“3DP-RESN”.
许多研究表明,包括基因调控网络在内的很多生物网络都可以通过复杂网络建模实现. 本文应用生物进化理论,重构随机连接储备池的网络拓扑结构,图1给出了基于3DP生物进化机制的RESN模型(3DP-RESN).
1.1 神经元复制
当回声状态网络储备池拓扑结构受到随机故障或者外部攻击时,被破坏的神经元将从整个储备池拓扑结构中移除,包括该神经元所拥有的连接(见图1 (b)),此时,回声状态网络无法正常工作. 3DP-RESN去除被破坏的神经元,并在剩余神经元中随机选择一个神经元i进行复制,得到的新神经元将连接到与原来神经元i相连的所有神经元上(见图1(c)).
该复制操作反复执行,直到被破坏的储备池恢复到原来的规模. 采用优先复制策略,即度大的神经元被优先选择复制,其复制概率p1表示为
(1)
式中ki表示神经元i的度的大小.
1.2 变 异
从生物进化的角度来看,变异意味着遗传物质的改变,这在生物网络中是一种非常关键的进化机制,可以有效地抑制负关联性. 为了实现方便,在变异过程中,只考虑复制过程中新增加连接的变异(见图1(d)),即新增神经元连接权值的改变,如式(2)所示为
(2)
式中:p2表示神经元之间连接变异概率;p3表示变异因子,变异因子决定了连接权值变化方向;r1、r2是随机数,且r1∈(0,1),r2∈(0,1). 可以看出,当p2 1.3 死 亡 为了确保储备池的稀疏性,需要执行生物进化理论中的死亡机制,也就是将新增加的一部分连接权值以死亡概率p4设置为0(见图1(e)),表示为 (3) 式中,r3是随机数且r3∈(0,1). 可以看出,当p4 RESN的具体训练过程如下. ① 构建一个回声状态网络,Win、W、Wback通过随机方式产生,谱半径满足λmax∈(0,1)以保证回声状态性能,同时选择S型函数作为神经元激励函数; ② 随机攻击部分储备池内部神经元,则被破坏的神经元将从整个储备池拓扑结构退出,同时自适应解除被破坏神经元与其他神经元的连接; ③ 在剩余储备池拓扑结构中,以概率p1选择一个神经元进行复制,复制后的新节点将与原来节点的全部邻居相连,重复复制操作直到储备池恢复到原来未被破坏时的规模; ④ 以概率p2改变新增加连接的权值; ⑤ 以概率p4删除新增加的连接. 至此得到了对储备池进行恢复之后的3DP-RESN的网络模型. 下面验证3DP-RESN的恢复能力,即检验其能否从被破坏状态恢复至未被破坏时的预测精度. 实验使用Matlab语言,通过执行176次独立的实验仿真,将不同迭代次数的3DP-RESN、传统回声状态网络(classical echo state network, CESN)和遭受破坏的回声状态网络(destroyed echo state network, DESN)应用于3种典型非线性时间序列——NARMA系统、Henon混沌映射和figure8识别任务),并比较预测结果. 实验参数配置如表1所示. 表1 实验参数配置 采用标准均方根误差(normalized root mean square error, NRMSE)度量3DP-RESN模型的预测精度,即 (4) 2.1 NARMA系统 NARMA系统(即非线性自回归滑动平均)是一种离散时间系统,其当前输出依赖于历史输入/输出值. 图2给出了储备池规模为100时,3DP-RESN、CESN、DESN对于10步NARMA系统的预测性能,其预测精度依赖于复制概率p1,变异概率p2∈[0,0.3]和死亡概率p4∈[0.4,0.6],且p2和p4的变化步长均为0.02. 从图2可以看出,存在很多3DP-RESN的NRMSE值位于CESN的NRMSE值以下,这说明3DP-RESN的预测精度优于CESN,3DP-RESN实现了从被破坏回声状态网络DESN的自适应恢复. 表2给出了不同评估模型的预测精度对于输入尺度的敏感程度,其中参数设置为:N=100,p2=0.20,p4=0.55. 从表2可以看出,对于不同的输入尺度,提出的3DP-RESN的预测精度同样优于CESN,也就是说3DP-RESN在一定程度上防止了由于故障和攻击造成的CESN预测性能退化. 表2 不同模型不同输入尺度对于NARMA系统预测精度的比较 Tab.2 Comparison of prediction accuracy of different models with different input scales on NARMA system 输入尺度CESNDESN3DP-RESN0.10.12700.22490.12070.20.12650.22390.11160.30.13130.22710.13000.40.14300.23090.14610.50.15790.23450.14250.60.17320.23840.15090.70.19660.24690.18350.80.21930.26250.16540.90.23250.29650.20181.00.24210.35740.2103 2.2 Henon映射 Henon映射混沌过程是一种离散动态系统,且具有奇异吸引子的二维映射. 同样,根据(p2,p4)的迭代变化,图3给出了当储备池规模为100时,3DP-RESN、CESN、DESN对于Henon混沌映射的预测精度. 对于Henon映射,图3中大多数3DP-RESN的σNRMSE在CESN误差曲线附近波动,说明当CESN遭受故障时,3DP-RESN可以恢复其非线性逼近能力. 表3给出了不同模型对于Henon映射在不同噪声标准差ν环境的预测精度,3DP-ESN的进化参数被设置为p2=0.2,p4=0.4. 由表3可以发现,对于具有不同噪声标准差ν的Henon映射,3DP-ESN都具备强大的恢复能力. 表3 在不同的噪声v条件下不同模型对于Henon映射预测精度的比较 Tab.3 Comparison of prediction accuracy of different models for different noisesvon Henon map νCESNDESN3DP-RESN00.00130.00470.00020.0010.00280.00550.00260.0020.00490.00670.00490.0030.00710.00910.00680.0040.00910.01140.00890.0050.01150.01280.01070.0060.01340.01560.01330.0070.01560.01740.01500.0080.01790.02060.0183 2.3 Figure 8识别 在Figure8识别任务中,进一步评估CESN、DESN和3DP-RESN对于学习复杂序列模式的有效性. 图4给出了不同模型产生的Figure8轨迹图. 当遭受故障和攻击时,回声状态网络对Figure8的识别能力大大下降(见图4(b)). 而通过基于生物进化的储备池恢复机制,3DP-RESN可以对Figure8图形进行恢复,得到图4(c). 图4(c)相似于回声状态网络未遭受故障和攻击时CESN产生的Figure8图形(见图4(a)). CESN、DESN和3DP-RESN的NRMSE分别为:0.427 2,0.662 7和0.357 1. 很明显,3DP-RESN不仅实现了从被破坏ESN的性能恢复,且提高了7%的逼近精度. 结合图5可以看出只要3DP-RESN的进化参数设置合理,3DP-RESN就可以实现从DESN的性能恢复. 2.4 3DP-RESN记忆能力评估 Jeager教授[1]定量分析了经典回声状态网络的短期记忆能力(memory capacity, MC). 他认为短期记忆能力指的是ESN能够恢复网络输入的能力. 这里,假设回声状态网络由一个独立同分布的输入流驱动. 对于一个给定的延迟k来说,当输入流…u(t-1)u(t)注入到ESN储备池时,ESN的k-延迟记忆能力表示为 (5) 式中Cov和Var分别表示协方差和方差. 那么,ESN的短期记忆能力MC表示为 (6) 图6给出3个模型的遗忘曲线及其相应MC值,其中L为平方相关系数,即式(5)中的MCk. 提出的3DP-RESN被训练能够记忆k(k=1,2,…,40)个输入延迟单元. 实验参数配置:1个输入单元,100个线性储备池内部单元和100输出单元(每个k对应一个输出单元),3DP-RESN进化参数p2=0.4,p4=0.56. 这里,输入信号服从[0,0.5]的均匀分布. 从图6可知,当ESN发生故障或遇到攻击时,记忆能力急剧下降(见图6(b)),MCDESN=27.4. 3DP-RESN可以恢复被破坏ESN的记忆能力,MC3DP-RESN=33.6,该值与未遭受破坏的CESN的短期记忆能力MCCESN=32.6非常相近. 提出了一种基于生物进化理论的储备池恢复机制:3DP-RESN. 利用增量增长原则,建立新型状态储备池,该储备池具有以下几种自然进化特征:基于优先匹配的复制;新增加连接的变异;新增加连接的死亡. 本文将3DP-RESN应用于NARMA系统、Henon映射和Figure8识别3种非线性时间序列,实验表明,提出的3DP-RESN能够精确逼近复杂的非线性动态系统,即可以从被破坏的经典ESN中恢复甚至超越其原有预测精度. 同时从短期记忆能力的角度对3DP-RESN进行评估,同样验证了其良好的恢复性能. [1] Jaeger H. The echo state approach to analyzing and training neural networks[C]∥German Nat. Res. Inst. Inform. Technol. Sankt Augustin, Germany: [s.n.], 2002:148. [2] 殷高方,张玉钧,胡丽,等.BP神经网络水华预测模型的敏感性分析[J].北京理工大学学报,2012,32(12):1288-1293. Yin Gaofang, Zhang Yuyun, Hu Li, et al. Sensitivity analysis of BP neural network for algal bloom prediction mode[J]. Transactions of Beijing Institute of Technology, 2012,32(12):1288-1293. (in Chinese) [3] 金福生,牛振东,吴璠,等.基于BP神经网络的信誉欺骗检测模型[J].北京理工大学学报,2012,32(1):62-66,94. Jin Fusheng, Niu Zhendong, Wu Fan, et al. A cheating detection model for reputation system based on BP neural network[J]. Transactions of Beijing Institute of Technology, 2012,32(1):62-66,94. (in Chinese) [4] Trentin E, Scherer S, Schwenker F. Emotion recognition from speech signals via a probabilistic echo-state network[J]. Pattern Recognition Letters, 2015,66:4-12. [5] Zhang L M, Hua C C, Tang Y G, et al. Ill-posed echo state network based on L-curve method for prediction of blast furnace gas flow[J]. Neural Processing Letters,2016,43(1):97-113. [6] Xu X M, Niu D X, Fu M, et al. A multi time scale wind power forecasting model of a chaotic echo state network based on a hybrid algorithm of particle swarm optimization and tabu search[J]. Energies,2015,8(11):12388-12408. [7] Yang L, Liang X D, Ma T, et al. Spectrum prediction based on echo state network and its improved form[C]∥2013 5th International Conference on Intelligent Human-Machine Systems and Cybernetics. Hangzhou, China: IEEE,2013:172-176. [8] Bo Y C, Qiao J F. Heuristic dynamic programming using echo state network for multivariable tracking control of wastewater treatment process[J]. Asian Journal of Control,2015,17(5):1654-1666. [9]Wang H S, Yan X F. Optimizing the echo state network with a binary particle swarm optimization algorithm[J]. Knowledge-Based Systems, 2015,86:182-193. [10] Sun X, Cui H, Liu R, et al. Modeling deterministic echo state network with loop reservoir[J]. Journal of Zhejiang University Science C, 2012,13(9):689-701. [11] Rodan A, Tino P. Minimum complexity echo state network[J]. IEEE Transactions on Neural Networks, 2011,22(1):131-144. [12] Cui H Y, Feng C, Chai Y, et al. Effect of hybrid circle reservoir injected with wavelet-neurons on performance of echo state network[J]. Neural Networks, 2014,57:141-151. [13] Jalili M. Error and attack tolerance of small-worldness in complex networks[J]. Journal of Informetrics,2011,5(3):422-430. [14] Ghedini C G, Ribeiro C H. Rethinking failure and attack tolerance assessment in complex networks[J]. Physica A: Statistical Mechanics and Its Applications,2011,390(23):4684-4691. [15] Wittkopp P J, Kalay G. Cis-regulatory elements: molecular mechanisms and evolutionary processes underlying divergence[J]. Nature Reviews Genetics,2012,13(1):59-69. [16] Xu G, Guo C, Shan H, et al. Divergence of duplicate genes in exon-intron structure[J]. Proceedings of the National Academy of Sciences,2012,109(4):1187-1192. [17] Peter I S, Davidson E H. Evolution of gene regulatory networks controlling body plan development[J]. Cell,2011,144(6):970-985. [18] Gagnon A I, Blanchet F C M, Rochette S, et al. Transcriptional divergence plays a role in the rewiring of protein interaction networks after gene duplication[J]. Journal of Proteomics, 2013,81:112-125. [19] Zomorrodi A R, Suthers P F, Ranganathan S, et al. Mathematical optimization applications in metabolic networks[J]. Metabolic Engineering, 2012,14(6):672-686. (责任编辑:刘芳) Restorable Echo State Network Based on Biological Evolution WANG Yi-ou, DING Gang-yi, LIU Tian-yuan, MENG Jun, SHEN Chen (Digital Performance and Simulation Technology Lab., School of Software,Beijing Institute of Technology, Beijing 100081, China) To solve adaptability problems of the reservoirs of echo state network in complicated conditions, such as suffering from random faults and deliberate attacks, a restorable echo state network with biological evolution characteristics—3DP-RESN was proposed. The 3DP-RESN was designed to be able to recover automatically from destroyed network topology based on the evolution strategies of preferentially matched duplication, newly added connection-oriented divergence and newly added connection-oriented death. In experiments, 3DP-RESN, classic ESN (CESN) and destroyed ESN (DESN) are applied to approximating three kinds of nonlinear time series, i.e., the NARMA system, Henon map and figure8. Experimental results show that, when reservoirs suffer from failure, for three kinds of time series, the prediction accuracy of 3DP-RESN significantly outperforms DESN, and is close to or even higher than that of CESN which has not suffered from failure. Especially in the experiment of figure8, compared with CESN and DESN, the prediction accuracy of 3DP-RESN is improved by 30.56% and 7.01% respectively. Besides, the short-term memory capacity of the 3DP-RESN is also close to that of CESN. Hence, 3DP-RESN can possess strongly adaptive self-recovery capacity. echo state network; biological evolution; restorable capacity; time series prediction 2015-12-22 国家自然科学基金资助项目(61202243);国家教育部博士点基金资助项目(20121101110037) 王怡鸥(1990—),女,博士生,E-mail:wangyiou90@163.com. TP 301.6 A 1001-0645(2016)11-1141-06 10.15918/j.tbit1001-0645.2016.11.0092 实验仿真与性能评估
3 结 论