欧盟CLERECO项目跨层技术的可靠性评价
2017-12-02
欧盟CLERECO项目跨层技术的可靠性评价
为了降低成本、优化设计并缩短产品的开发周期,使产品提前上市,需要开发一种新的方法以在早期设计阶段对一些系统的可靠性进行评估。而欧盟的CLERECO-(连续计算跨层技术的早期可靠性评估)项目通过在不同的计算科学、计算系统层和细分计算这3个方面施行跨层方案可以解决系统的早期可靠性评估问题。
跨层系统可靠性分析的实现需要深入了解系统的故障产生层、系统故障如何演变为错误,以及错误如何在层与层之间传播,并影响系统的最终任务。一个系统可以被看做一个堆栈,主要包括3个层次:技术层、硬件层和软件层。图1说明了故障是如何在系统中产生和传播的。
系统的可靠性分析需要识别合适的高级统计模型,以使该模型能够表示系统及其脆弱性因素并能够进行统计推理。CLERECO项目选择贝叶斯网络作为建立早期系统可靠性分析的基本模型。简化的贝叶斯系统模型示例见图2,该示例可表明基本的建模概念,并说明如何实现系统可靠性的统计推理。
功能模块对系统硬件脆弱性因素影响较大,需开发能够表征功能模块特性的工具。在CLERECO项目所提出的系统可靠性模型框架中,CLERECO项目开发了微架构模拟器工具。利用微架构模拟器,通过故障注入架构将故障模型注入系统中以评估硬件对系统可靠性的贡献。
软件堆栈在屏蔽错误中起重要作用,从而提高系统的可靠性。在CLERECO项目中,利用依靠软件虚拟化的概念将指令集架构(ISR)与硬件分离,通过将软件故障模型注入到基于低级虚拟机(LLVM)的故障注入器中评估软件对系统可靠性的贡献。
CLERECO项目的基本目标是深入研究一种面向未来的连续计算系统方法,以在早期系统设计阶段对其可靠性进行评估。CLERECO项目的解决方案不能取代传统设计结束时采用的可靠性验证技术,只能在方案设计早期,帮助工程师优化系统设计并原始错误 时间脆弱性因子细胞脆弱性因子
μ架构脆弱性因子架构脆弱性因子软件脆弱性因子提高产品成功的可能性。
图1 故障的跨层传播
图2 贝叶斯系统模型
刊名:Microprocessors and Microsystems(英)刊期:2015年第8期
作者:A.Vallero et al
编译:徐涛