滑坡区域铁路选线CBR决策系统的构建
2018-09-18刘思阳
刘思阳
(中铁二院工程集团有限责任公司,四川成都,610031)
引言
CBR是由认知科学衍生而来。1982年,由耶鲁大学Roger shank首次提出了CBR理论的理论框架,之后其学生以此为基础开发出了CTRUS的CBR系统[5][6]。CBR模拟人脑的思维来处理问题,即类比推理。在问题求解的过程中,随着案例的增加系统的知识和经验逐渐增加,即增量式学习。并且解决问题时根据经验可以抓住重点,避免重蹈覆辙[1]。相较于专家系统,CBR还能规避知识获取的困难,因其知识便是存储在案例库中的案例。诸多优势使得CBR具有很大的研究价值和应用潜力。
铁路工程在历史中积累了大量的案例,将这些案例资料结构化地组织起来以供未来使用,既可以提高决策者的决策效率也避免了资源浪费,结合CBR(Case-based reasoning)技术,可以合理地将诸如线路方案比选等工程案例组织起来,通过其4R循环:Retrieve、Reuse、Revise、Retrain的技术路线[4],应用到新的方案决策当中。笔者尝试对铁路滑坡构建CBR决策系统,为未来进行不良地质区域选线、铁路防灾减灾等铁路工程领域的决策提供新的思路。
1 滑坡区域铁路选线
1.1 滑坡对铁路选线的影响
滑坡是铁路遭遇地质灾害的头号劲敌,尤其在我国山区面积占比如此之大的广袤地域。滑坡给铁路线路带来的危害体现在滑坡体掩埋轨道、列车,带来人员伤亡,行车中断以及工程破坏,如铁西滑坡中断行车40天。
铁路选线在进行方案比选时,主要从技术和经济两个方面来考虑,其中技术指标又可分为反映工程条件的和反映运营条件的两类[2]。
为了消除或降低滑坡带来的危害,进行铁路选线时应通过判断滑坡的治理难度和预判滑坡可能造成的破坏程度(即风险性)以及工程的经济和运营评估,来作出线路是绕避还是整治通过的决策。
1.2 滑坡区域铁路选线的决策指标
根据铁路选线原则,从技术、经济、运营和风险四个方面对滑坡区域进行线路方案决策建立指标体系,如图1所示。其中技术评价指标通过判识滑坡的治理难度来量化,风险评价通过判断滑坡对线路的破坏程度作出。
图1 滑坡区域线路方案决策指标体系
2 基于CBR的滑坡区域铁路选线决策系统
2.1 铁路滑坡CBR决策系统框架
滑坡区域铁路选线,主要是依据技术、经济、运营等条件作出的,在治理方案技术难度很高或不经济,以及后期运营的风险较高的情况下,多采取绕避措施。反之,采取治理的短直方案通过。铁路滑坡的决策流程如图2所示。
图2 铁路滑坡的决策流程
对 CBR决策系统各个模块的构建方法进行研究后[8],本文总结出 CBR决策系统的技术路线如图3所示。结合铁路滑坡的决策流程以及CBR决策的技术路线,构建基于CBR的铁路滑坡决策系统的框架如图4所示。
图3 CBR决策系统的技术路线
图4 基于CBR的铁路滑坡决策系统的框架
2.2 案例表达
在专家系统中,知识的表达方式主要有:基于产生式规则、基于框架、基于一阶谓词以及基于语义网络等。在CBR中,知识即存在于案例中,目前主要的案例表达方式有:记忆网络、因果关系图、谓词逻辑、关系型数据库、面向对象表示、框架表示以及全文本表示等[1]。
将决策指标数字化后,基于关系型数据库强大的数据操控能力及接口兼容性,本文采用关系型数据库来表达案例,案例的特征以数值或符号属性来量化。在Access中创建的关系表及其关系见图5所示。
图5 铁路滑坡案例关系表及其关系
2.3 案例检索
案例检索是系统解决问题的第一步,即在案例库中搜寻到与目标案例相似的源案例。案例的匹配主要是通过计算案例之间的相似度来完成。CBR中主要使用基于距离度量的相似度计算方法,包括基本的方法和扩展的方法。其中基本方法主要有:欧氏距离法和海明威法。而扩展的方法有基于属性关联性的算法、基于事例可修改性的度量法等,它们用于更为具体的环境[1]。其中以基于距离的相似度计算法最为常用。
表1 相似性计算模型
根据属性值的数据类型,分别有不同的模型予以计算。对于几何模型,假定有和两个案例,特征分量在取值,在取值。其计算方法见表1所示。
2.4 案例重用
在实际的问题求解中,并非每次的案例匹配都能找到相似度较高的源案例,往往只是找到几个相似度较高(高于设定的阈值)的案例。此时不能直接照搬源案例的解,而是需要采取某种手段将源案例的解修正到符合目标案例情况的解,然后输出。
人工神经网络(ANN)是一种模拟生物神经元的数学模型,它的知识存在于神经元的权重中,当环境(即输入样本)发生变化,给出的反馈(即输出)也将发生变化。ANN的使用前提是大量的训练样本,而CBR系统中积累的大量案例恰好满足这个前提。目前常用的神经网络模型有BP神经网络、径向基(SVM)网络、Hopffied网络、Elman网络等,前两个属于前向网络,后两者属于反馈网络[3]。出于对非线性逼近能力和网络训练效率的考虑,本文采用SVM的变种——广义回归网络来进行问题求解。在MATLAB神经网络工具箱中,有可直接使用的广义回归网络函数。
本文依循如下思路进行决策目标求解:检索相似案例,以相似案例为样本训练神经网络,验证神经网络的正确率,正确率满足要求的情况下进行目标案例求解。
3 案例分析
目标案例为银西铁路线路设计时在驿马滑坡中的方案选择问题,滑坡位于甘肃陇东庆阳,
表2 目标案例特征要素
驿马滑坡位于甘肃省庆阳市驿马镇东侧,滑坡发育于驿马沟左岸与支沟相交处,滑坡的特征如表2所示[7]。拟选线路方案从滑坡后缘通过,决策目标是通过技术、经济、运营、风险四个指标,给出绕避或是治理通过的优选方案。
目标案例的特征数值化并离散化为符号数值见表3。其中分别指:岩石硬度、岩体结构、风化程度、岩体组合、岩层构造、岩体厚度、坡体坡度、坡体高差、坡体坡形、年降雨量、地震烈度、人类活动、植被覆盖率。分别指工程破坏程度和滑坡治理难度。
表3 目标案例属性量化值
3.1 相似案例匹配
图6 案例筛选结果
由于目标案例的决策时间是2016年3月,因此首先在案例数据库中提取出16年3月以前的案例,见图6所示,将提取出的案例进行数据处理见图7所示。
运用2.3中所述的符号属性相似度计算方法,计算出目标案例与各源案例的相似度见表4所示。以0.6为阈值,选出相似度较高的案例,有:案例1、案例21、案例35、案例36。
图7 数据处理
表4 相似度计算结果
3.2 案例重用及决策
3.2.1 计算决策指标
根据3.2中选出相似案例与目标案例的相似度,计算出用于预测目标案例决策指标的权重见表5。然后由4个相似案例相应的决策属性值结合权重计算出目标案例的决策指标见表6所示。
表5 决策权重
表6 目标案例决策指标值
3.2.2 最终方案决策
表7 设计阶段的案例决策表
从案例数据库中选择处于设计阶段的铁路滑坡选线案例,并进行数据处理见表7所示。其中代表四个条件指标滑坡治理难度,工程破坏程度,工程经济评价,工程运营评价,即分别指代方案的技术指标、风险指标、经济指标以及运营指标。是指最终决策,0为绕避,1为治理通过。
通过选出的17条设计阶段的选线案例,以前12个为训练案例集使用广义回归网络进行训练,后 5个为测试集,测试网络的正确率。网络训练用时0.023130s,网络测试正确率为100%,得到的决策结果是0,即绕避,与实际的方案比选结果一致。
4 结束语
本文尝试将CBR技术运用到滑坡区域铁路选线,在铁路滑坡CBR决策系统的构建中,对案例表达、案例检索、案例重用进行了相应的研究,其中利用关系型数据库进行案例表达,具有较强的可操作性,利用人工神经网络进行案例重用,并结合实际案例检验,是可行的。
未来还需进一步对应用到铁路工程的CBR决策系统进行研究,在案例重用模块和案例维护模块可进行规则库的构建,以达到更有深度的决策要求。以及将案例数据库扩展到整个铁路灾害领域,以求提高系统应用的广度。
[1]李锋刚.基于案例推理的智能决策技术[M].合肥: 安徽大学出版社,2010.
[2]易思蓉.铁路选线设计[M].成都: 西南交通大学出版社, 2009.
[3]陈明等.MATLAB神经网络原理与实例精解[M].北京: 清华大学出版社, 2013.
[4]郭艳红, 邓贵仕.基于事例的推理(CBR)研究综述[J].计算机工程与应用, 2004, 40(21): 1-5.
[5]Kolodner JL.Improving human decision making through case-based reasoning techniques[J].AI Magazine, 1991, 12(3): 52-59.
[6]TR Hinrichs, JL Kolodner.The roles of adaptation in case-based design[C].In:Proceedings of Case-based Reasoning Workshoop, Washington, 1991:121-132.
[7]周福军.银西铁路驿马黄土滑坡工程特性与变形研[J].铁道标准设计,2016, 60(8): 30-35.
[8]刘思阳.铁路滑坡 CBR决策系统的构建研究[D].成都: 西南交通大学,2017.