APP下载

粗糙集理论在钢轨表面缺陷分类中的应用

2018-11-07王胜春袁伟民杜馨瑜

铁道建筑 2018年9期
关键词:粗糙集钢轨特征提取

王胜春,戴 鹏,袁伟民,杜馨瑜,王 昊

(1.中国铁道科学研究院集团有限公司 基础设施检测研究所,北京 100081;2.北京航天飞腾装备技术有限责任公司,北京 100094)

铁路是一种有效的陆地运输方式,轨道作为车轮滚动的主要支持部件,由于列车制动、过载、钢轨金属疲劳以及恶劣行车环境的影响,各种钢轨表面缺陷频发,严重时甚至会导致列车脱轨。根据美国联邦铁路管理局对客货共线铁路事故数据库的统计,从2007年到2016年的数据表明,近1/2的铁路事故是由钢轨和扣件缺陷引起的,如图1所示。

图1 铁路事故原因统计

因此,及时发现轨道缺陷是确保铁路运输安全的关键。随着现代铁路技术的飞速发展,传统的人工检测方法由于误差大、效率低、劳动密集型、高管理成本等缺点,已经不能满足“更准、更快、更智能”的检测要求。在这样的背景下,钢轨缺陷智能识别技术的研究显得尤为迫切。

钢轨表面由于直接和车轮接触摩擦,很容易导致表面伤损。近几年来,基于机器视觉的检测系统已经被广泛应用于钢轨表面缺陷的识别,如图2所示。通过1对安装在列车底部的成像设备来获取轨道图像,然后利用图像处理和模式识别方法实现钢轨缺陷的检测。大多缺陷检测的研究工作,检测结果仅为“正常”或“异常”,并不关注缺陷的细分类[1-3]。钢轨表面缺陷包括表面剥离、轧伤、擦伤等缺陷,此外,泥浆、水渍和油斑造成的污迹以及钢轨表面打磨造成的颗粒状噪声、钢轨间的轨缝等信息,不可避免地也会对检测结果造成干扰和误判。因此,对识别到的缺陷进一步细分类是十分必要的,有利于去除干扰信息,降低系统误报率。

图2 基于机器视觉的钢轨表面缺陷检测和分类

粗糙集理论是一种处理模糊和不确定问题的数学分析方法。它可以基于已知的数据,不依赖任何先验知识,通过计算数据之间的依赖程度来发现隐含的知识,提取内在的分类规则。粗糙集理论提供了一种新的分类方法,并已成功应用于各个分类任务[4-6]。参见图2,基于粗糙集理论可以从不同类别的缺陷样本数据中提取分类规则,并将其应用于钢轨缺陷分类任务中。

1 快速特征提取

文献[8]提出了一种钢轨表面分析系统(Rail Surface Analyze System,RSAS),实现了钢轨表面缺陷的实时检测。利用RSAS对数百万的钢轨图像(图像尺寸为 1 160×60 pixels)进行分析发现,检测结果除了真实的缺陷,还存在大量的误报。可以将这种发生在钢轨表面的缺陷总结为3种类型,即表面剥离、轧伤和擦伤,同时将引起误报的干扰概括为污迹、噪声和轨缝,如图3所示。钢轨表面剥离的图像灰度较暗,且相对平滑;轧伤一般面积较大,呈圆形且图像灰度较亮一些;擦伤颜色较暗且表面不平滑。对于干扰而言,污迹表面平滑且灰度接近钢轨表面的灰度均值;噪声干扰灰度值变化较大,呈带状分布;轨缝灰度值很低且呈细长的条形状。

图3 缺陷类型和干扰类型

根据上述对表面缺陷的特征分析可知,通过构造几何形状特征和灰度统计特征对各类缺陷进行分类是可行的。基于RSAS提供的检测结果,构造快速的钢轨表面缺陷特征提取方法,主要分为2个部分:基于缺陷几何形状的特征提取以及基于缺陷灰度统计分布的特征提取。

1.1 基于几何形状的特征提取

基于几何形状的特征提取计算简单,具有较强的识别缺陷的能力。根据上述对缺陷特征的讨论,可以选择缺陷区域的高度、宽度、高宽比和面积作为分类的几何形状特征。

1)高度HUD。轨缝和轧伤区域具有较高的高度,而其他缺陷类型与之没有直接的关系。

2)宽度WUD。一般而言,擦伤的宽度范围最大,轧伤次之,而轨缝的宽度则非常细小。

3)高宽比RUD。轨缝的高宽比较大,而轧伤的高宽比则近似为1。

4)面积PUD。轧伤具有较大的面积,而轨缝的面积相对较小。

1.2 基于灰度统计分布的特征提取

图4为钢轨表面缺陷的灰度值分布,其中矩形框为钢轨缺陷检测结果。由图可知,不同缺陷类型的灰度分布具有显著的差异,因此基于灰度的统计分布特性提取图像的特征,并将其用于缺陷的分类是切实可行的[7]。

图4 钢轨表面缺陷的灰度值分布

1)缺陷区域的灰度平均值μUD。轨缝与污迹的灰度均值较小,剥离掉块和噪声的灰度均值较大,而轧伤与擦伤的灰度均值大多位于二者之间。

2)缺陷区域的灰度标准差σUD。σUD反映了缺陷的平滑程度,擦伤和轨缝较大,轧伤和剥离掉块次之,污迹相对较小。

3)缺陷区域的灰度均值和整幅钢轨图像灰度均值之差ΔμUD。ΔμUD表示缺陷区域与整幅钢轨图像的色差,可以有效克服环境光照不均、相机过曝光以及欠曝光造成的影响。

4)缺陷区域的灰度标准差与均值之比σCUD,σCUD=σUD/μUD。对于某些灰度标准差或均值发生交叉混叠的缺陷,如擦伤和轧伤,仅靠标准差或均值难以将其区分,而二者的比值σCUD则线性可分。

2 基于粗糙集理论的分类模型

粗糙集理论由波兰科学家PAWLAK于1982年提出,作为一种数学理论和数据分析技术,用于解决不确定的模糊分类和预测问题[8-10]。利用粗糙集理论实现分类的主要思想是使用训练决策系统从数据中抽取有效的分类规则,之后建立测试决策系统来验证规则的有效性。

在使用粗糙集分析之前首先建立缺陷分类的决策系统KRS,记作

KRS=(U,R,V,f)

(1)

其中U表示由RSAS系统检测到的钢轨表面缺陷的集合,记作

U={x1,x2,…,xm}

(2)

式中:m为钢轨表面缺陷的总个数;x1,x2,…,xm为钢轨表面缺陷。

R表示检测对象的特征属性集,R=C∪D。其中C表示条件属性集,由上一节中定义的几何形状和灰度统计特征rj(j=1,2,…,n)构成,记作C={r1,r2,……,rn};D为决策属性集,由缺陷的不同类型c构成,记作D={c}。

V表示条件和决策属性的值域,记作

rj∈Vrj,c∈Vc(1≤j≤n)

(3)

f:U×R→V称作信息映射函数,为每一个分类对象分配相应的属性值,记作

f(xi,rj)=fi,j,f(xi,c)=yi(1≤i≤m,1≤j≤n)

(4)

根据映射函数f,为缺陷对象分配条件属性和决策属性,建立决策分类的决策表,见表1。这里条件属性映射函数f(xi,rj)=fi,j表示缺陷特征提取,而决策属性映射函数f(xi,c)=yi则表示缺陷的分类。

表1 表面缺陷分类决策表

决策系统可分为2部分:训练子系统和测试子系统。利用训练子系统提取缺陷分类的规则,测试子系统则验证分类性能。需要注意的是,在获得分类规则之前,必须完成数据的离散化和属性约简。

图5 基于粗糙集理论的缺陷分类流程

图5描述了基于粗糙集理论的缺陷分类的完整流程。首先,待分类的缺陷数据通过信息功能映射到决策表中,决策表被划分为训练决策子系统和测试决策子系统。其次,采用合适的数据离散化方法(如等间隔区间划分)将决策系统的属性值进行离散化处理。根据训练决策子系统,通过属性重要度分析完成属性的约减并提取缺陷分类规则。最后,将分类规则应用于测试子系统中用来验证分类规则的正确性和有效性。

3 试验结果

3.1 试验数据

试验数据来自于集通线上采集的钢轨图像经RSAS系统分析后的检测结果,总计检出 1 846 个疑似表面缺陷。通过人工复核,从检测结果中选取 1 000 个对象建立分类决策系统,试验数据组成结构为:400处剥离掉块、100处轧伤、200处擦伤、100处轨缝、100处噪声干扰以及100处污迹。根据 1 000 处缺陷数据构造分类决策表,见表2。

表2 集通线表面缺陷分类决策

为了提取和验证分类规则,将决策表分成2部分,即600个训练缺陷数据和400个测试缺陷数据。

3.2 缺陷分类规则提取

ROSETTA是一种常用的粗糙集数据分析工具,具有数据导入导出、补全、离散化、知识约简、分类、规则提取等功能。按照上文描述的缺陷分类流程,利用ROSETTA工具提取分类规则。

1)将缺陷数据的训练决策表的数据信息导入到ROSETTA工具中;

2)选择等间隔区间划分(Equal Frequency Binning)算法将连续的属性值划分为等间隔的数据区间,实现数据离散化;

3)选择遗传算法(Genetic Algorithm)实现属性重要度分析和约简;

4)从约简后的训练决策表中得到672条分类规则,部分规则如表3所示。

表3 分类规则

3.3 性能验证

将训练得到的分类规则应用于包含400个缺陷对象的测试决策子系统,以验证分类精度。为了评价方法的正确性和有效性,这里给出准确率(Precision Rate,简称PR)和召回率(Recall Rate,简称RR)的定义为

式中:TPi表示i类分类结果中分类正确的数目;FPi表示i类分类结果中误分的数目,即把其他非i类型错分为i类型;FNi表示i类分类结果中漏分的数目,即把i类型错分为其他非i类型。

表4为基于快速特征提取方法的粗糙集缺陷分类结果。可知,对各个类型的分类都取得了令人满意的结果,且整体分类精度为90.8%。相比之下,由于剥离掉块和轨缝的灰度统计和几何形状特征显著,因此分类精度高,更容易识别,而噪声分布较为随机且形状不定,导致分类精度较低。

表4 缺陷分类结果

4 结语

本文将粗糙集理论应用于钢轨表面缺陷分类,提出了基于缺陷几何特征和灰度统计特征的快速特征提取方法,用于构造粗糙集决策系统的属性集。使用粗糙集分析工具验证了特征属性的有效性,并取得了90.8%的分类精度,可以有效排除轨缝、噪声、污迹等干扰信息,降低缺陷检测的误报率。由于钢轨表面缺陷种类多样,各缺陷类型形状、纹理、色调各不相同,因此,为了进一步提高分类的准确性,未来的工作需要进一步对钢轨表面缺陷分类的特征提取方法进行研究。

猜你喜欢

粗糙集钢轨特征提取
粗糙集与包络分析下舰船运行数据聚类算法
我国钢轨轨型及定尺长度的百年发展历程
基于Pawlak粗糙集模型的集合运算关系
基于Gazebo仿真环境的ORB特征提取与比对的研究
基于Daubechies(dbN)的飞行器音频特征提取
钢轨焊后双中频感应加热工艺研究
Bagging RCSP脑电特征提取算法
一种基于LBP 特征提取和稀疏表示的肝病识别算法
一种基于粗糙集理论的社交网络潜在路径研究
高速铁路钢轨疲劳过程的超声非线性系数表征