基于X-ray CT的沥青混合料材质分类方法*
2011-03-15张肖宁段跃华李智吴文亮万成
张肖宁 段跃华 李智 吴文亮 万成
(华南理工大学土木与交通学院,广东广州510640)
利用工业CT获取沥青混合料内部细观结构图像并结合数字图像处理进行综合分析已经成为目前路面结构的研究热点.国内外关于此方面研究的主要成果可以概括为以下4个方面:混合料内部颗粒形态描述、各组分体积特性分析、荷载作用下内部结构变化规律和虚拟力学试验[1].
纵观国内外相关研究成果可发现,结合沥青混合料CT扫描断面图的不同特点进行系统数字图像处理的内容并不多见,区分内部材质的技术手段还比较粗糙,随意性较大,经验成分居多.然而,对沥青混合料组成材质科学区分是进行沥青混合料细观结构研究的重要基础和前提,只有对二维断面图进行科学合理的分割,并辅以必要的数字图像处理手段,在此基础上进行三维重构,才能准确把握各类材质的空间分布信息,获取各项重要体积参数,并进行虚拟力学仿真试验及计算等工作.
1 沥青混合料CT扫描图像的特点
采用马歇尔击实仪击实成型工程上常见的AC-13C沥青混合料试件,材料参数略.利用德国YXLON公司225 kV工业CT进行扫描及三维重建,所获取图像的平面及轴向像素大小均为0.11 mm左右.图1为扫描断面图像及灰度直方图.
图1 沥青混合料断面图及灰度直方图Fig.1 Cross-section image and gray histogram of asphalt mixture
文献[2]中采用双峰法对此类图像进行材质分类.该方法采用点相关技术产生阈值,认定图像两峰之间为同一介质,初步确定两个阈值T1和T2,然后采用反复试验的方法微调,最终确定T1和T2.文献[3]中分析比较了多类阈值分割算法,并推荐采用迭代法作为沥青混合料图像分割的算法.
仔细观察CT扫描沥青混合料试件后获取的试件不同高度位置的断层图像,可以发现每张图片的灰度信息并非完全一致,同类物质在试件不同位置扫描后得到的灰度值并不固定,不能以单张图片的信息笼统代表整个试件的灰度分布规律,而是需要对断层图片建立自适应处理以利于三维可视化.沥青混合料CT扫描数字图像灰度直方图理论上应呈现四峰分布,即背景、孔隙、胶浆、集料,而目前图1只有三峰呈现,孔隙与沥青灰度分布混杂.本次扫描获取的切片图像的像素大小理论上为0.11 mm左右,但是通过观察发现,难以将混合料中1.18~2.36mm之间某个粒径大小以下范围的颗粒分辨清楚,在图1灰度直方图中表现为细集料与沥青材质混杂.根据此特点,文中尝试将沥青胶浆作为一类物质来单独分类.
基于以上分析,文中从3种完全不同的思路出发,采用传统的阈值分割算法及近年来在模式识别领域应用较为成功的高斯混合模型(GMM)和模糊C均值(FCM)聚类算法对断面图进行分析,提出建立CT扫描标准物质,并利用标准物质对3种方法的材质分类效果及计算效率间接进行比较.
2 材质分类方法
为取得良好的分割效果,必须对原始图像进行一些预处理,主要包括图像类型转换、滤波降噪、数字形态学运算、孔洞填充等步骤,所有过程均采用Matlab语言编程实现.
2.1 最大类间方差法
图像阈值处理在图像分割中占有重要的地位,是一种较为直观的做法.
文献[4]中介绍了最大类间方差法(OTSU).这是一种自适应的阈值确定方法,其基本原理是将图形分为目标和背景两部分,两部分之间的方差越大,说明两部分之间的差别越大,将目标误认为背景或者将背景误认为目标都会使得两部分差别变小,因此使类间的方差最大就意味着错分的概率最小.
文献[5]中详细介绍了OTSU算法的步骤,设图像有L个灰度级,灰度值为i的像素数为ni,则总的像素数为,各灰度值出现的概率为Pi=,显然可以得到.假设以灰度值t将整个图像分成区域A(背景)和区域B(目标),区域A的灰度级为1~t,区域B的灰度级为t+1~L-1,则A、B出现的概率分别为,A、B的灰度均值分别为 wA=图像总的灰度均值为两个区域的类间方差表达式如下所示:
按照OTSU准则,使类间方差σ2值最大的t值即为所求的最佳阈值.
最大类间方差法没有考虑各类材质不同部位灰度分布的状况,每个像素(也就是每个样本)都是孤立的.
2.2 基于GMM的期望最大化算法
GMM是对各类材质总体灰度分布特征的一种认识.GMM是一种产生式模型,相当于先探源头,摸清楚数据的产生规则,然后依据最小错误率的原则确定最佳决策阈值.
GMM模型的参数一般通过期望最大化算法(EM)来计算[6],文献[7]中介绍了EM算法,此算法假设图像分割成k个区域,每个区域像素分布符合均值为μj、方差为σj的正态分布,则整幅图像灰度值的概率密度函数用混合高斯分布描述为
式中:x为一个样本,即一个像素;θ为各混合成分的掺量矢量,θ=(θ1,θ2,…,θk),θj=(μj,σj);αj为混合系数成分的比例概率,为第j个高斯分布的概率密度函数.
EM算法可用来从非完整数据集中估算出完整数据,其主要步骤由E步和M步组成.E步计算完整数据的对数似然函数的期望,M步通过最大化似然函数的数学期望从而获取新的完整数据的估计.通过交替使用这两个步骤,EM算法逐步改进模型的参数,使参数和训练样本的似然概率逐渐增大,最后终止于一个极大点.
在选择GMM方法的同时,假设图像内每类材质的分布均符合高斯分布,这是观察图1(b)直方图分布特征后做的初步假设.由于原始图像的背景很容易剔除,于是剩余的两类物质为孔隙与胶浆共同体和集料.为了严谨,对图1(b)中B、C两个波峰左右一定范围的正态分布性进行了检验,采用Matlab的jbtest函数遍历CT扫描断面图片进行正态分布的拟合优度测试,结果表明前面的假设是合理的.限于文章篇幅,此处略去详细过程.
2.3 FCM算法
FCM是一种基于划分的聚类算法,是普通C均值算法的改进,模糊聚类考虑了每个像素的灰度和空间分布信息,同时引入模糊数学中隶属度的概念,FCM给出的是每个像素属于某个类别的可能性,同样属于模式识别的内容[8].文献[9]中详细介绍了FCM算法.聚类目标函数Jm(U,V)为
式中:U为模糊隶属度矩阵,U={uij},uij为第j个数据对第i类的隶属度;V为聚类中心集合,V={vi}; dij为第 j个像素到第 i个聚类中心的距离,dij=;c为聚类类别数(1<c<n);m为模糊加权指数(1≤m<∞);X为n个待聚类像素集合,X= {x1,x2,…,xn}.采用迭代优化算法来使计算目标函数Jm(U,V)最小,具体算法可参见文献[9].
2.4 3种算法的实现及初步比较
仔细观察图1的灰度分布特性,黑色背景部分分布比较有规律,可以通过图像处理手段简单剔除,而对应于孔隙的样本数跟其他几类相差太多,孔隙形成的峰非常不明显,且孔洞对应的区域面积太小,孔隙、胶浆、集料三类样本数极不均衡,所以采用上述3种算法处理时必须对经典算法进行变通,将原图像转化为一个多类分类问题.采取的策略是一对多,将多类分类转化为两次二分类问题:先将图像分为两类物质,即集料为一类,沥青胶浆及孔隙为另一类,然后再根据灰度信息将沥青胶浆和孔隙分割开,由于图像只有灰度信息可以利用,无法采取其他辅助信息和手段进行分割,所以第2次二分类时采用了阈值分割与经验判断相结合的方法.图2为各类材质模板的形成过程,以阈值法为例,其余两种算法过程类似.图3为3种处理方法对同一扫描断面图的最终分割效果.
图2 材质模板的生成Fig.2 Generation of material templates
图3 3种方法的材质分类结果Fig.3 Materials classification results of three methods
由图3可以看出,3种方法针对单张断面图都能取得较好的分割效果,集料颗粒边缘基本能闭合,内部无明显孔洞及孤立像素点,颗粒分界清晰基本无粘连,主要差别为运算时间的差异,但是对于孔隙判别的准确程度难以直观评价.
3 标准物质验证
由于采用了完全不同类型的分割算法,自然涉及到对图像分割效果进行评价的问题.文献[10]中介绍了图像分割评价的几种方法,并指出国内外至今尚比较缺乏对图像分割评价方法和准则的系统研究.
3.1 CT扫描标准物质
由于CT扫描成像过程非常复杂,影响成像质量的因素众多,加上沥青混合料内部由多相非均质物质构成,且CT硬件平台差异性很大,即使是同型号产品,其成像质量也难有准确的规律可循.
基于此,尝试研制用于CT扫描仪器校准的标准物质.国际标准化组织/标准物质委员会(ISO/ REMCO)确定了标准物质的定义:具有一种或多种足够均匀和很好地确定了的特性,用以校准测量仪器、评价测量方法或给材料赋值的材料或物质[11].经过反复比较多种材料,最终确定环氧树脂TAFEXPOXY+耐诺玻璃珠方案,标准物质研制的流程如图4所示.研制过程完全符合文献[12]相关条文,限于文章篇幅,笔者将另文详细介绍研制过程.材料的基本参数见表1.
图4 标准物质研制流程图Fig.4 Flow chart of te production of reference material
表1 标准物质参数Table 1 Reference material parameters
标准物质选定均匀、稳定的玻璃珠总体积作为特性量值.定值方法为利用工业CT获取断面图,三维重构后按体素值计算对应物质体积.
由于标准物质组成材质的密度等物理指标与沥青混合料内部组成材质极为相似,根据CT扫描成像灰度值与材料密度互相转换的成像原理,完全可利用标准物质对CT扫描结果进行校正.
3.2 利用标准物质的体积验证
通过观察标准物质三维重构灰度直方图分布,发现虽然标准物质由两相物质组成,但其灰度分布仍然呈现类似图1(b)的形式,无法靠一个全局阈值将内部物质完全分离,这是由CT三维重构原理决定的.这里将标准物质扫描得到的二维断面图分别用3种算法遍历处理,利用VGS软件即可轻松获得玻璃珠总体积,与玻璃珠实际总体积比对.标准物质的计算结果见表2.
表2 标准物质体积计算结果及偏差Table 2 Calculated volume of reference material and its deviation
从表2可知:采用阈值法计算的体积相对误差最小,GMM法及FCM法的相对误差相当;GMM及FCM方法识别的空隙率与试件实际情况不符;试件制作过程中只有环氧树脂化学反应过程产生的微小气泡以及来不及排出的少量空气以膜形式粘附于玻璃珠表面;阈值法的计算结果与实际接近,而且其值法计算效率较高.
这里将3种分割方法作为标准物质定值过程的辅助方法,间接对3种方法的分割准确性及计算效率加以评判.
3.3 马歇尔试件空隙率验证
采用真实的马歇尔击实成型的AC-13C试件扫描,分别用3种方法处理原始断面图像,然后利用软件计算空隙率并进行比较,结果见表3.
表3 AC-13C空隙率计算结果及偏差Table 3 Calculated AC-13C void calculation and its deviation
验证结果表明:3种方法都能准确地将背景和沥青混合料区分开,最大类间方差法识别的空隙与实测结果最为接近,而GMM及FCM方法的偏差较大,且运算时间较长;另外,GMM计算时偶尔会有迭代出错的现象.
4 结论
(1)阈值分割法是图像分割学科常见的方法,用此方法直观有效;模式识别领域中的GMM及FCM方法是识别复杂物质的有效手段,GMM对原始图像的灰度分布有一定要求,而FCM方法是一种基于划分的聚类算法.
(2)为了将图像内部区分为背景、孔隙、胶浆和集料4部分,先把背景分离出来,然后对剩余部分做两次二分类的策略来区分不同材质.
(3)CT扫描成像过程复杂,影响图像质量的因素众多,建立标准物质可以对扫描结果进行校正.利用3种分割方法作为标准物质定值过程的辅助方法,可以间接评价分割效果及效率,扫描结果可用于校正仪器.
(4)对于具有较明显双峰分布的断面图,阈值法的处理效率较高,且对各类物质的判别较为准确,GMM及FCM法运算过程复杂,计算效率较低,对于空隙和胶浆的区分结果不够理想,需要根据实际情况对原算法加以改进.
以上结论只针对本次扫描结果,最为合适的沥青混合料组成材质分类方法,必须根据原始图像的成像质量、三维重构后灰度直方图的分布特点及沥青混合料的不同类别等多种因素来综合确定.
[1] 吴文亮.沥青混合料的数字图像处理技术与概率统计方法研究[D].广州:华南理工大学土木与交通学院,2009.
[2] 虞将苗,李晓军,王端宜,等.基于计算机层析识别的沥青混合料有限元模型[J].华南理工大学学报:自然科学版,2006,26(1):16-19.Yu Jiang-miao,Li Xiao-jun,Wang Duan-yi,et al.Finite element modeling of asphalt mix with X-ray computerized tomography processing[J].Journal of South China University of Technology:Nature Science Edition,2006,26 (1):16-19.
[3] 孙朝云,沙爱民,姚秋玲,等.沥青混合料图像阈值分割算法的实现[J].长安大学学报:自然科学版,2005,25(6):34-38.Sun Zhao-yun,Sha Ai-min,Yao Qiu-ling,et al.Realization of threshold segmentation algorithm in asphalt mixture[J].Journal of Chang'an University:Natural Science Edition,2005,25(6):34-38.
[4] 冈萨雷斯.数字图像处理[M].阮秋琦,阮宇智译.北京:电子工业出版社,2005.
[5] 肖超云,朱伟兴.基于Otsu准则及图像熵的阈值分割算法[J].计算机工程,2007,33(14):188-189.Xiao Chao-yun,Zhu Wei-xing.Threshold selection algorithm for image segmentation based on OTSU rule and image entropy[J].Computer Engineering,2007,33 (14):188-189.
[6] 刘建明,侯纪周,奚宏生.基于GMM与EM算法的呼叫接入控制[J].通信技术,2002,4:50-53.Liu Jian-ming,Hou Ji-zhou,Xi Hong-sheng.GMM and EM algorithm-based CAC over ATM network[J].Communications Technology,2002,4:50-53.
[7] 罗胜,郑蓓蓉,叶忻泉.基于EM和GMM相结合的自适应灰度图像分割算法[J].光子学报,2009,38(6): 1581-1585.Luo Sheng,Zheng Bei-rong,Ye Xin-quan.Image segment based on the self-adaptive threshold EM and GMM algorithm[J].Acta Photonica Sinica,2009,38(6):1581-1585.
[8] 李艳灵,沈轶.基于空间邻域信息的FCM图像分割算法[J].华中科技大学学报:自然科学版,2009,37 (6):56-59.Li Yan-ling,Shen Yi.Fuzzy C-means algorithm based on the spatial information for image segmentation[J].Journal of Huazhong University of Science and Technology: Natural Science Edition,2009,37(6):56-59.
[9] 王海波,李雪耀.基于FCM聚类算法的颅内出血CT图像分割[J].CT理论与应用研究,2009,18(2):99-105.Wang Hai-bo,Li Xue-yao.Segmentation of intracranial hemorrhage CT image based on FCM clustering algorithm[J].CT Theory and Applications,2009,18(2):99-105.
[10] 章毓晋.图像工程(中册)图像分析[M].第2版.北京:清华大学出版社,2005.
[11] 韩卓珍.基于标准物质数据库探讨我国标准物质的发展现状及趋势[J].化学分析计量,2009,18(4): 4-8.Han Zhuo-zhen.Discuss on development and trends of Chinese reference material on the basis of the reference material database[J].Chemical Analysis and Meterage,2009,18(4):4-8.
[12] JJG1006—1994,一级标准物质[S].