基于贝叶斯理论集成网络分类器在板材识别中的应用
2015-02-23丁金华
王 辉,白 雪 冰,丁金华,王 帅,袁 长 峰
(1.盘锦职业技术学院 机电工程系,辽宁 盘锦 124000;2.东北林业大学 机电工程学院,黑龙江 哈尔滨 150040;3.大连工业大学 机械工程与自动化学院,辽宁 大连 116034;4.大连海事大学 交通运输与管理学院,辽宁 大连 116026)
0 引 言
板材纹理是板材表面重要的天然属性,其结构精细复杂,难于用数学解析方式进行描述,可作为识别板材的重要依据,也直接影响到板材产品的感观效果和经济效益。在木质家具和地板块制造等木材加工行业中,迫切需要对板材纹理进行分类识别,而目前主要靠人工目测方法,人为因素影响大,测量速度慢,精度低。随着计算机视觉技术的发展,国内外学者将数字图像处理技术引入木材学领域。从模式识别角度出发,针对木材加工业的需求,提出了一种基于贝叶斯理论集成网络分类器的板材纹理识别方法,使板材纹理自动化识别迈进了关键的一步。
1 板材图像纹理特征的获取
马尔可夫随机场(MRF)模型是一种表征图像结构的概率模型,能够有效地描述图像纹理特征。当MRF 邻域的激励噪声满足Gauss分布时,从而得到一组由空间域像素灰度表示的线性方程,即高斯-马尔可夫随机场模型(GMRF)[1-4]。
GMRF 是一个平稳自回归过程,用GMRF模型表达纹理,即图像中某一点s的灰度y(s)是s所有方向邻域点灰度的函数,可用下面的条件概率形式表示:
其中,N是以s为模型中心,以r为模型半径,不含s的对称邻域。根据前期研究的结论,GMRF的计算量相对较小,获得了较为广泛的应用。因此,选用GMRF方法,获取了板材纹理的GMRF 特征参数,具体如表1所示,受篇幅限制只列出前6个参数。
表1 十类板材纹理样本的GMRF特征参数Tab.1 Ten categories of wood block texture samples’GMRF parameters
2 基于贝叶斯理论集成神经网络分类器的设计
由于板材纹理的复杂性,单独采用一种分类器进行识别往往难以获得满意的效果,现在研究者更加倾向于采用多分类器集成的方法,让分类器之间互相补偿,来提高分类器系统的识别能力。通用的方法是采用投票表决方式、D-S规则等,这些方法只是简单地对单个分类的结果进行了组合,没有将各分类器自身的特性考虑进去[5-7]。作者所采用的方法能够通过对已知样本的统计分析获取每个分类器的先验知识,并将其作为分类器集成的依据,具体做法如下。
首先,根据分类器的先验知识得到能表达分类器性能的混淆矩阵。
式中:k代表被集成的一个单独分类器,行i对应类别Ci,列j对应事件ek(x)=j,元素n(k)ij代表输入样本归属于Ci类,而分类器ek做出决策ek(x)=j的频数(样本数)。
假定待识别的板材种类为M类,有K个独立的子分类器:e1,e2,…,eK,则对应有K个矩阵:PT1,PT2,…,PTk。
对于输入为x,可得到K个事件e(x)=j,k=1,2,…,K,结合相应的矩阵PTk,可以得到一个集合,则多分类器集成的问题就转化为这样的问题:用这个集合的知识,来计算式(3)的值。
式中:i=1,…,M。由于各个分类器都是独立训练的,决策也是独立做出的,因此,假设K个事件:ek(x)=j,k=1,2,…,K是独立的。则有
有了前面的基础,就按照公式(5)的规则来决策待识别板材样本x所归属的类别。
3 实验板材纹理样本
实验样本选用东北常见的10类板材纹理为研究对象,包括白桦径切、白桦弦切、红松径切、红松弦切、落叶松径切、落叶松弦切、柞木径切、柞木弦切、水曲柳径切以及水曲柳弦切。板材样本库包含10类图像样本,每类100个样本图像,样本尺寸为512mm×512mm,部分样本图像如图1所示。
图1 10类板材纹理样本Fig.1 Ten categories of wood block texture samples
4 实验结果与分析
将上述板材样本分成3部分,第1部分300个板材纹理样本用于训练BP 神经网络分类器[8-10],该分类器采用MATLAB 神经网络工具箱进行仿真,结构上选用3层网络,其输入节点数为12,输出节点数为10,隐含层节点数为13,学习函数选择Trainbr,训练次数设为300,网络误差为0.001。第2部分300个板材纹理样本用于BP神经分类器的筛选和集成,实验结果表明:随着参与集成的BP 神经网络分类器数量的增加,集成分类器总体识别率呈下降趋势,在网络分类器数量为3个时效果最好。表2、表3、表4列出了获得最高总体识别率的3个BP网络分类器的置信度矩阵。
3个BP网络分类器的置信度矩阵分别反映了样本在模式空间的分布情况。观察3个表格中的数据易见,数据分布规律大致相同,但具体数值存在明显差异,表明3个分类器存在着模式互补的信息。此外,表格中数据最大值集中在对角线上,而对角线上元素的最大值位置,代表了样本属于某一类的概率,与此同时,样本属于其他类别的概率并不为零,这样就将各分类器自身的特性考虑进去,克服了传统的投票表决方式、D-S规则等方法的缺点,达到了利用互补信息来提高识别能力目的。
表2 BP-神经网络1的置信度矩阵Tab.2 The belief level matrix of BP-ANN 1
表3 BP-神经网络2的置信度矩阵Tab.3 The belief level matrix of BP-ANN 2
表4 BP-神经网络3的置信度矩阵Tab.4 The belief level matrix of BP-ANN 3
用第3部分400个未知板材样本进行实验验证测试,结果如表5所示。
表5 集成神经网络分类器测试结果Tab.5 The result of combining classifier %
由表5 可见,单独BP 神经网络分类器的识别率依次为89.75%、90.00%和88.50%,表明高斯-马尔可夫随机场模型适合于描述板材纹理。为了在现有基础上,进一步获取更高的分类识别率,采用了基于贝叶斯理论的集成网络分类器对板材进行分类识别,识别率为91.00%,达到了预期效果,表明采用本文所提出的方法对板材进行分类识别取代人工识别是基本可行的。
[1]曹容菲,张美霞,王醒策,等.基于高斯-马尔科夫随机场模型的脑血管分割算法研究[J].电子与信息学报,2014,36(9):2053-2060.
[2]JIA Ya-fei,ZHAO Feng-jun,YU Wei-dong,et al.SAR image segmentation based on diffusion equations and MRF[J].Journal of Electronics and Information Technology,2011,33(2):363-368.
[3]陈红,夏青,左婷,等.基于纹理分析的香菇品质分选方法[J].农业工程学报,2014,30(3):285-292.
[4]王辉,杨林,丁金华,等.基于概率神经网络板材纹理分类识别的研究[J].大连工业大学学报,2009,28(5):387-390.(WANG Hui,YANG Lin,DING Jin-hua,et al.Classification and recognition of wood block texture based on PNN[J].Journal of Dalian Polytechnic University,2009,28(5):387-390.)
[5]夏双志,刘宏伟,纠博.基于贝叶斯理论的一种接力跟踪方法[J].电子与信息学报,2011,33(3):652-658.
[6]刘琪芳,韩焱,张锡祥.基于贝叶斯理论快速ERT图像重建算法[J].计算机应用研究,2014,31(5):1581-1587.
[7]朱坚民,张雷,翟东婷,等.基于声音多特征贝叶斯网络融合的话者识别研究[J].仪器仪表学报,2013,34(9):2058-2067.
[8]李东洁,李君祥,张越,等.基于PSO 改进的BP神经网络数据手套手势识别[J].电机与控制学报,2014,18(8):87-93.
[9]徐黎明,王清,陈剑平,等.基于BP 神经网络的泥石流平均流速预测[J].吉林大学学报:地球科学版,2013,43(1):186-191.
[10]魏微,高谦.改进的BP神经网络模型预测充填体强度[J].哈尔滨工业大学学报,2013,45(6):90-95.