APP下载

基于改进型AdaBoost网络模型的斑马鱼胚胎血管识别

2017-08-08杨玮婕徐建瑜

传感器与微系统 2017年8期
关键词:斑马鱼分类器胚胎

杨玮婕, 徐建瑜

(宁波大学 信息科学与工程学院,浙江 宁波 315211)



基于改进型AdaBoost网络模型的斑马鱼胚胎血管识别

杨玮婕, 徐建瑜

(宁波大学 信息科学与工程学院,浙江 宁波 315211)

基于图像特征与改进型AdaBoost网络模型,对斑马鱼节间血管的识别进行了研究。对3组斑马鱼胚胎荧光图像训练集的节间血管进行正负样本选取,使用Haar-like特征图提取图像特征,通过AdaBoost网络模型对所提取的特征训练形成级联分类器,根据识别效果,调整改进网络的系数得到改进型级联分类器,最终实现了节间血管的精确识别和统计。实验结果表明:对于节间血管提取的准确率和识全率分别达到了93.8 %和91.1 %,说明该算法检测准确率高,对不同组别图像均有稳定的检测效果。

节间血管识别; 斑马鱼; AdaBoost; 特征提取

0 引 言

对于药物试验效果的判断,常依据斑马鱼胚胎发育完好的节间血管根数[1]。在如今批量化的实验需求之下,自动化分析斑马鱼实验图像成为研究热点之一[2]。因此,通过图像特征自动提取并计算出斑马鱼节间血管根数,具有很重要的实用意义。

现有的图像目标提取算法很多,其中成熟运用的研究有以下几种:1)基于平均间距提取肌间骨算法[3],通过设定图像中目标的平均间距和目标间隔参数,提取图像目标,算法的执行效率高;2)方向梯度直方图结合主成分分析(principal component analysis,PCA)组成的联探测器检测图像中的血红细胞[4],可以有效地将图像中识别目标与类似识别目标的其余前景物体分开;3)基于“支持向量机(support vector machine,SVM)+Gabor小波”人脸检测系统,算法先降维去除重复信息,用人脸与滤波器卷积提取特征,具有较高的识别率[5]。上述方法由于提取目标目的和图像限制的原因,仅适用于单个或者少量目标的提取,而对于斑马鱼节间血管的提取,一幅图片中提取目标数量较多,要求不仅能准确地提取目标,还要尽可能地将所有目标都提取出来。

本文通过结合Haar-like特征提取和改进型AdaBoost算法,提取荧光斑马鱼胚胎图像中的节间血管,选取了不同实验条件下获取的图像作为测试集,以识别的准确率和目标的识全率作为判断算法性能的依据。

1 目标血管识别算法

基于Haar-like特征图提取特征结合改进型AdaBoost神经网络的目标血管识别算法,流程如图1。

首先,针对斑马鱼胚胎荧光图像序列进行随机筛选,选出训练样本和测试样本;接着根据节间血管进行正、负样本选取;然后使用Haar-like特征图提取样本特征,再通过改进型AdaBoost神经网络对所提取的特征训练形成级联分类器;之后使用分类器对测试图像实现目标识别,并根据识别结果判断分类器分类效果是否满意,若不满意,则调整AdaBoost的改进系数k直至识别效果达到满意;最后自动统计识别出的节间血管数量。

2 斑马鱼胚胎图像特征提取

2.1 Haar-like特征图[6~8]

使用如图2所示矩形特征图描述斑马鱼胚胎荧光图像特征,其中Haar-like矩形特征的特征值根据白色矩形像素和与黑色矩形像素和之差得到[9]。

图2 矩形特征图

2.2 使用特征图计算像素值

图像黑色像素计算方法如下:1)计算图像的积分图,其中图像每一点的像素值用i(x,y)表示,每一个像素点的像素值用I(x,y)表示,通过式(1)可计算得到I(x,y)

(1)

对图像的行和列进行循环累加计算可以得出待检测图像的积分图值。2)使用积分图计算Haar特征值,由式(2),式(3)对行和列累加

s(x,y)=s(x,y-1)+i(x,y)

(2)

I(x,y)=I(x,y-1)+s(x,y)

(3)

式(2)中的域s(x,y)为列积分,点(x,y)的值不包含在s(x,y)中,待检测图像初始条件为s(x,-1)=0,I(-1,y)=0。

通常,从样本中提取的Haar-like特征的规模巨大,因此,使用Haar-like样本特征检测节间血管的主要问题是使用有效特征学习分类功能。选择一种机器学习方法通过不断训练,根据特征的作用进行权重赋值,可以解决上述问题。

3 改进AdaBoost算法训练提取特征

AdaBoost分类算法可以整合弱分类器BP神经网络的分类结果,并根据结果赋予不同权重实现更好的分类效果。具有最主要的有2个优势:1)训练的错误率上界,随着迭代次数的增加,会逐渐下降;2)即使训练次数再多,也不会出现过拟合的问题。AdaBoost算法原理的过程可以由图3表示。

图3 AdaBoost工作原理

传统的AdaBoost方法[10~12]每轮迭代均会对权值进行调整,增加分类正确的分类器权值,减小错误分类的权值[13],但这种更新规则对一些不常见样本,训练时会分配比较大的权重而产生过配现象[14]。根据AdaBoost算法的原理,对权值更新规则以及弱分类器的加权参数进行了改进:首先在每一轮的训练过程中定义一个阈值0,同时依据样本是否错分和当前状态的权值是否大于0来更新样本的权值,从而极大程度地避免过配现象。最后根据式(4)、式(5)进行优化改进[15]

(4)

(5)

式中 r为所有被正确识别的弱分类器样本权重之和;ker为r的增函数;εt为第t次迭代的错误率。通过不断调整k的值改变弱分类器权重比例,从而更好地训练特征分类器。

4 提取节间血管

本文使用OpenCV库对基于改进AdaBoost方法进行实验,并对结果分析研究。基于改进型AdaBoost的斑马鱼节间血管提取过程分为2个步骤:1)样本的训练;2)对加载的分类器进行检测。基本流程如图4所示。

图4 测试图像节间血管的分类流程

5 实验过程与结果

5.1 实验数据采集

实验所使用的斑马鱼胚胎图像由杭州环特生物科技有限公司提供。共对3组斑马鱼图像进行了测试,分别为对照组、溶剂组以及阳性药物组。每组分别有100张图像,共计300张,不同处理组别斑马鱼胚胎图如图5所示。在每组图像中随机取出80张用于截取正、负样本训练分类器,余下20张用于目标识别算法测试。

节间血管与非血管部分识别过程为,截取图中完整的血管部分作为正样本,同时截取图片其余部分作为负样本,正、负样本图片大小尽量保持相近。在实验过程中共截取了460组正样本和1 360组负样本,图6为部分正、负样本截取结果示例。研究过程中,为减少数据量并保证输入图像的细节信息,将正、负样本图像统一通过插值计算转换为20×50的图像。

图5 3种不同处理组别斑马鱼图像

图6 正、负样本截取结果

5.2 算法测试

通过Haar-like特征图提取数据集给定的20像素×50像素样本,得到图像正、负样本特征的总数量为392 019。

经过特征提取后,使用AdaBoost特征分类器对特征进行训练,得出一个由不同权重弱分类器组合得到的强分类器。使用分类器分别对3组实验组,每组20幅图像,共60幅斑马鱼胚胎荧光图像加载检测,图7为3个组别中随机一组的检测结果。

图7 斑马鱼胚胎图像节间血管提取结果

为了更好地判断提取结果,定义了以下2种比率:

1)准确率,被标定的血管中真正的节间血管数量与算法认为血管总数量之比;

2)识全率,被标定的血管中真正的节间血管数量与图中斑马鱼节间本身的血管总数的比例。

实验自动计数结果分别为24,20和5,与识别结果一致。实验中发现,根据改进算法调节参数值时,会出现检测的准确率和识全率无法同时得到满足的情况,所以,为了保证算法的稳健性和鲁棒性,往往要均衡考虑两方面的效果而进行各自的舍弃,得到两个方面均较为理想的结果。

5.3 识别效果对比分析

本文通过对比文献[3]提出的方向梯度直方图特征描述结合级联探测器,以及文献[16]提出的基于小波和PCA特征融合分类检测算法,对同样的测试图像序列进行节间血管的提取计数。3种算法处理结果如表1。

表1 本文算法与其他算法对比 %

通过表1可以得出:本文算法在2种判断算法的指标均表现优异,达到了两者兼顾的效果。但是由于实验图像数量的原因,训练特征不足,3种算法均未能达到极高的准确率以及识全率。实际应用中,一次实验往往可得到上千甚至上万的实验结果图像,因此,本文的算法具有极强的应用意义,原因如下:1)随着图像数量的增多,可提取的特征随之增多,则识别准确性必然会提高;2)由于数量庞大,对于每幅图的识别准确性要求不会非常苛刻,只需能达到不同组别之间的定性分析,从而判断药物对斑马鱼胚胎的影响即可。

6 结 论

提出了一种基于Haar-like特征检测和改进型AdaBoost分类器提取斑马鱼胚胎荧光图像的节间血管算法。针对图像提取目标,将目标部分认定为正样本,其余部分划分为负样本,选择以像素级特征提取方案,即Haar-like特征图算法提取图像特征,使用改进型AdaBoost分类算法调节参数阈值对批量检测图片进行加载检测,并对提取的目标即节间血管进行计数。实验结果表明:算法识别精度高,且识全率也得到了足够的保证,有很强的应用价值。但算法本身仍有待深入改进的空间,例如,本文只针对同一方向拍摄的斑马鱼图像,若图像方向不确定时效果是否仍然良好,或者如果图中出现多条鱼时,算法是否依然有效,针对这些问题,今后将做更进一步的研究工作。

[1] 赵 洋,颜妙虹,白殊同,等.过山枫有效成分南蛇藤素和扁蒴藤素对斑马鱼节间血管生成的抑制作用研究[J].中药新药与临床药理,2013,24(6):537-540.

[2] 彭蕴茹,韦英杰,等.基于斑马鱼模型的药物毒性研究进展与中药毒性研究新策略[J].中草药,2017,48 (1):17-30.

[3] 费晓行.斑马鱼肌间骨的自动提取[D].南京:南京理工大学,2009.

[4] Zhang Z,Ong L L S,Fang K,et al.Image classification of unlabeled malaria parasites in red blood cells[C]∥2016 IEEE 38th Annual International Conference of the Engineering in Medicine and Biology Society,IEEE,2016:3981-3984.

[5] 叶 超.基于Gabor小波和SVM的人脸识别算法研究[D].太原:中北大学,2014.

[6] Papageorgiou C P,Oren M,Poggio T.A general framework for object detection[C]∥1998 Sixth International Conference on IEEE Computer Vision,1998:555-562.

[7] Lienhart R,Maydt J.An extended set of Haar-like features for rapid object detection[C]∥ 2002 Proceedings of International Conference on Image Processing,IEEE,2002:1.

[8] Liao S,Jain A K,Li S Z.A fast and accurate unconstrained face detector[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2016,38(2):211-223.

[9] Zheng L,He X,Samali B,et al.An algorithm for accuracy enhancement of license plate recognition[J].Journal of Computer & System Sciences,2013,79(2):245-255.

[10] 严 玥,严 实,杨永斌,等.Adaboost集成BP神经网络在火电厂SO2浓度检测中的应用[J].传感器与微系统,2016,35(9):148-151.

[11] Kong K K,Hong K S.Design of coupled strong classifiers in AdaBoost framework and its application to pedestrian detection [J].Pattern Recognition Letters,2015,68:63-69.

[12] 徐 前,赵德安,赵建波.基于改进的AdaBoost算法的人脸检测与定位[J].传感器与微系统,2010,29(1):94-97.

[13] 糜元根,陈丹驰,季 鹏.基于几何特征与新Haar特征的人脸检测算法[J].传感器与微系统,2017,36(2):154-157.

[14] 刘晓芳,夏哲雷,王孝卫.AdaBoost人脸检测算法的改进[J].电视技术,2014,38(15):213-216.

[15] 王 毅,王创新,卢 进,等.基于HSV模型和改进AdaBoost算法的车牌检测[J].电子科技,2015,28(2):107-111.

[16] 叶 超,姚竹亭.基于小波变换的人脸识别方法[J].电子世界,2014(4):201-202.

徐建瑜,女,通讯作者,硕士,副教授,硕士生导师,主要从事图像处理方面的研究工作,E—mail:xujianyu@nbu.edu.cn。

Recognition of blood vessels in image of zebrafish embryo based on improved AdaBoost network model

YANG Wei-jie, XU Jian-yu

(College of Information Science and Engineering,Ningbo University,Ningbo 315211,China)

Based on image feature and improved AdaBoost network model,recognition of zebrafish interstitial blood vessels of is studied.Positive and negative samples are selected from training set of three zebrafish embryo fluorescence image groups,and Haar-like feature maps are used to extract features.According to the recognition effect,adjust the coefficient of the improved network to obtain the improved cascade classifier.Accurate identification and statistics of the interstitial blood vessels are obtained.Experimental results show that the accuracy and efficiency of interstitial blood vessels extraction are 93.8 % and 91.1 % respectively,which indicates that the algorithm has high detection accuracy rate and has stable detection effect on different image groups.

interstitial blood vessels recognition; zebrafish; improved AdaBoost; feature extraction

10.13873/J.1000—9787(2017)08—0141—04

2017—06—27

TP 391.41

A

1000—9787(2017)08—0141—04

杨玮婕(1993 -),女,硕士研究生,主要研究方向为生物图像处理,E—mail:yangwejie416@163.com。

猜你喜欢

斑马鱼分类器胚胎
小斑马鱼历险记
母亲肥胖竟然能导致胚胎缺陷
母亲肥胖竟然能导致胚胎缺陷
基于实例的强分类器快速集成方法
瓜蒌不同部位对斑马鱼促血管生成及心脏保护作用
加权空-谱与最近邻分类器相结合的高光谱图像分类
结合模糊(C+P)均值聚类和SP-V-支持向量机的TSK分类器
油红O染色在斑马鱼体内脂质染色中的应用
DiI 在已固定人胚胎周围神经的示踪研究
冷冻胚胎真的可以继承吗?