APP下载

LDA算法在图像特征提取中的研究

2014-09-01钟彩

新媒体研究 2014年12期

钟彩

摘要人体细胞直接关系到身体各项指标的性能,在图像特征的研究过程中,显微细胞图像数据非常复杂,这些数据对下一步的研究将会受到很大的影响。为了提高图像的识别效果,文章以尿液中红细胞图像分析研究为例,采用LDA算法,对细胞图像的主要特征进行变换,提取数据的主要特征,以达到提取图像特征的目的。

关键词LDA算法;图像分析;特征识别

中图分类号:TP391 文献标识码:A 文章编号:1671-7597(2014)12-0067-01

Study of LDA algorithm in image feature extraction

Zhong Cai

(Changde Vocational Technical College Hunan ChangDe 415000)

Abstract: The cells of the body is directly related to the performance indexes of the body,In the process of the image feature;Microscopic cell image data is very complex;These data have great influence on the study will be the next step. In order to improve the recognition effect, In this paper, red blood cells in the urine image analysis as an example, Using LDA algorithm; The main feature of the cell image transform, Feature extraction of data;In order to achieve the purpose of image feature extraction.

Key words: LDA algorithm; Image analysis; Feature recognition

尿液中的红细胞经过分割后,我们可以确定一个圆,但这类圆的形状、大小都是不规则的,其中还有一些杂质,我们将这些特征统称为非红细胞。细胞特征研究是辨别红细胞和非红细胞研究最重要的理论参考依据,而其中的特征提取是目前研究中最主要的课题之一。

1LDA算法原理

线性判别式分析是模式识别和人工智能领域中应用最为广泛而且是最为经典的算法之一。通过将高维的模式样本利用一定的技术手段投影到相关的最佳鉴别矢量空间,通过一系列分析之后抽取相关的分类信息以及压缩特征空间维数的相关数据,从而计算出样本的max类间距和min类间距,作为空间有效分离性的基本数据。线性判别式分析是LDA算法的理论基础,从建立起到现在已经成为LDA最主要的算法之一。

样本类内离散度矩阵可以定义为:

可以定义为:

其中,是先验概率,是类的均值。样本的类间离散度矩阵可定义为

是所有样本的均值。由上面公式可以推导出,如果是非异性矩阵的话,投影效果可以得出,各类样本的效果与分散度以及类内离散度有着相当大的关系,通常离散度越大,投影效果越明显;类内离散度越小,投影效果越理想。总而言之,如果想要获得最优的投影方向,可以让样本之间的“类离散度矩阵/样本类内样本类内离散度矩阵的行列式”比值最大,得出其中的正交特征向量,以便达到理想的投影效果。

具体可以定义Fisher准则函数如下:

求出,取最大值时对应的特征向量,通过数学变换可以得出,满足如下等式的解:,,由公式可以看出是由之间的较大特征值所决定的。

如果非奇异,就是求的本征值问题,其中该矩阵最多有非零特征值,是类别数目。但是在LDA成像具体操作过程中,有时也会出现一些偏差,其中最主要的是样本内一般情况下呈现为奇异性的状态。这是因由细胞图像特出的数据是高维数据,这些数据本身的维数就明显大于样本数,因此,,理论上呈现的是不可逆的状态。这就使得即广义特征值在求值过程中会出现一些问题,即小样本的问题。对于此类的问题,我们首先要对高维数据进行充分分析,然后根据具体情况研究分析,的特性空间,再次就是转换角度,让LDA对图像分析进行降维处理,从而使得呈现为可逆状态。

通过LDA算法一些测算,可以有效地将特征子空间进行融合,从而获取融合后的特征空间。其次将训练样本以及测试样本在此空间进行投影,将识别特征进行记录。将识别样本和训练样本进行规范化处理,然后对其向特征子空间进行投影,获得一组投影向量,(A为以前规范化的样本)。通过公式带入可以得出一组投影向量。通过对一组投影向量进行分析和整理,列出维的列向量,即每个投影向量。然后将这组投影向量组成一个矩阵如下:,式中,为大小的矩阵,该矩阵称为细胞图像样本的特征矩阵,此矩阵即为所要提取的细胞样本的特征。

2实验结果

本文通过对LDA算法的实验研究,能有效地将尿液中红细胞高维图像降低为低维图像,生成低维细胞空间,这样有利于图像特征的提取,从而达到研究的目的。但在研究过程中,我们发现LDA算法还是存在某些局限性,如对那些形体不规则的细胞不能很好的提取特征,在以后的研究中,我们还将进一步完善该算法,继续挖掘红细胞的新特征,争取达到更好的实验效果。同时,在人体尿沉渣中,存在更小的红细胞与小结晶,有形成分中目标比较复杂、类型较多,即使同一类细胞在形态及纹理上都有不同的特征,还有其它成分尚未进行识别,而且有些成分与已识别的成分非常相近,很容易造成误识,这些都是我们应该做更深入的研究。本文实验结果是在windows XP/Matlab7.0.1环境下运行得到。

通过以上研究可以得知,LDA算法对于人体细胞图像特征中的应用有十分重要的作用,对于人类细胞的研究方法提供了更加清晰地解析。同时LDA算法对于人类医学研究方面提供了丰富的数据参考。尽管这种算法还有待完善,但我们相信,随着技术的改进和算法的完善,LDA算法对于细胞成像的相互之间的转化以及特征研究必将发挥它关键性的作用。

参考文献

[1]雷松泽.基于k-means聚类的快速LDA算法在语音识别上的应用[J].科技通报,2013.

[2]许伯熹,胡宁,陈文斌,等.LDA算法在Mahout下的高效实现 [J].华东师范大学学报,2013.

[3]黄轩宇.基于KL投影LDA人脸识别及正交辨识分析[A].江苏省通信学会论文集[C].南京:2004.

[4]雷赟,龚葵花.基于线性矩和小波变换的医学图像特征提取[J].科技信息,2010(03).

[5]韩争胜,李映,张艳宁.基于LDA算法的人脸识别方法的比较研究[J].微电子学与计算机,2005(07).

endprint