APP下载

基于回归分析的基因芯片图像倾斜校正方法

2010-01-12马帅营

大连民族大学学报 2010年1期
关键词:行列基因芯片倾斜角

马帅营

(大连民族学院现代教育技术中心,辽宁大连 116605)

基于回归分析的基因芯片图像倾斜校正方法

马帅营

(大连民族学院现代教育技术中心,辽宁大连 116605)

基因芯片图像的倾斜校正对图像分析有着重要意义。利用投影信号对图像进行行列分割,对仅包括单行(列)样点的子图像运用回归分析完成初步倾斜校正,利用样点的质心进行直线拟合,完成精确校正。实验表明,对基因芯片图像的倾斜校正有很高的准确性,且算法简单易行。

基因芯片图像;投影信号;回归分析;倾斜校正

基因芯片的检测与分析是基因芯片技术研究中的重要组成部分,其可靠性、准确性直接影响芯片的推广与使用。其中包括了图像预处理、网格定位、背景滤除、荧光信号提取等[1]。要进行芯片分析,首要任务就是进行网格定位[2-4],也就是在基因芯片图像上确定各探针的杂交信号点的位置,在此基础上准确地提取各探针的杂交信号。网格定位是进行后续芯片分析的前提。而在基因芯片图像的采集中不可避免地会存在图像的旋转,图像存在倾斜角。倾斜角的角度判定及校正对后续的网格定位研究意义重大。

目前的网格定位方法中,文献[2]提出了基于数学形态学的方法,利用基因芯片图像在水平方向和竖直方向的投影信号,将二维图像分析问题转化为一维信号处理问题,完成网格定位。文献[3]对该方法做了进一步的改进,其中提到“这里所处理的图像均已经过一定的旋转处理”。所以这种方法只对无倾斜的图像才有效,对存在倾斜的图像的校正是该研究的前提。

文献[4]中采用变形模板匹配法,通过构造一个感兴趣物体的模板,将模板进行各种变形,包括位移、旋转、缩放。然后将变形模板与图像的对应区域比较,使模板与图像的匹配达到最佳。该方法在计算图像模板与图像相似度时计算量很大,因为模板旋转计算的时间复杂度和空间复杂度较大,相对于位移和缩放占主要计算量。所以对图像进行倾斜校正后,将避免模板的旋转匹配计算,大大减少该方法的计算量。

目前,基因芯片图像的研究已经取得一定进展,但如何更加有效地提高网格定位的精确度和速度非常值得研究。本文在前人研究的基础上提出基因芯片图像的倾斜校正,可以完善一些研究的前提条件,减少某些研究的算法计算量等等。

1 基因芯片图像的倾斜校正

本文在对基因芯片图像的倾斜校正时,包括三个步骤:

(1)通过水平投影信号将基因芯片图像进行行列分割;

(2)采用回归分析法,快速的对分割出的行列计算倾斜角及均值,进行初步的倾斜校正;

(3)重复(1),计算基因芯片行列子图像中样点的质心,对质心采取直线拟合的方法,完成精确的倾斜校正。

1.1 基于投影信号的基因芯片图像的行列分割

首先对基因芯片图像进行预处理,包括滤波、腐蚀、膨胀等数学形态学运算,滤除噪声,提高图像质量。然后对图像进行自适应阀值分割,将基因芯片图像变为二值图像,如图1(图像中包含10行、10列样点)。

图1 预处理后的图像

在对图像进行回归分析前,需要对图像进行行列分割,获得只包含单行或单列样点的子图像,据此估算各行(列)的倾斜角。本文采用投影方法,对二值图像f(x,y)沿水平方向计算投影信号,如图2。投影信号计算公式为

式中,n为图像f(x,y)的宽度。

投影信号图中具有波峰波谷特性,其中波谷代表了各行样点的行间隔。通过对投影信号进行曲线拟合,求出曲线的各个极小值,用其所代表的波谷位置来分割相邻的两行样点图像,最终分割出芯片阵列的行列子图像,如图3。这里,在对列的处理时,将图像旋转90°,转化为对行计算,简化计算,避免列的斜率为无穷大。

当图像倾斜角较大时(10°以上),无法直接根据投影信号的波峰波谷准确分割出行列子图像,如图4。将图像进行垂直分割,利用部分图像投影信号获得行列子图像(取图像的中间1/3部分,如图5),进而估算倾斜角,以便完成初步的倾斜校正。这种方法,虽然行列子图像的有效样点数量较少,倾斜角的估计准确性随之降低,但作为粗略的倾角估计仍是可行的。在根据估计出的倾角进行校正后,继续步骤(1)的行列投影,能够比较好的分割出行列的样点子图像,为下一步的精确倾角计算做准备。

1.2 基于回归分析的初步校正

回归泛指变量之间的一般数量关系,一元线性回归通过找到一条拟合直线,用直线上的点来代表散布图上所有相关点。满足“离差平方和最小”条件的直线使得回归直线与所有检测数据误差的平方和达到极小值[5]。一元线性回归方程的一般形式为

式中,表示是从回归直线上取得的与xi对应的yi的计算值;是拟和直线的截距;是拟和直线的斜率。离差δi为任一分析点(xi,yi)偏离回归直线纵坐标方向的距离。离差平方和为

回归直线应是所有直线中离差平方和最小的一条直线,根据极值原理,对斜率求偏导,并使之为零,解得

针对本文的行列二值图像,上式中n为文档图像中白色像素的个数,(xi,yi)表示每个白色像素点的x坐标和y坐标,i=1……n。倾斜角θ=tan-1(弧度)。这样,分别对行列子图像计算倾斜角及均值,按照平均倾斜角对图像进行初步校正。

本实验采用模拟的方法,将原基因芯片图像进行一定角度的旋转,然后按本文的方法进行倾斜校正,实验结果见表1。从表中结果可以看到,当倾斜角较小时(10°以下),该方法准确性较高;当倾斜角较大时,误差较大,需要进一步的精确校正。

表1 初步校正结果

值得注意的是,当图像的倾斜角较大时,比如表1中15°倾斜角,所分割出的行子图像中包含了相邻行的部分样点,对回归分析的倾斜角估计有较大影响,所以误差较大。

1.3 基于质心直线拟合的精确校正

经步骤(1)(2)后,原基因芯片图像完成初步倾斜校正,校正后的图像倾斜角一般较小。为了进一步的精确校正,再重复步骤(1),此处所获得行列分割子图像一般仅包含单个行列的样点,而相邻行列的样点不会被包含进入。为了更加精确地计算倾斜角,取各子图像中样点的质心(如图6),公式为

式中xi,yi为白色样点坐标。

采用直线拟合如图7,得到直线的斜率及倾斜角。对所有行列的倾斜角求均值,完成精确的倾斜校正。

对于表1中15°倾斜角经初步校正后,采用质心的直线拟合计算出倾斜角为6.9385°。

2 结 语

本文提出基因芯片图像中存在倾斜的问题,而对于网格定位,有些方法中倾斜校正是必要的前提,同时也会减少某些算法(如变形模板匹配法)的运算量。根据预处理后的基因芯片图像,运用行列分割子图像的回归分析,初步校正图像,继而完成质心直线拟合的精确校正。

[1]邢克礼,丁红军.基于MATLAB的基因芯片图像预处理[J].医疗卫生装备,2008(4):9-11.

[2]HIRATA J R,BARRERA J,HASHI MOTO R F,et al. Microarray gridding by mathematical morphology[C]. Proceedings of the 14th Brazilian Symposium on Computer Grahics and I mage Processing,Brazil,2001:112-119.

[3]胡园园,孙啸,何农跃,等.基于图像投影的基因芯片图像网格定位[J].生物医学工程学杂志,2005,22 (4):668-671.

[4]李兴珊,孙啸,袁春伟.基于遗传算法的基因芯片图像网格定位[J].生物物理学报,2002(2):223-226.

[5]孔祥玲.直线回归分析及其数据控制评定[J].计量与测试技术,2007(10):15-17.

A Gene-chip Image Tilt Correction Approach Based on Regression Analysis
MA Shua i-ying

(Modern Educational Technology Center,Dalian NationalitiesUniversity,Dalian Liaoning 116605,China)

Gene-chip image tilt correction isof great significance to i mage analysis.We divided the gene-chip image into rows and columns by projection signals,before using regression analysis to preli minarily correcting sub-images that each includes a single row(or column)of sample points.We finally performed linear fittingwith the centroids of the sample points to complete precise correction.The experiment showed that thismethod has a high accuracy of tilt correction for gene-chip images alongwith a simple and easy-to-use algorithm.

gene-chip image;projection signal;regression analysis;tilt correction

TP391

A

1009-315X(2010)01-0065-03

2009-06-12

马帅营(1980-),男,河南洛阳人,助工,主要从事神经网络、模式识别等研究。

(责任编辑 刘敏)

猜你喜欢

行列基因芯片倾斜角
用“行列排除法”解四宫数独(2)
用“行列排除法”解四宫数独(1)
出生时即可预判发育潜力 基因芯片精准筛选肉牛良种
以“倾斜角与斜角”为例谈概念教学
单层小波分解下图像行列压缩感知选择算法
开缝圆柱缝隙倾斜角对脱落涡的影响
双管单色荧光PCR法与基因芯片法检测CYP2C19基因多态性的比较研究
应用基因芯片技术检测四种结核药物敏感试验的研究
基于提升小波的基因芯片数据的分类预测
倾斜角对蜂窝结构等效介电常数影响分析