基于计算机视觉算法的图像处理技术的研究
2019-11-07陈宏君谢建民
陈宏君 谢建民
(湖南交通工程学院,湖南 衡阳 421009)
在过去,传统的二维环境中物体只能显示侧面投影,随着科技的发展,人们创造出三维立体画面,并将其作为新型显示技术。文章通过设计一种真三维显示计算机视觉系统,提出计算机视觉算法对物体投影过程中畸变图像的矫正。这种图像处理技术与过去的BP 神经网络相比,其矫正精度更高,可以被广泛应用于图像处理。
一、计算机图像处理技术
1、基本含义
利用计算机处理图像需要对图像进行解析与加工,从中得到所需要的目标图像。图像处理技术应用时主要包含以下两个过程:(1)转化要处理的图像,将图像变成计算机系统支持识别的数据,再将数据存储到计算机中,方便进行接下来的图像处理。(2)将存储在计算机中的图像数据采用不同方式与计算方法,进行图像格式转化与数据处理。
2、图像类别
计算机图像处理中,图像的类别主要有以下几种:(1)模拟图像。这种图像在生活中很常见,有光学图像和摄影图像,摄影图像就是胶片照相机中的相片。计算机图像中模拟图像传输时十分快捷,但是精密度较低,应用起来不够灵活。(2)数字化图像。数字化图像是信息技术与数字化技术发展的产物,随着互联网信息技术的发展,图像已经走向数字化。与模拟图像相比,数字化图像精密度更高,且处理起来十分灵活,是人们当前常见的图像种类。
3、技术特点
分析图像处理技术的特点,具体如下:(1)图像处理技术的精密度更高。随着社会经济的发展与技术的推动,网络技术与信息技术被广泛应用于各个行业,特别是图像处理方面,人们可以将图像数字化,最终得到二维数组。该二维数组在一定设备支持下可以对图像进行数字化处理,使二维数组发生任意大小的变化。人们使用扫描设备能够将像素灰度等级量化,灰度能够得到16 位以上,从而提高技术精密度,满足人们对图像处理的需求。
(2)计算机图像处理技术具有良好的再现性。人们对图像的要求很简单,只是希望图像可以还原真实场景,让照片与现实更加贴近。过去的模拟图像处理方式会使图像质量降低,再现性不理想。应用图像处理技术后,数字化图像能够更加精准的反映原图,甚至处理后的数字化图像可以保持原来的品质。此外,计算机图像处理技术能够科学保存图像、复制图像、传输图像,且不影响原有图像质量,有着较高的再现性。
(3)计算机图像处理技术应用范围广。不同格式的图像有着不同的处理方式,与传统模拟图像处理相比,该技术可以对不同信息源图像进行处理,不管是光图像、波普图像,还是显微镜图像与遥感图像,甚至是航空图片也能够在数字编码设备的应用下成为二维数组图像。因此,计算机图像处理技术应用范围叫广,无论是哪一种信息源都可以将其数字化处理,并存入计算机系统中,在计算机信息技术的应用下处理图像数据,从而满足人们对现代生活的需求。
二、计算机视觉显示系统设计
1、光场重构
真三维立体显示与二维像素相对应比较,真三维可以将三维数据场内每一个点都在立体空间内成像。成像点就是三维成像的体素点,一系列体素点构成了真三维立体图像,应用光学引擎与机械运动的方式可以将光场重构。阐述该技术的原理,可以使用五维光场函数去分析三维立体空间内的光场函数,即,F:L∈R5→I∈R3,L=[x,y,z,],这是五维光场函数中空间点的三维坐标和坐标下方向,而代表的是该数字化图像颜色信息。当三维图像模型与纹理能够由离散点集表示,离散点集如下:。代表的是空间点内的位置与颜色。图(1)为该计算机视觉算法下,光场的传播情况。
图1:光场传播图
接下来,可以对点集L 中的h 深度子集进行光场三维重构。将点集按照深度进行划分,最终可以划分成多个子集,任意一个子集都可以利用散射屏幕与二维投影形成光场重构,且这种重构后的图像是三维状态的。经过研究表明,应用二维投影技术可以对切片图像实现重构,且该技术实现的高速旋转状态,重构的图像也属于三维光场范围。
2、显示系统设计
本文以计算机视觉算法为基础,阐述图像处理技术。技术实现过程中需要应用ARM 处理装置,在该装置的智能交互作用下实现真三维显示系统,人们可以从各个角度观看成像。真三维显示系统中,成像的分辨率很高,体素能够达到30M。与过去的旋转式LED 点阵体三维相比,这种柱形状态的成像方式虽然可以重构三维光场,但是该成像视场角不大,分辨率也不高。
图(2)为真三维立体显示框图的基本信息,人们在三维环境中拍摄物体,需要以三维为基础展示物体,然后将投影后的物体成像序列存储在SDRAM 内。应用FPGA 视频采集技术,在技术的支持下将图像序列传导入ARM 处理装置内,完成对图像的切片处理,图像数据信息进入DVI 视频接口,并在DMD 控制设备的处理后,图像信息进入高速投影机。经过一系列操作,最终DLP 可以将数字化图像朝着散射屏的背面实现投影。想要实现图像信息的高速旋转,需要应用伺服电机,在电机的驱动下,转速传感器可以探测到转台的角度和速度,并将探测到的信号传递到控制器中,形成对转台的闭环式控制。
当伺服电机运动在高速旋转环境中,设备也会将采集装置位置信息同步,DVI 信号输出帧频,控制器产生编码,这个编码就是DVI 帧频信号。这样做可以确保散射屏与数字化图像投影之间拥有同步性,图(3)为本次基于计算机视觉算法设计出的智能交互真三维显示装置。根据图中的信息得知,该智能交互真三维显示装置由转台和散射屏构成,其中还有伺服电机、采集设备、高速旋转投影机、控制器与ARM 处理装置,此外还包括体态摄像头组与电容屏等其他部分。
图2:真三维立体显示
图3:智能交互真三维显示装置
图片中,序号1 为玻璃罩,上方有体态摄像头装置;序号2 是半透半反屏;序号3 是上转台;序号4 是高速投影机;序号5 是电动机;序号6 是传感器装置和传到结构;序号7 与8为电源与转台;序号9 是连接轴承;序号10、11 为底座和吸光板;序号12 为传感器;13 为另一个电动机;14 为ARM 处理装置;15 和16 为SD 卡卡槽和视频采集系统。该装置拥有较强的人机交互功能,图像成像之后有着较高的分辨力,帧频最高可以达到104 级fps。
三、图像畸变矫正算法
1、畸变矫正过程
在计算机视觉算法应用下,人们可以应用计算机处理畸变图像。当投影设备对图像垂直投影时,随着视场的变化,其成像垂轴的放大率也会发生变化,这种变化会让智能交互真三维显示装置中的半透半反屏像素点发生偏移,如果偏移程度过大,图像就会发生畸变。因此,人们需要采用计算机图像处理技术将畸变后的图像进行校正。由于图像发生了几何变形,就要基于图像畸变校正算法对图片进行几何校正,从发生畸变图像中尽可能消除畸变,且将图像还原到原有状态。这种处理技术就是将畸变后的图像在几何校正中消除几何畸变。投影设备中主要有径向畸变和切向畸变两种,但是切向畸变在图像畸变方面影响程度不高,因此人们在研究图像畸变算法时会将其忽略,主要以径向畸变为主。
径向畸变又有桶型畸变和枕型畸变两种,投影设备产生图像的径向畸变最多的是桶型畸变。对于这种畸变的光学系统,其空间直线在图像空间中,除了对称中心是直线以外,其他的都不是直线。人们进行图像矫正处理时,需要找到对称中心,然后开始应用计算机视觉算法进行图像的畸变矫正。
正常情况下,图像畸变都是因为空间状态的扭曲而产生畸变,也被人们称之为曲线畸变。过去人们使用二次多项式矩阵解对畸变系数加以掌握,但是一旦遇到情况复杂的图像畸变,这种方式也无法准确描述。如果多项式次数更高,那么畸变处理就需要更大矩阵的逆,不利于接下来的编程分析与求解计算。随后人们提出了在BP 神经网络基础上的畸变矫正方式,其精度有所提高。本文以计算机视觉算法为基础,将该畸变矫正方式进行深化,提出了卷积神经网络畸变图像处理技术。与之前的BP 神经网络图像处理技术相比,其权值共享网络结构和生物神经网络很相似,有效降低了网络模型的难度和复杂程度,也减少权值数量,提高了畸变图像的识别能力和泛化能力。
2、畸变图像处理
作为人工神经网络的一种,卷积神经网络可以使图像处理技术更好的实现。卷积神经网络有着良好的稀疏连接性和权值共享行,其训练方式比较简单,学习难度不大,这种连接方式更加适合用于畸变图像的处理。畸变图像处理中,网络输入以多维图像输入为主,图像可以直接穿入到网络中,无需向过去的识别算法那样重新提取图像数据。不仅如此,在卷积神经网络权值共享下的计算机视觉算法能够减少训练参数,在控制容量的同时,保证图像处理拥有良好的泛化能力。
如果某个数字化图像的分辨率为227×227,将其均值相减之后,神经网络中拥有两个全连接层与五个卷积层。将图像信息转化为符合卷积神经网络计算的状态,卷积神经网络也需要将分辨率设置为227×227.由于图像可能存在几何畸变,考虑可能出现的集中变形形式,按照检测窗比例情况,将其裁剪为特定大小。
四、基于计算机视觉算法图像处理技术的程序实现
基于上述文中提到的计算机视觉算法,对畸变图像模型加以确定。本文提出的图像处理技术程序实现应用到了Matlab 软件,选择图像处理样本时以1000 幅畸变和标准图像组为主。应用了系统内置Deep Learning 工具包,撰写了基于畸变图像算法的图像处理与矫正程序,矫正时将图像每一点在畸变图像中映射,然后使用灰度差值确定灰度值。这种图像处理方法有着低通滤波特点,图像矫正的精度比较高,不会有明显的灰度缺点存在。因此,应用双线性插值法,在图像畸变点周围四个灰度值计算畸变点灰度情况。
当图像受到几何畸变后,可以按照上文提到的计算机视觉算法输入CNN 模型,再科学设置卷积与降采样层数量、卷积核大小、降采样降幅,设置后根据卷积神经网络的内容选择输出位置。根据灰度差值中双线性插值算法,进一步确定畸变图像点位灰度值。随后,对每一个图像畸变点都采用这种方式操作,不断重复,直到将所有的畸变点处理完毕,最终就能够在画面中得到矫正之后的完整图像。
为了尽可能的降低卷积神经网络运算的难度,降低图像处理时间,建议将畸变矫正图像算法分为两部分。第一部分为CNN 模型处理,第二部分为实施矫正参数计算。在校正过程中需要提前建立查找表,并以此作为常数表格,将其存在足够大的空间内,根据已经输入的畸变图像,按照像素实际情况查找表格,结合表格中的数据信息,按照对应的灰度值,将其替换成当前灰度值即可完成图像处理与畸变校正。不仅如此,还可以在卷积神经网络计算机算法初始化阶段,根据位置映射表完成图像的CMM 模型建立,在模型中进行畸变处理,然后系统生成查找表。按照以上方式进行相同操作,计算对应的灰度值,再将当前的灰度值进行替换,当所有畸变点的灰度值都替换完毕后,该畸变图像就完成了实时畸变矫正,其精准度较高,难度较小。
总结:总而言之,随着网络技术与信息技术的日渐普及,传统的模拟图像已经被数字化图像取代,人们享受数字化图像的高清晰度与真实度,但对于图像畸变问题,还需要进一步研究图像的畸变矫正方法。在计算机视觉计算基础上,本文采用卷积神经网络进行图像畸变计算,按照合理的灰度值计算,有效提高了图像的清晰度,并完成了图像的几何畸变矫正。