唐卡图像纹理复杂性量化分析
2018-11-29张春玉
张春玉
(1.西藏民族大学信息工程学院,咸阳 712082;2.西藏光信息处理与可视化技术重点实验室,咸阳 712082)
0 引言
纹理特征是图像的重要特征之一,图像纹理特征分析已经成为数字图像邻域研究的热点,大量学者对此展开了研究。讨论图像纹理复杂性也是信息隐藏技术研究的重要内容之一,文献[1-5]通过找出纹理复杂区域提高信息隐藏的透明性、隐藏量和鲁棒性,从而改善隐藏算法性能。
纹理一词没有正式的定义[6],从计算机图形学的角度讲,纹理既包括通常意义上物体表面的纹理,即使物体表面呈现凹凸不平的沟纹,同时也包括在物体的光滑表面上的彩色图案,通常更多地称之为花纹。从数字图像处理的角度看,纹理提供了对诸如平滑度、粗糙度和规律性等特性的度量。通常主要使用统计方法、结构化方法和频谱方法。统计方法指诸如平滑、粗糙、粒状等纹理描述。结构化技术处理图像元的排列,诸如基于均匀空间分布的平行线纹理描述。频谱技术基于傅里叶频谱特性,主要用于通过识别频谱中高能量的窄波峰寻找图像中整体周期性。
信息隐藏技术领域讨论图像纹理复杂性是为了找出载体图像中最有利于嵌入秘密信息的区域,使得在该区域嵌入秘密信息后的含密图像其透明性、鲁棒性和隐藏容量等性能达到最优。通常按图像像素之间变化快慢即图像像素值变化幅度(梯度)大小,把图像区域分为纹理区和平滑区,纹理区为像素值变化幅度较大的区域,平滑区为像素值变化幅度小的区域。根据人类视觉特征(HVS),平滑区嵌入信息容易引起图像较大变动而被觉察,纹理区嵌入信息则不宜被察觉,有较好的透明性[7]。纹理区中像素值变化幅度很大的区域本文称为强边缘区,这部分容易通过有损压缩或滤波等处理被去掉,鲁棒性差,也不适合嵌入信息。人们总是在平滑区、纹理区和强边缘区域中寻找折中的方法,既保证很好的透明性又能达到较好的鲁棒性。所以,讨论图像纹理复杂性是信息隐藏领域非常重要的研究内容。
本文在唐卡图像信息安全研究中发现,唐卡图像纹理复杂性明显高于一般图像,本文所指的一般图像是指描述大自然、人物、生活场景等客观世界的非唐卡类图像。文献[8-9]中均有唐卡图像具有纹理复杂或纹理丰富的特征等表述语句,但迄今为止,没有文献用量化的方法证明唐卡图像纹理较一般图像更复杂。本文分别用灰度级直方图统计距和8邻域灰度差值法对唐卡图像和一般图像进行对比实验,用量化方法证明了唐卡图像纹理复杂性比一般图像更高。
1 灰度级直方图统计距
令z为一个代表灰度级的随机变量,并令p(zi),i=0,1,2,3…,L-1,为对应的直方图,其中L是可区分的灰度级数目,m是z的均值(平均灰度级)。则关于z的均值的第n阶距为[10]:
由式(1)计算的直方图的各阶距中,u2也叫方差,是对灰度对比度的度量,可描述直方图的相对平滑程度;u3表示直方图的偏斜度,一般对确定直方图的对称性和是否向左或向右倾斜较有用;u4描述了直方图的相对平坦性[6]。
常用的纹理统计度量有:
(1)均值:(2)标准差:
(3)平滑度:
(4)三阶矩u3:该度量通常用(L-1)2来归一化。
(5)一致性:
(6)熵:
以上统计度量中,均值表示平均灰度,反映图像整体的亮暗,无法刻画纹理的复杂度。标准差可以描述图像灰度级上的变化程度,能清晰的表现纹理的复杂程度。平滑度反映图像灰度的均匀性,和标准差所衡量的本质是相同的,方差(标准差)值越小,平滑度值越小。一致性度量在图像所有像素灰度级相同时达到最大值1,纹理复杂度高的图像一致性度量值较低。熵反映像素的随机性,熵值变化与一致性度量相反,纹理复杂度越高在灰度级上的变化越大,熵值越大;反之,一幅灰度级无变化的图像其熵值为0。
本文采用标准差、平滑度、一致性和熵这四个统计度量来分别计算唐卡图像和一般图像的纹理复杂度。
2 8邻域灰度差值法
用直方图统计距计算纹理的方法有其局限性,因为直方图不具有图像像素之间相对位置的信息,无法表示出局部像素间相对变化剧烈程度。故本文对图像每个像素点计算其与8邻域像素的灰度差值之和,来衡量该像素点与其8邻域像素点相比较的相对变换程度。一幅图像所有像素点的8邻域灰度差值的平均值能更好地反映该幅图像的纹理复杂度。
设任一像素点 px,y的坐标为(x,y),则其8邻域像素点分别为:px-1,y-1,px-1,y,px-1,y+1,px,y-1,px,y+1,px+1,y-1,px+1,y,px+1,y+1。
定义像素px,y的8邻域纹理函数为:
则一幅m×n的图像8邻域灰度差值平均纹理复杂度为:
3 实验结果和分析
3.1 灰度级直方图统计距实验和分析
分别用式(3)、式(4)、式(5)、式(6)等 4个统计距计算唐卡图像和一般图像的标准差、平滑度、一致性和熵。对RGB模式的彩色图像,分别计算其R、G、B分量的直方图统计距,然后求其平均值。本文实验中使用的唐卡图像来自西北民族大学中国民族信息技术研究院的唐卡图像数据库,该数据库中共有5277张彩色唐卡图像,存在少部分重复图像。本文实验使用的一般图像来自COCO数据集,该图像库中共有5000张无重复的彩色图像,不含唐卡图像。
实验结果如表1所示。结果表明,唐卡图像纹理复杂度的统计距计算结果比一般图像的更集中,故其平均值更具代表性。标准差值显示,唐卡图像在灰度级上的可变性比一般图像更大;平滑度值表明唐卡图像比一般图像更粗糙;一致性度量表明唐卡图像基于直方图的一致性更差一些;熵值亦表明唐卡图像在灰度级上变化更大。四个度量指标均证明唐卡图像比一般图像更粗糙、纹理复杂度更高。
表1 唐卡图像和一般图像的直方图统计距实验结果
3.2 8邻域灰度差值法实验和分析
用式(7)定义的纹理函数和式(8)计算图像8邻域像素差值平均纹理复杂度,分别用3.1小节中的两个图像库进行实验。计算图像的边界行和边界列的像素点8邻域纹理函数时,将其不存在的8邻域像素点值置为0。RGB模式的彩色图像亦采用3.1中的方法,分别计算其R、G、B分量矩阵,最后取其平均值。实验结果如表2所示,唐卡图像基于8邻域像素差值的平均纹理复杂度远大于一般图像,像素点与其8邻域像素值之间的变化更剧烈,其纹理复杂度更高。
表2 8邻域像素差值法实验结果
4 结语
综上所述,基于灰度级直方图统计距的方法和基于局部特征的8邻域像素灰度差值法的实验结果均表明,唐卡图像纹理复杂度均高于一般图像。由于8邻域像素差值方法刻画了像素与其8邻域像素的局部变化特征,描述图像局部像素间相对变化剧烈程度,能更好的表征信息隐藏技术领域中关于纹理复杂性的度量。此外,本文首次用量化方法证明了唐卡图像纹理复杂度高于一般图像。