基于字典学习的古建筑图像修复研究*

2016-12-22秦振涛杨武年

电子技术应用 2016年12期

关键词：字典古建筑图纸

杨茹，秦振涛，杨武年

（1.攀枝花学院数学与计算机学院，四川攀枝花 617000；2.成都理工大学地学空间信息技术国土资源部重点实验室，四川成都610059)

基于字典学习的古建筑图像修复研究*

杨茹1，秦振涛1，杨武年2

（1.攀枝花学院数学与计算机学院，四川攀枝花 617000；2.成都理工大学地学空间信息技术国土资源部重点实验室，四川成都610059)

古代建筑图纸是我国重要的民族瑰宝，亟待利用现代计算机技术对古代建筑图纸进行信息化和修复。提出了一种新的基于字典学习的古建筑图像修复模型，通过K-svd算法进行字典学习，在稀疏域利用已知像素信息填充缺损像素，从而实现对古建筑图像的修复及噪声的滤除。实验表明，该算法能较好地修复古建筑图像，降低图像的均方误差，在实际应用中具有良好的可行性和应用前景。

稀疏表示；古代建筑图纸；字典学习；图像修复

0 引言

古代建筑图纸能够反映古人对建筑独特的认识与理解，不仅具有极高的历史价值、文化价值和科学价值，同时也是现代仿古建筑、园林景观和旅游景区的重要借鉴[1]。建筑图纸的质地、图形、字体及涂料具有多样性，需要特别的保护。当前，在实际的工作环境中，大部分建筑图纸以卷宗的形式进行保存，随着时间的变迁，建筑图纸的缺损非常严重，且在扫描、微缩处理中，图纸的像素丢失严重。对建筑图纸进行修复、评估及再利用，一直作为建筑学科及计算机图像处理等领域的研究热点而受到关注[2]。僛文峰等人指出图纸的破损主要是由于图纸质地的酸性化而变黄、发干,以及随之而来的粉碎和撕毁情况比较严重；由于时间久远，图纸质地及颜料也会出现不同程度的缺损、黄色斑点等破损；在对古建筑图纸进行信息化加工的过程中也会造成像素的丢失，出现黑色斑点等。本文针对扫描及微缩以后的古建筑图像提出一种新的基于字典学习的修复方法，该算法在稀疏域针对污损图像的特迭代处理，从而达到古建筑图纸修复的目的。通过实验表明，该算法能较好地修复古建筑图像，降低了图像的均方误差，在实际应用中具有良好的前景。

1 古建筑图像修复模型

1.1 基于稀疏表示的古建筑图像处理模型

在图像处理领域[3]，任一理想的古建筑图像可以表示为y0∈RN，稀疏表示的目标是找到一个稀疏表示向量x0，且 x0的 0范数||x0||0=k0，满足：y0=Ax0。A为字典，B为图像退化算子，表示图像丢失掉的p个采样，则：y= By0。B表示单位矩阵(大小为：n×n)根据丢失掉的（缺损）采样去除p行后的矩阵，其大小为(n-p)×n，则古建筑图像修复问题就转化为求其稀疏表示向量，进而获得未降质图像y0=BA，则可以建模为式(1)[4]：

当测量或者图像本身存在缺损时，该模型转化为式(2)的问题：

1.2 对模型的求解

该问题中由于原始古建筑图像y0未知，且古建筑图像一般较大，存在多种类型的缺损，因此需要对大的图像进行分块。根据给定的字典A，将大的图像分割成一些小的块后，每个块都有其稀疏表示系数，降质操作B为一矩阵，根据Elad等人的原理，该问题属于M-稀疏域模型，则可以转化如下最大后验概率问题[5]：

在该模型中，表达式第一项总体上衡量降质图像y和恢复图像z之间的相似程度，第二项和第三项是古建筑图像的先验模型，用来确保恢复图像z中的大小为的每一块pk在其正确位置有界，且误差最小。系数uij在位置上需要相互独立，即需满足。

假设字典A已知，则该模型中存在2个未知量，分别是每个位置的稀疏表示向量qk和整体输出图像z。为了求解该问题，本文采用块坐标下降算法求解该问题。通过初始化z=BTy，然后迭代求得最优。由于在古建筑图像z中存在大量缺损像素，因此需要考虑，从而将该问题转化为了求解式(4)的问题：

式中，σ为噪声方差，c为常数，nk为阈值。当误差项小于cnkσ2时停止迭代，通过此方法也能得到 uij。该滑动窗口稀疏编码法，图像块的错误能量表示为Aq-pk，可以通过图像块中现有的像素进行估计，即第k块的局部污损可以表示为：，根据式(2)每次对大小为的图像进行处理，得到全部uk后再更新z。根据式(3)，对给定的固定，通过固定，然后更新 z，即需要求解式(5)的问题：

下一部分获得该模型中字典A的求解，通过式(5)能够获得输出图像，对丢失掉的像素，通过块中已知像素进行平均获得。

2 字典学习算法

字典学习过程一般分为2个阶段，分别是稀疏编码及字典更新。在对式(5)求解时，一般假设字典 A∈Rn×k(k>n)为已知，如DCT、DWT和FFT等。为了进一步提高修复古建筑图像的修复能力，本文分别通过MOD算法和K-SVD算法进行字典学习，在字典学习过程中需考虑缺损像素。因此，一旦获得字典，就可以完成稀疏编码，然后固定系数，再更新字典，从而转化为求式(6)错误的最小值：

2.1 MOD字典学习算法

MOD算法（Method of Optimal Direction）也称为最优方向法[6]，该算法由 K.Engan等人在1999年提出,通过对错误求导，然后令其为0，则可得：

利用 Kronecker内积公式(ABC=(CT⊗A)Bc)，对式(7)进行进一步分解，可得：

2.2 改进的K-SVD字典学习算法

本文根据缺损的古建筑图像进行K-SVD字典学习，利用K-SVD算法[7]每次更新字典 A的一列，对字典的第j列aj，根据式(6)，仅有第k块用到了这个原子，将其表示为域 Pk，则可将式(6)进行如下转化：

对该问题的求解，首先固定{qk(j)}k∈P，然后更新字典aj，即：

然后固定字典，更新系数qk(j)，从而得到修复后的图像块：

将图像块合并后输出即可获得最终修复图像，经过字典学习后获得的MOD字典及K-SVD字典如图1和图2所示。由图可见，K-SVD字典包含了缺损图像形变区的原子，表明K-SVD字典能够根据图像的特点进行自适应调整，从而保留更多的细节和边缘信息，更加有利于后续的处理。

图1 MOD字典

图2 K-SVD字典

2.3 算法分析

该算法的计算复杂度可以分为两部分：稀疏编码、字典更新（迭代J次）与最终的输出过程构成。古建筑图像中的每个像素点的计算复杂度为：O(K×L×J)，其中，K为字典的列向量的个数，L为每个系数的非零元素的个数，一般取决于古建筑图像的噪声的方差和缺损像素的个数。

3 模拟实验

对本文提出算法的性能进行测试，实验用古建筑图像称为重檐四角亭，来源于成都理工大学；图像的大小为256×256。实验所使用的PC是 CPU 3.0 GHz，内存为2 GB，算法用GNUOctave进行实现。图3分别为加噪20 dB后，损失50%像素后的原始古建筑图像，以及采用MOD字典学习算法的修复结果和采用K-SVD字典学习算法的修复结果图。设置字典原子的个数为256，图像块大小为8×8。图4为随着迭代次数的增加，MOD字典学习算法和K-SVD字典学习算法的修复效果对比图。表1为采用MOD字典学习算法和K-SVD字典学习算法迭代15次后所获得的RMSE(均方根误差)。由图3可见，采用K-SVD算法修复的效果明显优于采用MOD算法修复的效果，尤其是右上角塔顶处的局部放大图所示。

图3 不同程度缺损的重檐四角亭图像修复结果

表1 不同算法的修复结果PSNR (单位：dB)

本实验中运用K-SVD字典学习算法实现了对古建筑图像的修复，由图4可见，K-SVD字典学习算法的修复效果优于MOD字典学习算法，且 K-SVD算法的鲁棒性更强。

图4 修复效果对比图

4 结论

本文通过对缺损古建筑图像问题进行建模，然后利用字典学习算法实现对缺损图像的修复。通过对重檐四角亭古建筑图像进行修复试验，表明K-SVD字典学习算法具有更优的效果。本文利用机器学习及图像处理技术对解决古建筑图纸、古文献修复等问题提出了新的思路，对该算法的优化和应用的拓展是下一步研究的重点。

[1]王茹.古建筑数字化及三维建模关键技术研究[D].西安：西北大学，2010.

[2]李四明.工程图纸输入与自动识别系统的研究[D].北京：中国农业大学，2000.

[3]N Metaxas D，AXEL L.Recent novel methods and approaches in sparsity-based compressive sensing and sparse learning have shown promising results.Introduction[J].Med Image Anal，2014，18(6)：819.

[4]ELDAR Y C.Compressed sensing：theory and applications[M].Cambridge University Press，2012：556.

[5]ELAD M，AHARON M.Image denoising via sparse and redundant representations over learned dictionaries[J].IEEE Transactions Image Process，2006，15(12)：3736-3745.

[6]OLSHAUSEN B A，FIELD D J.Sparse coding with an overcomplete basis set:a strategy employed by V1[J].Vision Research，1997，37(23)：3311-3325.

[7]RUBINSTEIN R，PELEG T，ELAD M.Analysis K-SVD：a dictionary-learning algorithm for the analysis sparse model[J].IEEE Transactions on Signal Processing，2013，61(3)：661-677.

Study on inpainting of drawings of ancient buildings based on dictionary learning

Yang Ru1，Qin Zhentao1，Yang Wunian2
(1.School of Mathematics and Computer Science，Panzhihua College，Panzhihua 617000，China；2.Key Laboratory of Geo-special Information Technology，Ministry of Land and Resources，Chengdu University of Technology，Chengdu 610059，China)

Drawings of ancient buildings are tenures of traditional Chinese culture,and need to be informatization and inpainting urgently.A novel model of inpainting the drawings of ancient buildings is proposed,which carry on the dictionary learning by K-svd algorithm,and filling missing pixels by known pixels in sparse domain，so as to implement the inpainting of drawings of ancient buildings and remove impulsive noise.The experimental results show that the algorithm can inpaint the image more effectively and decrease the RMSE,this method has better performance than other dictionary learning algorithm,and has good application potential and good application prospects.

sparse representation；drawings of ancient buildings；dictionary learning；inpainting of drawings

TN911

10.16157/j.issn.0258-7998.2016.12.013

杨茹，秦振涛，杨武年.基于字典学习的古建筑图像修复研究[J].电子技术应用，2016，42(12)：51-53，57.

英文引用格式：Yang Ru，Qin Zhentao，Yang Wunian.Study on inpainting of drawings of ancient buildings based on dictionary learning[J].Application of Electronic Technique，2016，42(12)：51-53，57.

2016-07-02)

杨茹（1984-），女，硕士，讲师，主要研究方向：古建筑图纸修复、计算机应用。

国家自然科学基金资助项目（41372340）；高等学校博士学科点专项科研基金(20105122110006）；国土资源部地学空间信息技术重点实验室开放基金资助项目(KLGSIT2014-03)

秦振涛（1982-），男，博士，副教授，主要研究方向：人工智能、遥感图像处理。