APP下载

基于提升计算机文档碎片拼接复原技术算法优化探析

2019-10-15陈实长沙医学院

数码世界 2019年10期
关键词:复原基准灰度

陈实 长沙医学院

引言

随着信息化技术的不断发展进步,计算机在我们日常生活中得到了广泛应用,在运用计算机技术进行碎片拼接复原的过程中,一般的原理是利用碎纸片二维化的特征进行匹配。在对碎纸片进行拼接复原的过程中,可以运用现代先进的技术进行拼接复原工作,从而能够提高碎片拼接复原的工作效率。

1、符号说明

2、问题分析及模型建立

2.1 针对仅纵切图片的拼接

2.1.1 问题分析

在文件出现破碎的时候,其破碎的方式是纵切的情况下,文件的碎片切割线上的信息量相对来说对比较充足的时候,通过运用边缘线灰度矩阵之间的欧氏距离进行碎拼的拼接工作。

2.1.2 模型建立

在运用MATLAB 软件生成碎片的灰度矩阵的过程中,碎片的数量是在19 片的情况下,其灰度矩阵是:

其次,我们有建立了目标函数,其公式为:

算法为:

(1)我们首先需要找出文件的基准碎片,其公式为:

一般情况下,对文件进行打印的过程中,文件中会存留一定的页面边距。在找取第一张基准碎片的过程中,可以根据文件纵切碎片的特点来利用文件破碎左侧的空白来进行第一张基准碎片的找取。在空白部分会生成一定的灰度矩阵,其空白处灰度矩阵的元素是最大的,数值为255。因此,我们可以采取每一个碎片的最左侧一列,来对这些碎片的矩阵元素进行求和,其中求和最大值的碎片就是我们所需要的,其公式为:

通过公式的计算,我们可以得到基准碎片的序号,其序号为9。

(2)我们还需要找出文件的后续碎片,其公式为:

在对文件后续碎片进行找取的过程中,其文件相邻碎片的碎片边缘是非常相似的,并且他们的灰度矩阵基本上也是一样的。因此,我们需要根据基准碎片的特点来进行后续碎片的查找,将剩余碎片的灰度矩阵与基准碎片的灰度矩阵进行对比,其相似值越高,碎片的匹配程度就越高。在对碎片进行匹配的过程中,其运用碎片匹配的方式是欧式距离法。

在数学中,欧几里得距离是欧几里得空间中两个直线之间点的距离。在运用这个距离的过程中,把欧式空间称作度量空间。在进行实验的过程中,来辨识欧式距离的方式是运用文件碎片边缘的相似程度,其欧氏距离就是代表碎片边缘的相似程度,因此,距离越短,碎片的匹配程度越高。我们在运用欧时力局公式来计算碎片边缘相似程度的过程中,在对碎片左右两个列向量相对应灰度矩阵的距离来求取平方差之和的过程中,需要满足下列公式:

其碎片灰度矩阵的匹配结果是:8、14、12、15、3、10、2、16、1、4、5、9、13、18、11、7、17、0、6。

2.2 针对横纵向切割图片的拼接

2.2.1 问题分析

在文件破碎的过程中,其破碎的方式为横向切割和纵向切割,因此我们得到碎片的信息量是非常少的。在我们对文件纵切模型进行匹配的过程中,得到的匹配结果是非常混乱的。因此我们首先需要对文件破碎的碎片进行分类工作,然后再对文件碎片进行拼接工作,从而能够提高碎片拼接的工作效率。

2.2.2 模型建立

在建立文件纵切模型的过程中,首先需要对纵切模型的基准碎片进行分类。在选取碎片左侧灰度矩阵的过程中,可以利用文件打印的规律进行选取,其中左侧的前10列灰度矩阵的数值是为255的碎片,这些碎片就是文件的基准碎片,我可以得出基准碎片的第一列的编号是168、125、094、089、071、061、049、038、029、014、007。在对这些基准碎片进行匹配的过程中,其运用的匹配方式是格线匹配。

其次,我们需要对文件剩余的碎片进行分类,按照基准碎片进行分类的情况下,可以将剩余碎片分为11 类。通常情况系啊,请我们对文字进行打印的过程中,打印的方式都是文字会在同一水平线,因此,我们需要对文字的上下框线进行划出,从而能够提升碎片匹配的准确度。

在对剩余碎片的灰度矩阵进行行求和的过程中,碎片的数量是209 的情况下,在对和进行行记的过程中,分为了1 和0,其将碎片灰度矩阵和为19*255=4854 的行记为1,其余碎片灰度矩阵的行记为0,这样我们就可以对全部碎片灰度矩阵的格线位置进行记录。

然后在制定基准碎片格线高度标准的过程中,是以11 张的基准碎片来作为基准,将文件的图片分为了11 行。在对每一行碎片进行横向拼接的过程中,其运用的方式是欧氏距离进行碎片的拼接工作。但是,碎片边缘的信息量是比较少的,在进行碎片匹配的过程中,会出现碎片乱序的现象。因此,我们需要对文件最右侧的一列碎片进行提取工作,以最右侧碎片来作为基准,在此运用欧氏距离的方式进行碎片的匹配工资,对这两次的结果进行有效的结合,在运用人工对碎片的位置进行调整,就会得到一个完整的碎片行。最后,我们还需要对完整成行的碎片进行拼接工作。在确定基准碎片的过程中,是以提取11张碎片边缘灰度矩阵的首行碎片来作为基准,在进行拼接的过程中,是利用欧式距离的方式将11 张碎片的完全匹配拼接工作,从而就能得到一个完整的文件,就完成了文件复原的工作。

3、模型分析

3.1 模型优点

(1)文件碎片的模型整体的结构较为简单,容易操作;

(2)在对碎片模型中每一个元素的特点值进行加强的过程中,可以运用碎片分类的方式来进行整合,提高碎片匹配的准确度,促进文件复原工作的顺利。

碎片模型

(3)文件碎片模型的基础性较强,有利于模型的推广工作。其模型的总体思路是根据每一个碎片特点的数值来进行分类工作,能够对大范围文件的拼接工作进行转化,转化为小范围拼接的筛选,在一定程度上降低了碎片匹配工作的难度。在问题变得更复杂的时候,我们可以运用碎片其他的特点值进行一定的限制,从而能够在一定程度上提高碎片拼接的准确度。

3.2 模型缺点

(1)在应用碎片模型的过程中,缺乏一定的灵活程度。当碎片的内容跑那个不是规整的情况,会大大的降低碎片模型的准确度。

(2)当文件碎片的面积太小的情况下,留给碎片边缘的信息量是极少的,这就会降低运用欧氏距离法进行碎片匹配的准确率。

4 结束语

随着我国经济实力和人们生活水平的不断提高,信息化技术在我们日常生活中得到了广泛应用,在运用信息化技术的过程中,其计算机占据着重要的地位。在文件破碎的过程中,我们想把文件复原的情况下,就需要运用计算机开进行文件碎片的复原。在对碎片进行拼接工作的过程中,欧氏距离法在拼接碎片中发挥着重要的作用,在利用欧式距离法进行碎片拼接的时候,需要建立一定的碎片模型,为了能够提高运用欧式距离法进行碎片拼接的准确率,首先需要对碎片进行分类工作,然后在运用欧式距离法进行碎片的拼接工作,从而能够在一定程度上提高碎拼匹配的准确度。

猜你喜欢

复原基准灰度
温陈华:唐宋甲胄复原第一人
采用改进导重法的拓扑结构灰度单元过滤技术
基于灰度拉伸的图像水位识别方法研究
浅谈曜变建盏的复原工艺
毓庆宫惇本殿明间原状陈列的复原
基于最大加权投影求解的彩色图像灰度化对比度保留算法
基于灰度线性建模的亚像素图像抖动量计算
明基准讲方法保看齐
滑落还是攀爬
巧用基准变换实现装配检测