印刷图文特征测量系统的研究
2011-09-26杨旭施少培徐彻卞新伟陈晓红罗仪文
杨旭,施少培,徐彻,卞新伟,陈晓红,罗仪文
(司法部司法鉴定科学技术研究所上海市法医学重点实验室,上海200063)
印刷图文特征测量系统的研究
杨旭,施少培,徐彻,卞新伟,陈晓红,罗仪文
(司法部司法鉴定科学技术研究所上海市法医学重点实验室,上海200063)
通过对选择的50余款国内外图像、图形分析处理软件、图像测量软件和测量工具系统的比较研究,根据文件鉴定中印刷文件鉴定的实践需求,通过有效的整合,建立了一套适用于印刷文件鉴定实际需求的,能有效对印刷图文特征进行比较测量和精确测量及量化分析的技术平台,并对印刷图文特征的量化分析在印刷文件鉴定中的应用做了初步探索。
印刷文件鉴定;印刷图文特征;比较测量;精确测量;特征量化
Abstract:On the basis of comparative researches on approximately 50 sets of image processing software,image measuring software and measuring system,an integrated technical platform for measuring,comparing and quantitative analysis of printed features is established in view of forensic printed document examination practice.Preliminary application of quantitative feature analysis in printed document examination is introduced.
Key words:printed document examination;printed feature;comparative measurement;precise measurement;quantitative feature
1 引言
随着计算机技术的发展,现代办公自动化系统越来越普及,各类印刷文件已经在人们的经济活动中被普遍使用。由于印刷文件的普遍使用,其作为在各类诉讼案件的审理和有关公共事务处理中的证据地位越显突出。当前我国文件鉴定实践中,印刷文件的来源及真伪鉴定已经成为文件鉴定中极其重要的检验/鉴定项目,如印刷文件制作工具的种类鉴定、同机鉴定,换页、添加等篡改印刷文件鉴定、印刷文件制作时间鉴定等。而在印刷文件鉴定的司法实践中,一方面由于办公自动化系统有关的硬件(如各类打印设备、复制设备和传真设备等)和软件(如各类文字、图形、图片、数据处理软件等)更新换代速度较快,新的设备和新的软件层出不穷,其形成文件的类型、特点及由其形成的各类篡改文件的特点也在变化;另一方面,由于目前主要采用的是形态比对的技术,在印刷特征量化分析方面还未见有系统的研究,虽然能够解决一些实际问题,但其鉴别的效率不高,证明力较差,鉴定结论容易发生分歧和争议。因而,印刷文件鉴定中如何通过特征的量化技术克服鉴定中主要依靠形态观察进行经验判断的弊端,提高印刷文件鉴定的鉴别率和证明力,是目前急需研究解决的关键问题。本文正是从我国印刷文件鉴定的实践需求出发,通过对国内外图像、图形处理、分析、测量软件和各类测量工具系统的比较研究,拟建立一套满足印刷文件鉴定实践需求的对印刷图文特征进行比对、编辑和测量及定量分析的系统方法,在印刷图文特征量化及统计分析方法研究方面做一些有益的探索。
2 印刷图文特征量化系统框架分析
印刷文件鉴定中(如印章印文鉴定)采用的方法主要以形态观察、拼接比对、重叠比对等为主,对印文特征价值的分析主要靠经验判断,对特征往往采用描述性语言进行表述,很少有对特征进行量化分析的。经验判断固然是印刷文件同一认定的重要方法,但如缺乏必要的对特征的量化分析,不仅使我们对某些特征价值的判断过于主观,鉴定结论的科学性和说服力也大打折扣。特别是在法庭质证过程中,如缺乏对特征必要的量化分析,采用的鉴定方法和所作的鉴定意见就很容易受到质疑,也难以取信于人,如印章印文鉴定书中经常见到的表述“检材与样本印文的大小规格、搭配比例等相同或存在明显差异”,如果鉴定人在检验过程中未对印文特征进行过仔细的量化分析,针对提出的“检材和样本印文的大小规格、搭配比例是如何量化,两者差多少是差异或符合?如何对特征性质进行界定?”等问题,就可能措手不及或无从回答,质证效果可想而知。
如何从印刷文件司法鉴定的实际出发,建立一套既包含传统比较检验方法也能对特征进行精确测量并对测量数据进行有效的量化分析的系统?首先从理论上分析,为满足印刷文件特征量化分析的需要,我们认为一套完整的特征量化系统应包括五大基本系统(图1):图文处理和编辑系统;图文特征的比较测量系统;图文特征的精确测量系统;图文特征的统计分析系统以及鉴定文书制作和案件信息管理系统等,从而完成从图文质量优化(为下一步测量做准备)→粗略的比较测量→精确测量和计算→对测量数据的统计分析→将数据及分析结果制作成鉴定文书的整个过程。
图1 印刷图文特征量化系统结构图
根据以上印刷图文特征量化系统的理论框架,我们对精选的50余款国内外图像、图形处理、分析、测量软件和各类测量工具进行系统的比较研究,发现其中任何一款软件(工具)中都很难满足印刷文件鉴定实践的需求,于是我们研究将不同软件(工具)中的适用功能进行有效的整合形成了一套基本能满足印刷文件鉴定实践需求的,能对印刷图文进行处理编辑、比较测量、精确测量及统计分析的综合系统(图2),初步形成了一套在印刷图文特征量化分析方面较适用的技术平台。该系统由一款图像处理、编辑软件为基础,再通过其“外部程序编辑”功能,将经过系统的比较研究选择出的10余款图像处理、图形制作、图层应用及图像、图形测量软件整合而成,个别测量工具为另外独立的系统。下面主要以印刷文件鉴定中最常见也是最特殊的印章印文鉴定为例,概略地介绍本系统的印刷图文处理和编辑、特征的比较测量和精确测量等主要功能及在图文特征的比对和测量中的初步运用。
图2 印刷图文综合系统图示
3 印刷图文的处理和编辑系统
印刷图文的处理和编辑系统主要包括图片的裁切、编辑、拼接和图文背景分离及边缘提取功能,其主要目的一是为对图文特征的比较测量和精确测量创造理想的测量条件,便于更直观、更准确地对图文特征进行比对和测量;二是为最终制作图文特征比对表打下基础。
3.1 图文的裁切和拼接
图文获取后,根据图文的情况及之后进行比对、测量的软件(工具)的要求,通常应对其进行必要的统一的裁切和编排,为进一步测量提供条件。在对图文的编排中,如何根据需要,在保证所有比对的图片在相同条件下能方便、快捷的达到所需要的结果是关键,本系统选用的图像处理软件在这方面就有较好的功能(图3)。将不同规格、布局的图片根据需要方便、精确地裁切编排成统一的规格和布局,且能进一步在不改变大小的情况下对所选取的单字进行任意的拼接组合,便于进一步对所选择的单字进行直观的比较测量或精确测量(图4)。
图3 图文方向精确调整图示
图4 图文拼接组合图
3.2 图文背景分离及边缘提取
在印文鉴定中,图文背景对印文特征的观察、测量有非常大的干扰,在不对图文进行适当处理的情况下往往难以得到理想的测量结果。因此,如何有效的分离图文背景和提取到印文边缘轮廓图像,是能否满足检验鉴定技术要求的关键。通过对国内外多款图像处理软件的系统的对比研究,发现不同软件分离图文背景和提取到印文边缘轮廓图像的效果有很大的差异,能达到满足印刷文件鉴定要求效果的不多。本系统针对不同的鉴定对象选择了其中几款作为备用软件,通过实验对分离红色印文中干扰背景均能达到理想的效果,分离后也能提取到较清晰和完整的边缘轮廓图像。如图5对打印字迹处理效果,如图6对黑色墨水笔字迹的处理效果均较理想。
图5 打印字迹处理效果图示
图6 黑色墨水笔迹处理效果图示
4 印刷图文特征的比较测量系统
印刷图文特征的测量,从测量的方式和精确程度上可分为比较测量和精确测量两大类,其中比较测量是目前印刷文件鉴定中最常用的一种测量方式,虽然比较测量不能得出特征精确的测量数据,但其能直观地反映出比较对象之间特征的变化情况及吻合程度。而比较测量中,最普遍采用的是网格的比较测量和重叠比较测量。
图7 常见印章印文的各种形状网格测量图形
4.1 网格的比较测量
网格的比较测量在印刷文件鉴定中,特别是印章印文鉴定中被普遍采用,本系统选择的图形、图层制作和控制工具,可方便地实现对各种规格、形状的客体特征进行多种形式的网格比较测量。
(1)利用本系统的图形制作工具可制作印章印文鉴定实践中常见的各种形状和规格的网格图形(其中网格间距和角度都能进行比较精确的控制)(图7)。然后再用本系统的图层工具建立所需网格的透明图层,直接在印文上进行比较检测。
(2)直接在被鉴定对象图片上利用图形、图层制作工具,根据被鉴定对象的规格、形状及选择特征点的分布,制作相应的网格图形进行比较测量,或将该网格图形制作成透明图层,便于对多个比较对象之间进行比较测量(图8)。
图8 图文网格测量图示
(3)利用本系统中图层制作工具,可以根据需要方便地建立常用的规则网格并可精确地控制其位置、间隔、线数、线宽及透明程度等(图9)。这一功能在对多个比对对象或整篇印刷图文规格进行比较测量时非常实用,利用本系统同时还可便捷标示相应的比例尺或标尺(单位可以为像素、mm等),以粗略显示比较对象形态、规格变化情况、并满足特征比对表制作的要求(图10)。
图9 网格规格控制图示
图10 多个比对图文比较测量图
4.2 重叠比较测量
重叠比较测量也是目前印章印文鉴定中最常用的手段,它可将进行比较的印文之间在印文规格、形状、面积、轮廓的变化情况及吻合程度直观表现出来,比较的方法包括图文的直接重叠和图文轮廓的重叠比较。
4.2.1 图文直接重叠比较测量
传统的重叠比较方式是通过透射光进行直接比较,或运用一般的比对软件进行简单的重叠比对,而本系统提供的重叠比较方式主要有以下几方面的特点。
(1)运用图层制作和控制功能,通常利用检材图文建立图片、线条、网格等透明图层,可分别建立4层图层,或通过本系统的图层制作工具,建立带标尺的透明图层,再与基础图层的图文进行重叠比较(图11)。
图11 多图层制作图示
(2)在进行重叠比较测量时,基础图层可用图层控制工具进行精确的旋转,调整其位置,以实现与上层图层的精确重合,调整的精度可精确到小数点后多位数,且可对调整效果直接进行预览(图12)。
图12 图层方向精确调整图示
(3)各图层可以通过图像处理软件,调整图像颜色(一般可使上下图层为互补颜色),重叠时可通过颜色和浮雕效果表现相互间的重合程度,且可将上层图层置顶后通过鼠标滚轮轮换下层图层的图文,达到检材与不同样本之间的快速依次重叠比对。图13为检材印文(上带标尺的图层)与不同时期样本印文的重叠比对情况,从中可直观观察到印文规格的历时性变化特点。
图13 多图文动态重叠比对图
4.2.2 图文轮廓的重叠比较测量
图文轮廓的重叠比较测量关键是能通过各种图像处理软件提取到清晰、完整的图文轮廓。本系统选择的几款图像处理软件对各种情况的图文均能提取的较好图文轮廓,如3.2干扰图文轮廓的提取所述。
(1)图14为无干扰图文建立的带标尺图(横为mm标尺、竖为像素标尺)。
图14 图文标尺图
(2)图15为本系统中一款图像处理软件提取的图文轮廓图。
图15 图文轮廓标尺图
(3)图16为提取图文轮廓线与原图文进行重叠比对效果图(下部分为整体重叠情况,上部分是鼠标处在本系统提供的放大观察窗口内的显示情况,该窗口内显示的放大倍率可以事先设定)。
(4)图17为提取的图文轮廓与其中一份样本印文进行重叠比较的结果,表明两者在线条粗细、宽窄及比例上均有较明显的差异。轮廓重叠比较,还可采用以下精确测量方法对各部分图文轮廓的面积精确测量,并运用统计分析方法对两部分比较图文的重合程度进行定量分析。
图16 图文轮廓与原图重叠比对效果图
图17 图文轮廓与样本印文重叠效果图
5 印刷图文特征的精确测量系统
印刷图文特征的比较测量虽然便捷、直观,但对图文特征不能得出精确的测量数据,也就无法对特征的变化情况和吻合程度进行定量分析。如需对图文特征进行定量的统计分析,就必须得到特征规格、形态、分布等精确的测量数据。本系统经过对多款图文测量软件(工具)进行系统的对比分析,根据印刷文件鉴定中特征量化的需求,选择了三款图文测量软件(工具),运用三种测量方式对印刷图文特征进行精确测量,基本能满足印刷图文特征测量的实际需要。
(1)第一种测量方式是一款影像式测量软件,它提供了机器运动控制、基本几何量测量、基本几何关系计算、坐标转换、形状和位置公差评定、理论模型导入、测量程序、测量结果的显示和编辑、图文并茂的报表内容、CAD链接等多种功能,能通过摄像头对被测实物直接进行测量,并将测量数据导出,便于进一步对数据进行统计分析。如图18为测得印文内外圆的边缘轮廓CAD图形(包含具体数据),表1为内外圆的圆心坐标及直径的测量数据。
图18 印文内外圆的边缘轮廓CAD图
表1 内外圆的圆心坐标及直径测量数据(单位:mm)
(2)第二种测量方式是一款对导入图片或通过显微镜、扫描仪直接获取的图像元素进行精确测量的测量分析软件,可以对图像内容进行手工精确测量,并进行自动对象识别;图像可以是扫描图片、显微照片等,支持JPG、GIF、TIFF、BMP、PNG、WMF和EMF多种格式;测量数据可导出excel文件,便于进一步对数据进行统计分析。图19为利用该软件对导入的印文图像的规格、边框及图文轮廓测量图示及印面附着、疵点、缺损等特征点坐标定位分析图示,其测量方法简单便捷且测量数据可直接导出。表2为自动测量的印面图文各元素(提取图文元素轮廓)的面积、周长等部分数据,根据这些数据可对比对图文之间的吻合程度在比较测量的基础上作进一步量化分析。
表2 自动测量印面图文各元素数据(部分)(单位:mm)
图19 图文各特征测量分析图示
(3)第三种测量方式是基于高分辨扫描系统的一套全自动印刷图文质量测量系统,可对打印纸张、打印图文质量、打印斑点等进行量化检测;测量评估打印机的共性和不同打印机个体特性。对印刷图文可自动检测点、线、面进而自动得出图文的规格、面积、布局(各元素的位置、角度及平行度等相互关系)的测量数据(该数据既可在图片上直观显示,也可导出表格数据)。如图20中a、b、c、d四幅图,分别系对印文、单字、五角星等的规格、布局及相互关系、线条质量进行测量的结果图示。该系统还可测量印刷图文杂色、斑点;测量条带和均匀性;测量笔画边缘星点数量分布(如图20第e幅图);测量重复性的打印缺陷;测量重像、残像、鬼影等;评估固定区域的斑点(如图20第f幅图)等,这些测量数据也均可导出,以便对测量数据进行进一步的统计分析。
图20 图文规格质量测量分析图示
6 结论
综上所述,本项目通过对精选的50余款国内外图像、图形分析处理软件、图像测量软件和各类测量工具系统的比较研究,根据文件鉴定中印刷文件鉴定的实践需求,通过有效的整合,建立了一套系统的适用于印刷文件鉴定实践需求的,能有效对印刷图文特征进行比较测量和精确测量及统计分析的平台。在这个平台上能对印刷图文进行编辑、处理进而对图文特征进行各种方式的比较测量、精确测量及初步的统计分析,并可根据需要导出测量数据进行进一步的量化分析,为印刷图文特征的量化分析提供了条件,在探索印刷图文特征量化分析在印刷机具的种类和个体识别及各类篡改文件检验、机制文件制作时间鉴定等方面的具体运用都有着广阔的前景,这方面的应用笔者仍在作进一步深入研究,部分研究结果将另文阐述。
(本文编辑:凌敬昆)
Study on the Measuring System for Printed Documents
YANG Xu,SHI Shao-pei,XU Che,BIAN Xin-wei,CHEN Xiao-hong,LUO Yi-wen
(Shanghai Key Laboratory of Forensic Medicine,Institute of Forensic Science,Ministry of Justice,Shanghai 200063,China)
DF793.2
A
10.3969/j.issn.1671-2072.2011.02.005
1671-2072-(2011)02-0021-06
2010-12-02
中央级科研院所公益研究基金资助(GY0806)
杨旭(1966-),男,高级工程师(正高级),主要从事文检、痕迹等物证技术方向研究工作。E-mail:yangx@ssfjd.cn。