电子签名笔迹中电子数据的Excel表格分析法
2018-11-02涂舜
涂 舜
(西南政法大学刑事侦查学院 重庆 401120)
电子签名笔迹是一种电子化的签名笔迹,是人们根据文字符号的书写动作规范,使用手写笔在电子书写设备上直接书写形成的,以姓名为文字符号内容的、电子化的动态痕迹。该种笔迹可直接与电子文件合为一体,故广泛应用于电子商务及电子政务领域。随着电子签名笔迹使用率的日益增多,其真实性问题也受到人们的质疑。2009年,美国警察使用个人数字助手(Personal Digital Assistants,PDA)填写的罚款单中的电子签名笔迹,就受到了被罚款人的质疑,进而提出对其真实性进行鉴定①2009年美国一些司机从警察那里收到交通违法行为通知单,但随后声称罚款单中他们的签名是伪造的。该城市中的警察通常使用PDA填写罚款单,并需要在PDA的电子触控屏幕上输入交通违法行为人的签名。根据知情人反映,在违法者开车走后,他看到警察在PDA上伪造交通违章者的签名。之后,相关部门展开调查,在犯罪嫌疑人的PDA上发现了交通罚款单上的近30个可疑签名,这些可疑签名被发送到法庭文件检验者处进行分析鉴别。在该案的检验中,检验者发现,有一半的可疑签名与每一个交通违法者驾驶证上的签名,都表现出显著的差异。而这些可疑签名中,大多数都显示出高度的相似性,表明同一个人书写签名的可能性较大。参见:Smith R.Johnson City police officer fired after forging signatures on citations[EB/OL].(2009-11-08)[2018-04-06].http://www.timesnews.net/print_article.php?id=9016541。。这一问题不仅在国外案例中有所凸显,我国也逐渐出现类似诉求,虽然目前尚未诉诸司法鉴定,但随着电子签名笔迹的大量使用,与此相关的诉讼及鉴定需求必将大量涌现。
电子签名笔迹主要包含电子图像和电子数据两方面信息,分析电子图像时可延用传统笔迹学检验方法,而关于电子数据的分析方法,研究尚显不足。故笔者在既有研究之上,利用Excel表格的相关功能对电子签名笔迹的电子数据进行分析,以获得电子签名笔迹的笔迹特征。
1 电子签名笔迹的信息结构与分析方法
书写人在电子书写设备上签名时,该设备既获取了电子图像信息,又获得了电子数据信息,以上两方面构成了电子签名笔迹的笔迹信息。
第一,电子签名笔迹的电子图像信息。电子图像是指通过拍照、截图等复制方式,将电子签名笔迹的外部轮廓形状记录下来,从而体现电子签名笔迹形态特征的电子化图像,如图1所示。通过分析电子图像,可判断笔迹的书写风貌特征、布局特征、字体特征、字形特征、字的结构特征、笔顺特征、特殊字特征等,上述形态特征对于排除书写人,分析书写人的文化程度、职业状况、年龄范围等方面有重要作用。但是,单纯通过电子图像分析出的笔迹形态特征进行书写人的同一认定,可靠性不强,这可以从American Family Life Assurance Company of Columbus(AFLAC)v.Glenda Biles的案件中看出①该案中原、被告在电子签名笔迹的真实性上产生了争议,故提起诉讼。双方都分别进行了文件检验,原告AFLAC聘请的专家是基于争议签名笔迹的电子数据来进行检验,而被告聘请的专家是基于争议签名笔迹的一个低分辨率的电子图像获得结论。法院裁定显示,被告方专家提供的证据被法庭认为是不可靠的,因为电子签名笔迹的电子图像并非可获得的最优证据。参见:UNITED STATES DISTRICT COURT SOUTHERN DISTRICT OF MISSISSIPPI JACKSON DIVISION.American Family Life Assurance Company of Columbus(AFLAC)v.Glenda Biles [EB/OL]. (2011-11-03)[2018-09-13]. http://law.justia.com/cases/federal/district-courts/mississippi/mssdce/3:2010cv00667/73831/80。。
第二,电子签名笔迹的电子数据信息。电子数据是指电子设备所记录的、与整个书写过程有关的、由一系列数字组成的数据对。大多数的电子书写设备都可记录采集点的X/Y轴坐标,若该种设备具有压力感应功能,则可记录Z轴方向的压力值,因此,电子书写设备记录的电子数据,是由几组数字组成,如图2所示。以电磁式手写笔和电子书写设备为例(智创PPL398S2型手写板),根据电子签名笔迹的形成原理可知:当手写笔接触电子书写设备的触控屏时,后者会间隔固定的时间段,采集笔尖在触控屏上的位置坐标点,并以单个数字或X轴、Y轴坐标数据对的方式记录下来,通过获取数据对的数量、采集点的位置坐标、组成签名的单个“笔画”的数量,以及每个笔画的起始位置、获取的数据和书写时间等,可确定笔画轨迹、书写顺序等。同时,该种电子书写设备还可记录采集点的力度数值,从而反映书写力度的大小。因此,电子签名笔迹的电子数据,记录了书写轨迹的位置坐标及书写力度等信息,据此可判断电子签名笔迹的书写速度、加速度、笔力等动作要素特征,对于分析书写人的人身属性及书写人书写时的具体状态都有重要作用,可为电子签名笔迹检验提供依据。
就目前的研究来看,国内学者重点关注电子签名笔迹的电子图像信息,集中于比较电子签名笔迹与普通签名笔迹,以及不同类型的电子签名笔迹间的形态特征异同,并统计出它们之间相同特征和不同特征的出现率。相关研究在分析电子图像时,均采用传统笔迹学的检验方法,通过这些方法,已经足以分析电子签名笔迹的形态特征[1-6],故本文不再对此赘述。
图1 电子签名笔迹的电子图像
图2 电子签名笔迹的电子数据
而关于电子签名笔迹中电子数据分析方法的研究,目前国内尚未看到相关文献,可能的原因有二:一是我国现有的电子书写设备中,大多只能获得电子图像信息,无法采集电子数据信息;二是即使获得了电子数据信息,也没有找出理想的分析方法来探索其中蕴含的笔迹特征。当然,国外有些学者对分析电子签名笔迹的电子数据已经开展了较为深入的研究,其中,尤以美国学者William J. Flynn的分析方法较具操作性与科学性。他提出使用Excel表格来对电子书写设备获取的电子数据进行分析,既可呈现书写活动轨迹,又可有效厘清书写顺序、书写轮廓、书写速度等笔迹特征[7]127。应该说,这一方法对于英文笔迹的分析已十分有效。本文将借鉴William J. Flynn的分析方法,即利用Excel表格对中文电子签名笔迹的电子数据进行分析。但需要指出的是,该方法所分析的电子数据,只是X/Y坐标点,并未涉及采集点的压力值,因为在美国仅有3%的电子书写设备具有压力感应功能[7]127;同时,英文字母的写法异于中文字迹,前者多弧形线,后者多直线、折线,且书写规则也存在差异,所以分析中文字迹时,不能直接套用William J. Flynn的分析方法,需要在此基础上进行相应改进。
2 利用Excel表格分析电子签名笔迹中电子数据的方法
电子签名笔迹的电子数据由一系列数据对组成,而Excel表格正是处理数据的有效工具。通过Excel表格的计算功能,可对数据进行相应的计算;而通过Excel表格的图表功能,可通过图表方式呈现书写活动的轨迹,以及书写速度、书写力的变化等。因此,Excel表格对于电子签名笔迹中电子数据的处理及笔迹特征的分析非常有效。具体方法如下[7]128:
2.1 明确数据的组成
原始数据是由一系列数据对组成,这些数据储存为TXT格式,分别由序号、X、Y、Z、TIME这5部分的数据组成。其中,序号代表采集点的次序,X代表该采集点的X轴坐标,Y代表该采集点的Y轴坐标,Z代表该采集点的压力值,TIME代表该采集点的相对时间数据,非确定的时间。
当手写笔与触控屏接触时,电子书写设备则开始采集数据点,并以数据对的方式体现;当手写笔离开触控屏并超过感应范围时,采集点数值会显示为0。有些学者将0之间的所有数据点称为一个“笔画”,这并非我们汉字中的笔画,而是表示手写笔接触触控屏到离开的这一过程。这些0恰好将多个“笔画”分开,前面数据就是前一“笔画”的收笔位置,后面数据就是后一“笔画”的起笔位置。通过查找一组0的出现次数,则可明确书写人在书写该签名时,经过了几次起收笔。如图3中513~517这一系列数据,就是一组0数据。通过观察序号数字,可以明确在整个书写过程中,电子书写设备总共进行了多少次采集,通过该设备的采集频率,则可计算出书写过程所使用的时间。
2.2 提取相关数据生成图表
在明确各数据所代表的含义后,使用Microsoft Excel表格对这些数据进行具体分析。主要目的有三个:一是根据X轴、Y轴的数据,还原出书写运动的轨迹。二是根据Z轴的数据,生成笔力随时间变化的示意图。三是根据采集点X轴、Y轴的数据,计算出两个数据点之间的距离,并生成距离随时间变化的示意图,通过图表即可明确速度大小及变化。具体分析的相关操作步骤如下:
(1)打开Microsoft Excel表格,在其上建立关于序号、X轴、Y轴、Z轴及距离的标题。将原始电子数据导入Microsoft Excel表格相应位置,并删除最后一列相对时间数据(其对分析的作用不大),仅保留序号、X轴、Y轴、Z轴的数据,如图4所示。
(2)为调整相关数据便于计算,将X轴、Y轴数据复制到新列,以计算两个采集点之间的距离。其中,直接将X轴数据复制即可,即在E6格输入“=B6”;并将Y轴数据转换为负数,即在F6格输入“=C6*-1”,这是由于电子书写设备获取的数据点是一象限的坐标,若将其直接使用图表功能进行轨迹分析,则笔迹轨迹是倒向的,因此,将坐标转换为四象限坐标,更利于将轨迹还原成正向的笔迹。随后,同时选中E6和F6两个单元格,向下拖动单元格右下方的“+”符号,则可直接生成所有的X轴和Y轴的数据,如图5所示。
(3)校正原始数据。通过前述可知,原始数据中的一组0数据,代表了手写笔离开触控屏的这一过程,这个过程并未形成连续的笔画,因此,在生成图表时需要将这些成组的0数据删除。若不删除这些数据,则生成图表时会出现图6的情形,不利于书写轨迹的观察。
图3 原始数据中一组0数据
图4 将原始数据导入表格
图5 生成所有X轴和Y轴数据
图6 不删除0数据的效果
(4)当进行了数据校正后,即可根据X轴和Y轴的数据生成图表。操作方法是同时选中X、Y列所有的数据后,在Excel表格中选择“插入-图表-XY散点图”即可生成图表,如图7所示。该图表可显示出手写笔在电子触控屏上的运动轨迹,即书写人在书写电子签名笔迹时的书写运动轨迹。由于数据点之间的时间是相同的,故两个数据点之间的距离越长则表示书写速度快;若距离越短,则表示书写速度慢。
(5)生成笔力图表。Z轴表示的是采集点的力度数据,根据Z轴的数据,生成图表。操作方法是选中Z轴的所有数据,在Excel表格中选择“插入-图表-折线图”即可生成图表。该图表可显示出每个采集点书写力的数据,以及书写力随时间的变化,如图8所示。
(6)计算两个采集点之间的距离。此处的距离是直接根据两个点之间的直线距离来计算的,虽然书写轨迹并非都是直线,但若采集频率越高,两个点之间的距离越短,则越接近于直线,因此,直接计算两个点之间的直线距离即可。关于距离的计算方法,直接采用直线距离的计算方法进行,即分别计算两点分别在X轴、Y轴上所移动的距离,然后使用勾股定理计算出斜边的距离,即若两个采集点之间在X轴方向的距离为3、在Y轴方向上的距离为4,则根据勾股定理a2+b2=c2的公式可知,两个点之间的距离为5。因此,直接在距离一栏使用公式“SQRT(a^2+b^2)”来进行计算,在图表G7一格中输入函数“SQRT((B6-B7)^2 +(C6-C7)^2)”即可,如图9所示。当计算出一组距离后,选中这一单元格,拖动表格右下角的“+”标志至数据底部,则所有的距离即可直接计算出来。
(7)校正数据。观察这些距离数据,大多都在0~30之间变化,但也会发现有些特别大的数值,这些数值是由于手写笔离开电子屏幕而产生的,这些点恰好是提笔时的数据点,因此,需要手动校正这些数值,以0替换这些较大的数值即可。如图10所示,G156单元格为664.5675,这一数字较大,故将其改为0。若不进行校正操作,可能会覆盖笔迹的真实轨迹,同时也可能大幅度改变图表的规模,减小了图表之间的变化,从而对速度大小,以及加速和减速变化分析造成影响。若不做校正数据的情况如图11所示。
(8)根据距离数据,生成图表。操作方法是选中距离一栏的所有数据,在Excel表格中选择“插入-图表-折线图”即可生成图表,如图12所示。图表可显示出距离随时间的变化,通过距离与时间之间的连线,即可反映出速度,若折线为“/”方向,则两数据点之间为加速;若折线为“”方向,则两数据点之间为减速。
综上所述,通过Excel表格分析电子签名笔迹的电子数据,可对笔迹特征进行判断。若要呈现书写运动轨迹,还原字迹轮廓,理清笔顺,则可以选择X轴、Y轴的所有数据,通过Excel图表的相应功能,呈现笔迹的大致轮廓。数据点的距离与笔画的书写速度成比例,因为两个点之间的时间是相同的,若距离越大,则速度越快。观察这些数据点可知,在字迹的长笔画上,数据点稀疏,两个点之间的距离大,速度较快;而在转折时,数据点密集,两个点之间的距离小,速度较慢。若需要观察书写速度的变化,则选择“距离”一栏的所有数据,通过Excel图表的相应功能可呈现距离随时间的变化。因为两个点之间的时间是相同的,若距离变化过大,两个距离点间的倾斜度为“/”方向,则呈现加速特征;若距离变化较小,两个距离点间的倾斜度为“”方向,则呈现减速特征。据此即可分析出电子签名笔迹的运笔轨迹、书写顺序、书写速度、笔力等特征。
图7 签名的书写运动轨迹
图8 书写力随时间的变化
图9 计算两采集点间距离
图10 校正距离数据
图11 不校正数据情况
图12 距离随时间变化的图表
3 利用Excel表格分析电子签名笔迹中电子数据的实验研究
根据电子签名笔迹的信息结构可知,电子签名笔迹由电子图像和电子数据两方面组成。对于电子图像而言,使用笔迹学检验方法即可分析出电子签名笔迹的形态特征,而对于电子数据的分析,利用前述的Excel表格分析法,所获得的笔迹动作要素特征,能否为电子签名笔迹检验提供有效信息。也就是说,分析电子签名笔迹的电子数据,是否能对电子签名笔迹的同一性检验提供有效信息,这需要实验的验证。
3.1 实验目的
探讨利用Excel表格分析出的电子签名笔迹的动作要素特征,能否对电子签名笔迹的同一性检验提供有效信息。
3.2 实验器材
签名原笔迹输入设备为智创PPL398S2型手写板,其具备独特的电磁、嵌入式软硬件及图形技术。设备参数:分辨率5080LPI;采点率300PPS(非插值);误差(边缘)0.5mm;压力感应4096级(非插值)线性技术;笔ID号64BIT;笔尖为高摩擦双材料。
3.3 实验步骤
选取某大学本科生30人为实验样本收集对象,年龄在18~22岁之间。实验器材为智创手写板。为使书写人能够自然稳定的发挥,告知实验者按照平时的书写习惯自然书写即可(实验进行前,先让实验者熟悉电子书写设备的使用方法,并自主练习,尽量减少因不适应书写设备而造成的影响)。
实验分3部分:一是正常签名,让实验者分别书写自己的签名各5遍(共150个签名);二是伪造签名,实验者书写他人签名5遍(共150个签名);三是摹仿签名,实验者摹仿他人的签名5遍(共150个签名)。书写完成后由工作人员分别提取电子图像和电子数据,并保存为相应的电子文件。
3.4 实验分析
对获取的电子签名字迹逐一进行分析:一是将同一人书写的电子签名笔迹进行相互比较,主要判断哪些特征能为肯定同一提供依据;二是将伪造他人签名的电子签名笔迹与真实的电子签名笔迹进行比较,主要判断哪些特征能为否定同一提供依据;三是将摹仿他人签名的电子签名笔迹与真实的电子签名笔迹进行比较,主要判断哪些特征能为否定同一提供依据。
3.5 实验分析结果
通过实验分析发现,同一人在同一电子设备上书写的签名字迹,在书写风貌特征、字体特征、字形特征、字结构特征、笔顺特征、特殊字特征等方面相同,在布局特征、运笔特征、运笔节奏特征、笔力特征、笔速特征方面基本相同,但也存在少许差异,主要表现在运笔特征、笔力特征、笔速特征三方面。深入分析可知,虽然书写人的书写习惯是相对稳定的,但书写人每次书写都是一个独一无二的运笔过程,即使同一人书写,也不可能出现完全相同的两个签名笔迹,出现差异是肯定的,特别是在笔力、书写速度等较为细微的特征方面,因此,不能机械地比较笔迹特征。通过比较同一人书写的电子签名笔迹的笔迹特征发现,如图13所示,电子签名笔迹的形态特征基本一致,而动作要素特征虽不完全相同,但比较接近,据此可得出肯定同一的意见。
图13 同一人书写的电子签名笔迹的笔迹特征比对图
而不同人在同一电子设备上书写他人签名,即伪造书写形成的电子签名笔迹,在笔迹的形态特征和动作要素特征方面,都表现出较大差异。其中,在运笔节奏、笔力特征、笔速特征等方面更是表现出绝对的差异,在书写风貌特征、字的结构特征、运笔特征、笔顺特征、特殊字特征等笔迹形态特征方面也差异较大,不过也存在少数相似,如在部分布局特征、字体特征、字形特征等方面有相同点。但这些相似特征都是笔迹的一般特征方面,具有一定的普遍性,在不特定人群中出现的几率相对较大,因而会有相似特征表现。通过比较不同人书写的电子签名笔迹发现,如图14所示,电子签名笔迹的形态特征不同,而动作要素特征则完全不相同,因为图谱中峰的个数,以及峰高、相对的位置高低差异较大,据此可得出否定同一的意见。
图14 不同人书写的电子签名笔迹的笔迹特征比对图
通过分析不同人摹仿他人签名形成电子签名笔迹的笔迹特征可知,在书写风貌特征、布局特征、字形特征、字的结构特征,以及运笔节奏特征、笔力特征、笔速特征等方面都具有相当程度的差异,而在字体特征、笔顺特征、特殊字特征等方面具有较大程度的相似。由于摹仿人是以被摹仿人的电子签名笔迹为模板进行摹仿的,故摹仿签名过程中,在比较容易摹仿的字体、笔顺及特殊字等方面相似程度较高;而在不易摹仿的书写风貌特征、布局特征、运笔特征等方面,表现出明显的差异性。特别在动作要素特征方面,具有显著的差异,其原因在于书写人书写时的书写动作要素信息是无法准确衡量的,其他人通过观察被摹仿的电子签名笔迹,不可能准确知晓动作要素信息,只有实际书写人可感知。具体表现在图谱中峰的个数,以及峰高、相对的位置高低完全不相同,且笔力都相对平缓,在一个较低的压力线周围波动,且笔力图表中常会出现一段时间压力不变的情况,如图15所示,这在正常的签名笔迹中是不常出现的。因此,通过电子数据分析出的动作要素特征对于摹仿笔迹的识别具有重要的作用。
图15 摹仿书写的电子签名笔迹的笔迹特征比对图
通过实验可知,利用Excel表格法分析电子数据后得出的动作要素特征,对电子签名笔迹的同一性检验有重要作用。根据图谱中峰的个数及峰高、相对的位置高低等信息,可以辅助判断是同一人书写或不同人书写的电子签名笔迹:同一人书写时,动作要素特征基本表现一致;而不同人书写时,则会出现明显差异。特别是在摹仿电子签名笔迹中,动作要素特征差异较大,尤其在笔力特征上表现非常明显,通常会出现笔力平缓的现象。因此,利用Excel表格分析法对电子签名笔迹的电子数据进行分析,可以增强检验的准确性、可靠性。
本实验亦存在一定的局限性:一是在同一人书写的签名笔迹中,实验者都是书写自己的签名,而不同的字迹笔画,其复杂程度不一样,这就导致笔迹特征的变化种类及程度不同。二是在伪造签名和摹仿签名中,实验者都是书写别人的签名,而不同的实验者,本身的书写水平、摹仿能力存在差异,这就导致伪造签名和摹仿签名中笔迹特征的变化种类及程度不同。而本实验中只是针对这30人的电子签名笔迹进行分析后得出的结论,仅供实验分析参考。
4 结语
利用Excel表格分析电子签名笔迹的电子数据,可直观地反映书写人的书写速度、笔力、运笔节奏等动作要素特征,增强了笔迹特征判断的客观性与准确性,减少了检验人员的主观影响。通过实验分析发现,利用Excel表格法分析出的电子签名笔迹动作要素特征,对电子签名笔迹的同一性检验有重要作用,根据图谱中峰的个数及峰高、相对的位置高低等信息,可以辅助判断同一人书写或不同人书写的电子签名笔迹,提高了检验的准确性。
利用Excel表格分析电子签名笔迹的电子数据时需要注意两点:一是由于电子数据记录的是书写人书写动作的细微方面,而书写人每次书写都是独立的书写活动,因此,即使同一人书写的电子签名笔迹,这些笔迹特征也不可能完全一致,若出现完全一致的数据信息,反而存在盗用的可能。但同一人书写的笔迹,在动作要素特征方面的大致范围、变化规律是一致的,故在具体分析比较检材与样本的笔迹特征时,切不可机械比较。二是根据图谱进行笔迹特征分析时,亦需要结合电子图像信息来综合分析,相互印证,不能单纯根据图谱数据作出结论。