国内外文件检验的文献计量学研究
2022-12-22王勇
王 勇
(西南政法大学刑事侦查学院,重庆 401120)
文件检验作为一门应用型交叉学科,其国内外研究既受到社会需求、科技进步等共同因素的影响,又受到不同法系文化等差异因素的制约。本文借助文献计量学软件CiteSpace进行信息挖掘,对国内外文件检验相关文献进行可视化知识图谱分析,通过关键词聚类分析、关键词时间线分析,比较国内外文件检验领域研究的异同,为国内文件检验研究提供有益借鉴。
1 数据来源和方法
1.1 数据来源
本文以CNKI(中国知网)为国内文献检索平台,以Web of Science核心合集中的SCI和SSCI子库为国外文献检索平台。CNKI平台以主题=“文件检验”或含“文书司法鉴定”或含“文书鉴定”;主题=“笔迹检验”或含“印章印文检验”或含“印刷文件检验”或含“变造文件检验”,两种组合方式进行检索,检索时间不设限制,剔除产品介绍、会议报道、案例报道等文章类型,得到557篇文献;在WOS平台以Topic=“document examination”or“handwriting”or “typewriting and typescripts”or“the materials of handwritten documents”or “the examination of printed and photocopied documents”组合方式进行检索,查询到3 904篇文章,分布在模式识别、法庭科学、心理学前沿等领域中的199种期刊,为了保证文章的代表性,筛选法庭科学领域的4本重要期刊:Journal of Forensic Sciences、Forensic Science International、Science & Justice、Australian Journal of Forensic Science,剔除信函、摘要等文章类型,检索时间不设限制,其中SCI默认起止时间为1995年至今、SSCI默认起止时间为2008年至今,得到214篇文献。
1.2 研究方法
使用 文献计量学软件CiteSpace进行分析,该软件是着眼于分析科学文献中蕴含的潜在知识,并在科学计量学、数据和信息可视化背景下逐渐发展起来的一款多元、分时、动态的引文可视化分析软件,是目前国际上应用最为广泛的一款文献分析软件[1]2。
2 国内文件检验文献研究分析
2.1 关键词聚类分析
关键词聚类分析,基本原理是对一组词两两统计它们在同一组文献中出现的次数,通过共现次数来测度它们之间的亲疏关系,共词方法可以分析学科的热点内容、主题分布以及学科结构等问题[1]201。将 CNKI导出的557篇文献数据进行分析,时间区间选择1981—2022年,以1年时间为切片;节点类型选择关键词;其他区域选择系统默认参数,形成可视化图谱(图1)。其中,网络:N=532,E=1008,密度值=0.007 1,即共形成532个节点,1 008条连线;网络模块化评价指标 Modularity Q=0.673 7,Q>0.3通常意味着所得到网络社团结构是显著的;Silhouette=0.893 1,该数值越大,代表该聚类成员的相似性越高。聚类后的编号在图中显示为#0、#1、#2……,聚类的规模越大(即聚类中包含的成员数量越大),则编号越小。选取聚类编号前11位列表(表1)。
图1 CNKI数据库关键词聚类分析Fig.1 Keyword clustering into analysis of CNKI database
表1 CNKI数据库关键词聚类编号前11位列表Table 1 Top 11 listed from CNKI-databased keyword clustering
2.2 关键词时间线分析
在关键词聚类分析的基础上,将聚类编号作为Y轴,文献发表年份作为X轴,得到关键词时间线分析,见补充材料图S1,图中可以清晰看到各关键词之间的关系及随时间演变趋势:如#10聚类中,2001年黄建同、李继东文章《碘熏法显现压痕字迹和擦刮痕迹的原理探讨》中的比表面、碘熏法等关键词与2007年庄琳文章《消退文件检验常用的方法》中的碘熏法、三氯化铁、消退文件等关键词相关联;2003年李彪、谢朋文章《纸张信息在文件检验工作中的应用》中的消退文件、添改文件等关键词与2016年胡萍、郝红光文章《基于红外技术的灰度分析鉴别添改文件》中的添改文件、灰度分析相关联,最终相关关键词汇集在消退文件这个聚类标签下。
2.3 研究热点分析
结合关键词聚类分析和时间线分析,将1981年至今划分为三个阶段:1981—1995年为第一阶段,注重文件检验的实用性;1996—2010年为第二阶段,强调文件检验规范化等基础性研究;2011年至今为第三阶段,关注新技术与文件检验的交叉研究、大数据统计分析实证研究。
2.3.1 第一阶段
该阶段研究注重实用性,体现在以下两个方面:
1)实际办案应用。《刑事技术》作为国内最早的法庭科学专业期刊,1981年12月收录的第一篇文件检验论文是《两种被掩盖字迹的显现方法》,通过实际案件介绍被掩盖的墨水字迹和圆珠笔字迹的显现方法[2];王锦生[3]介绍了如何运用文检技术破获重大匿名信案。
2)注重对港台和国外文件检验知识的介绍。王锦生等[4]编译了美国的可疑文件检验,介绍了可疑文件检验的对象和步骤;郝红光[5]介绍了国外的计算机检验笔迹、数学方法解决笔迹检验问题、笔迹分析、声纹鉴定等内容,这些后来都成为文件检验的发展方向,其中声纹鉴定独立成一门新的学科。总体来看,该阶段发文量较少,各类期刊合计仅12篇,且多以传统的笔迹检验和污损文件检验为主,基本不涉及大型的仪器设备分析。
2.3.2 第二阶段
受2005年《全国人民代表大会常务委员会关于司法鉴定管理问题的决定》的影响, 该阶段强调文件检验规范化等基础性研究。
1)技术管理规范化研究。2006年杨旭等[6]提出将文件鉴定标准体系划分为9个系列标准:文件鉴定通用标准、笔迹鉴定标准、印章印文鉴定标准、印刷文件鉴定标准、篡改(污损)文件鉴定标准、文件材料鉴定标准、文件制作时间鉴定标准、文件鉴定仪器检验规范、特种文件鉴定,后期文件检验标准体系的构建都是围绕上述9个标准在展开。2009年《中国司法鉴定》开设了文件鉴定技术标准专题论坛,邹明理[7]从文书司法鉴定类别划分、文书检材条件、样本文书条件、鉴定步骤方法的技术要求、鉴定意见的技术标准要求5个方面对文书司法鉴定标准的内容结构提出设想。图1中#23聚类名“检验标准”、图S1中#2聚类中的关键词“技术标准、鉴定结论标准化”、#9聚类中的关键词“技术规范、程序规范”,可与上述基础性研究的发展脉络相互印证。
2)技术应用基础性研究。区别于传统的巴甫洛夫神经条件反射活动学说,王成荣等[8]利用脑电图分析书写活动时的大脑功能,尝试开拓笔迹鉴定的新原理。杨群英[9]介绍了国外的文体计量分析学在文书作者推定和文书制作时间推定中的应用。从2009年起至今,申泽波持续研究不同偏旁部首的笔顺判断方法、书写方向对笔顺的影响、性别与笔顺的关系等,系列论文达19篇。
值得注意的是,随着学科间的融合,多篇论文论述文件检验与书画鉴定的关系,文检技术开始应用于书画鉴定领域,如:运用污损文件检验方法发现书画作品上的变造痕迹,运用印章印文检验识别印文真伪,运用笔迹检验方法鉴别名款、题款、题跋,运用印刷文件检验识别伪造的书画作品,运用文件材料检验技术对书画作品的物质成分进行检验[10]。
第一、二阶段仪器或方法应用方面,整理后见补充材料表S1。
2.3.3 第三阶段
随着大数据和人工智能的发展,该阶段在研究对象、研究方法等方面都体现出时代特点。
1)新研究对象。笔迹检验对象从纸质签名发展至电子签名,书写主体从自然人发展至书写机器人,其中电子签名研究类论文实验了不同品牌与型号的电子签名设备、分析了在线笔迹和离线笔迹的特征、对比了纸质签名和电子签名的区别、探索了电子签名笔迹量化检验的可行性。印章印文检验从传统的激光雕刻印章发展至3D打印技术伪造印章。
在新技术应用的背景下,程军伟提出,传统观点认为笔迹是反映书写人书写动作习惯特点的一类痕迹,该观点不够全面,并对笔迹鉴定的内涵做了新解,将笔迹鉴定的概念界定为:“鉴定人运用科学技术和专门知识对涉案笔迹进行鉴别判断,以解决笔迹形成方式方法特点、物质成分结构特点和认定书写人,并出具鉴定意见的鉴别认定活动[11]。”
2)研究方法从个案研究向大数据实证研究转变。林翠等[12]以“聚法案例网”上公开的裁判文书为数据源,检索了2010—2018年北京一审案件中涉及笔迹鉴定意见的850份有效裁判文书,进行统计分析。王连昭[13]以Openlaw裁判文书网为数据源,检索了2018年上海市法院涉及笔迹鉴定意见的408份判决文书,进行统计分析,指出应用中存在裁判文书表述不统一、鉴定启动程序缺乏可操作性、鉴定人出庭质证效果不理想、笔迹鉴定具有局限性、鉴定意见认证有盲区等问题。
3)量化研究方面。一方面,定量化研究对象从笔迹检验扩展至光敏印文、激光雕刻橡胶章印文、印文迭代复印特征、激光打印文件、添改文件、汉字笔迹间不同人相似度和同一人稳定度。另一方面,探索鉴定意见的量化表述,如:似然比应用于印章印文检验中的可行性研究、似然比模型评价笔迹鉴定意见方法的研究。
4)基础性研究。在受理阶段,李震[14]提出了笔迹鉴定“5W4H”受理送检法。针对不同人群的笔迹特征进行分类研究,如:聋哑人书面语特征及其身份识别、农民工笔迹研究、眼损伤患者的笔迹检验、濒危者的笔迹检验、卧姿笔迹特征的实验研究、人体纹刺字迹检验、生理因素和环境因素对双生子笔迹影响的研究、母语迁移理论与外族(国)人汉字书写识别。
第三阶段仪器或方法应用方面,整理后见补充材料表S2。
3 国外文件检验文献研究分析
3.1 关键词聚类分析
将 WOS核心合集中导出的214篇文献数据进行分析,操作步骤同2.1,结果见图2、表2。
表2 WOS核心合集关键词聚类编号前11位列表Table 2 Top 11 listed from keyword clustering into WOS’ core collection
图2 WOS核心合集关键词聚类分析Fig.2 Keyword clustering into analysis of WOS’ core collection
3.2 关键词时间线分析
在关键词聚类分析的基础上,进行时间线分析,操作步骤同2.2,结果见补充材料图S2,如#6聚类中,从起始词汇2006年的墨水分析关联出2009年的中性笔书写相对形成时间、2011年的基质辅助激光解吸电离质谱、2014年的傅里叶红外光谱法,最终相关关键词汇集在墨水分析这个聚类标签下。
3.3 研究热点分析
为了与国内进行同阶段对比研究,结合关键词聚类分析和时间线分析,将1995年至今划分为两个阶段:1995—2010年为第一阶段,2011年至今为第二阶段。
3.3.1 第一阶段
1993年美国道伯特规则对包括法庭科学在内的证据采纳提出了更高审查标准,要求考虑“特定科学方法的已知或者潜在误差率”等因素。因此,国外文检学者加大了学科基础性研究。以笔迹检验为例,本阶段相关研究多达14篇,不仅进行了文检专业人员与非专业人员对照研究,而且对不同人群的笔迹进行了细化研究;不仅采用了数理统计方法,而且使用了眼动追踪仪等心理学实验方法;不仅使用了传统的人工判别方法,而且运用了笔迹自动识别系统。相关结论有利于国内同行借鉴。
1)针对鉴定人员的研究。
a)选取美国东北部、东南部、西南部,三个组共105名文检专业人员进行测试,同时创建一个具有相似教育背景的对照组。实验结果显示非专业人员错误率是专业人员的6倍[15]。
b)考察了金钱激励对非专业人员判断的影响,结论为非专业人员在能力测试中的表现对金钱激励相对不敏感[16]。
c)考察了专业人员和非专业人员在I型错误(弃真错误)和II型错误(取伪错误)中的比例,在0.49%的案例中,专业人员犯了I型错误,在6.47%的案例中, 非专业人士犯了I型错误;在7.05%的案件中,专业人员犯了II型错误,在26.1%的案件中,非专业人士犯了II型错误[17]。
d)专业人员在鉴别真实签名方面比鉴别摹仿签名更有信心。书写水平高的人比书写水平低的人更擅长摹仿签名,并且可以产生一些专业人员难以识别的笔迹。 专业人员在出具鉴定意见时更加保守,其表达不确定意见的比例是23.1%,而对照组为8.4%[18]。
2)针对笔迹影响因素的研究。
a)土耳其文检人员通过测量73名参与者饮酒前后的笔迹变化,证实了笔迹特征的变化(如大小写字母高度、角度数等)与酒精含量之间有显著相关性。在任何酒精浓度下都可以观察到笔迹的变化[19]。
b)澳大利亚文检人员追踪观察了5年间150多名帕金森患者和对照组的笔迹,分析了衰老和帕金森综合征导致的书写变化,指出:这些人群的笔迹变化类似于摹仿笔迹,但仔细检验,可以与摹仿笔迹区分[20]。
c)调查了新加坡华人、马来西亚人、印度人的英文书写笔迹,确定了个别种族群体特有的一些特征,证实了他们的母语书写系统对英语书写的影响[21]。
d)研究了206对双胞胎的样本,验证结果:双胞胎的书写笔迹比非双胞胎更难识别,双胞胎的总错误率为12.91%,非双胞胎为3.7%;同卵双胞胎的错误率高于异卵双胞胎;双胞胎笔迹自动识别系统错误率低于非专业人员,高于专业人员[22]。
第一阶段仪器或方法应用方面,整理后见补充材料表S3。
3.3.2 第二阶段
1)本阶段同国内一样,国外文检学者加大了对新检验对象的研究,关注不同检验技术间的影响。
a)马来西亚文检人员通过分析本国电子签名数据库内6 000个样本,指出在数字时代传统笔迹检验中忽视的笔压特征是一个很好的识别特征。与真正的书写人相比,伪造者通常倾向于表现出更低的笔压[23]。
b)美国文检人员研究了Bond书写机器人笔迹和人工笔迹的区别,指出书写机器人无法摹仿复杂的书写动作,其笔迹表现出笔压均匀、缺乏轻重疾徐变化、单词和字母之间的间距等距、字符可以精确重合等特征。书写习惯是一种后天习得的复杂技能,一定范围内的变化是人工笔迹的特点,而书写机器人笔迹缺乏这种自然变化,文检人员可以利用该差异进行识别[24]。
c)新西兰文检人员分析了DNA技术与文检技术先后顺序的影响:不同的DNA擦拭法(湿/干擦拭或干/干擦拭)会在纸张上会产生污渍,使用静电检测仪(ESDA2)检测,压痕细节损失;使用文检仪(VSC5000)检测,干/干擦拭后两种不同的蓝色墨水,没有观察到红外发光的差异;湿/干擦拭后观察到不同的红外发光。此外,研究结果表明静电检测仪分析对DNA回收的负面影响最大。静电检测仪对文件施加静电荷和/或真空,以及仪器本身造成的表面接触,可能导致文件表面的DNA丢失。与静电检测仪相比,经过文检仪和紫外光分析后,文件上仍然可以获得成功的DNA结果[25]。
2)国外对不同人群笔迹和认知偏差进行了研究。
a)美国文检人员通过对69名阿尔茨海默病患者与74名年龄相当的健康人的签名进行动态分析,指出阿尔茨海默病患者签名时的动态特征(包括笔划持续时间、幅度、速度、平滑度和笔压)与健康人的签名没有差异;尽管认知状态在一年内显著下降,但前者的签名动态仍保持稳定[26]。
b)考察了老年人笔迹特征[27]、精神分裂症病人治疗前后的笔迹变化[28]、遗嘱笔迹[29]、书写姿势对签名的影响[30-31]。
c)澳大利亚文检人员为了避免检验人员受到无关信息的影响,通过设立证据质量控制人员来减少鉴定中的认知偏差,他们的职责是“从提交的材料中过滤出与鉴定无关的信息,以最不具暗示性的方式提出待回答的问题,协调办案部门与实验室等相关部门之间的联系”[32]。
d)为了避免认知情境性偏差,澳大利亚文检人员通过对照实验,分析了传统的检材样本提交方式——目标法和改进的列队法对鉴定意见的影响[33]。
第二阶段仪器或方法应用方面,整理后见补充材料表S4。
4 国内外研究热点对比总结与展望
通过梳理国内外文件检验的发展脉络,发现两者在研究热点上有诸多相似之处,都从粗放型走向精细型发展,从纸质时代走向电子时代,从传统思辨走向人工智能;同时,由于不同法系的法律文化差异,两者在研究方法和研究内容方面又有所区别,具体如下:
1)国内研究与国外研究总体趋势一致。如:两者都紧跟新技术的发展加强了电子签名的研究、书写机器人笔迹的研究、将似然比引入鉴定意见表述,甚至在母语迁移对书写技能的影响、双胞胎笔迹特征差异等分支领域都有相似的研究。
2)国内外的文件检验都与化学紧密结合,检验对象涉及了圆珠笔油墨、中性笔墨水、自来水笔墨水、印刷油墨、喷墨墨水、碳粉、纸张等几乎所有的文件物质材料,而且仪器设备的种类和化学计量学的方法都紧跟化学发展的前沿。值得一提的是,表S4中的“褪色率法”至“ImageXpert分析系统”一系列文献,都是中国刑事警察学院的李彪等发表于国外期刊,体现了国内学者在朱墨时序、文件形成时间方面研究成果颇丰。
3)近些年,国内运用大数据统计分析在笔迹鉴定意见的证据应用方面开展了多项实证研究,但国外少见相关文献报道。出现这种现象可能和不同法系下的证据制度有关,鉴定意见在国内属于法定的证据种类之一,而在英美法系,该类证据属于专家意见,在自由心证的证据制度下,更侧重于鉴定人的说理分析能力,以此来说服法庭上的陪审团和法官。
4)2009年,美国国家科学院提交给国会“美国法庭科学加强之路”报告之后,国外法庭科学界加强了对认知偏差的研究,认知偏差分为认知主体性偏差、认知情境性偏差、认知客体性偏差。近年来,以法证科学中的认知偏差影响为主题的研究日甚,逐渐形成一个名为“认知法证科学”的研究领域[34]。本文中国外第二阶段不同人群笔迹和认知偏差研究中的c、d两点即属于笔迹检验中应对认知偏差的有效方法。而国内在认知偏差方面,理论上尚未破题,实践中各检验项目间相互借鉴意见的做法普遍存在,因此,加强认知偏差研究,理清鉴定的受理、检验、意见出具等环节哪些地方容易出现认知偏差,出现何种类型的认知偏差,针对不同的认知偏差应有哪些应对方式,如何缓和现行司法鉴定程序与认知偏差研究结论之间的矛盾,这些都是国内文检人员下一步需要关注的地方。
补充材料
与本文相关的补充数据见:http://www.xsjs-cifs.com/CN/abstract/abstract7078.shtml。