费歇尔判别法在足底压力特征分析中的应用
2019-08-12邓宏明
邓宏明 姚 力
(中国刑事警察学院,辽宁·沈阳 110035)
足迹作为犯罪现场出现率最高的痕迹之一,在侦查实践中,通常被用来分析犯罪嫌疑人个人特征,俗称给犯罪嫌疑人画像。由于足迹是人行走运动的产物,所以足迹中蕴藏着许多足迹遗留人的相关信息。男女有别,是人与生俱来的本质特征,不同性别人群在运动器官、生理机能、行走行为等方面存在着差异,导致足迹特征不同。因此,根据足迹特征,可以分析足迹遗留人的性别[注]史力民,马建平.足迹学[M].北京:中国人民公安大学出版社,2014.[注]郑卫平.足迹学[M].北京:群众出版社,2007.。
当前,赵丽[注]赵丽,张国强,代志超,张翔.性别与BMI对中学生足底压力的影响[J].廊坊师范学院学报(自然科学版),2016,(4).等研究表明性别对足底压力有明显的影响,尤其是男性和女性之间在足底压力稳定性以及压力分布情况方面有着较明显的差别。姬瑞军[注]姬瑞军,王明月.支持向量机在不同性别人群足底压力分析识别中的应用[J].科技资讯,2017,(24).等利用男性和女性足底各区域的峰值压强特征,通过建立支持向量机模型来识别性别,也有着较好的准确率。但是,目前针对不同性别人群足底各区和不同足底压力参数特征对性别的影响研究较少,因此,本文通过足底压力步态分析系统采集男女足底压力特征数据,通过费歇尔判别法(fisher)研究足底压力各区对区分性别的重要性,以及峰值压强、峰值压强开始时间、结束时间、接触百分比等参数特征对区分性别的准确率进行研究。
一、实验方法
(一)实验器材
足底压力步态分析系统(比利时RSscan公司研发)及测力平板(长2.0m,宽0.4m)等相关配套器材、笔记本电脑、社会学统计软件SPSS24.0。
(二)样本来源
选取体态匀称的20名男性和20名女性,年龄在18岁到22岁之间,选取的40名受试者均能正常行走且无障碍和其他疾病。
(三)测试方法
测试之前,40名受试者在足底压力步态分析系统的测力平板上正常行走,适应测力平板的环境。待受试者适应压力板后,每名受试者脱掉鞋袜,开始采集数据。首先由20名男性受试者在自然状态下依次重复在足底压力分析系统的测力平板上行走5躺,每趟3枚足迹,从其中各选取左、右足迹一枚,收集男性每趟左、右足迹的足底压力特征数据,取每名男性左、右足数据的平均值,再由20名女性受试者在相同的条件下正常走过测力平板,以同样的方式采集女性每趟左、右足迹的足底压力特征数据,取每名女性左、右足数据的平均值。
二、 实验结果
(一)足底区域划分
将采集的足迹利用足底压力步态分析系统自动划分为十个区域:足趾区(Toe1、Toe2-5)、足掌区(Meta 1、Meta 2、Meta 3、Meta 4、Meta 5)、足弓区(Midfoot)、足跟区(Heel 1、 Heel 2)。
(二)费歇尔判别法原理
费歇尔判别法(fisher)是通过对待判别对象的多个特征进行降维,以获取较优的分类特征,从而得到最佳的分类判别函数,通过该函数将每个类别最大程度的区分开来,在实际应用中,为了操作简便,费歇尔判别法常常采用线性判别函数。其基本方法为:第一步,假设存在一个线性函数,其有n个总体A1、A2、…、An;第二步,在这n个总体中选取具有m个特征的样品观测数据,通过这些已知信息对该线性函数进行检验,得到线性函数中的系数值;第三步,借助方差分析的思路确立最终的判别函数,即费歇尔判别函数:Y(x) = y1X1+ y2X2+…+ ymXm=y,X;第四步,根据该费歇尔判别函数,对判别对象进行分类。
(三)数据处理及结果
将足底压力步态分析系统采集的数据以Excel的形式导出,经过筛选,首先利用费歇尔判别法处理分别以足底峰值压强(Max P)、峰值压强出现时间(Start Time)、结束时间(End Time)或接触百分比(% Contact)单一参数为特征的足底各区的数据,最后通过费歇尔判别法分析以足底每个区峰值压强、峰值压强开现时间、结束时间和接触百分比四个参数为特征的数据。表1为以峰值压强为特征的左足足底各区的数据,其中1代表男性,2为女性。
表1 左足峰值压强各区数据(单位:N/CM2)
续 表
性别Toe1Toe2-5Meta1Meta2Meta3Meta4Meta5MidfootHeel1Heel2147.95.137.6108.5209.0122.753.025.5104.465.3189.17.0138.6264.0352.5145.178.333.4202.9152.1147.113.078.7134.7120.099.975.736.1129.298.1177.27.667.5126.7149.3124.268.732.5132.994.1273.90.576.1128.3123.476.326.238.4111.598.6247.89.789.3133.4161.094.833.626.9115.6117.8256.73.755.3133.997.792.966.728.7119.093.9217.00.0125.698.9114.3110.560.824.2128.276.1239.82.437.8118.6148.990.448.724.7120.3107.7227.41.950.9178.2204.6128.959.521.8117.0138.7242.67.349.399.6140.666.014.342.478.188.8242.21.464.2207.1203.9121.3102.918.873.9105.1219.00.057.0166.5199.171.142.314.890.284.5218.50.843.8202.3219.788.125.433.7135.2101.6252.67.366.1191.0221.057.66.438.4106.694.7248.311.761.5149.9138.291.843.736.7111.072.6261.66.230.8144.9208.7120.465.324.1126.585.3217.52.330.0135.1156.780.282.219.199.590.4270.327.162.095.195.782.346.019.888.978.3261.87.537.987.5136.874.837.828.6116.3106.6225.717.446.7102.9122.582.147.535.597.489.1249.41.436.6143.2150.379.722.021.474.879.9253.019.5116.1134.4134.253.57.719.0107.192.2280.18.864.1104.4142.788.727.025.0136.569.2
利用费歇尔判别法分析以峰值压强为特征的左足各区的数据,分析结果如表2所示,由判别准确率的计算公式:(样本数-误分类个数)÷样本数×100%可得,判别准确率为92.50%,按照此方法对以峰值压强开始时间、结束时间和接触百分比为单一参数特征的数据进行处理,处理结果如表3和表4所示,再处理足底各区以峰值压强、峰值压强开始时间、结束时间和接触百分比四个参数为特征的数据,处理结果如表5和表6所示。
表2 左足峰值压强费歇尔判别结果
表3 单一参数特征费歇尔判别结果
表4 单一参数费歇尔判别函数的判别变量
表5 四个参数为特征区分性别费歇尔判别结果
表6 四个参数为特征的费歇尔判别函数判别变量输入/删除的个数(单位:个)
三、讨论与分析
由表3可知,以每个区足底峰值压强或接触百分比为特征判别左、右足性别的准确率均超过85%(费歇尔判别理想判别准确率[注]姚力,陈一然.利用足底压力测量系统对同质人群足底跖区压力情况的研究[J].警察技术,2010,(1).),而以每个区足底峰值压强开始时间或结束时间为特征判别左、右足均低于85%,说明峰值压强特征和接触百分比特征,对区分不同人性别相较于其他三个特征有着更好的效果。由男女误分类的情况可知,男性误分类的数量明显大于女性,说明男性群体之间的足底压力变化较大,女性群体之间足底压力相对稳定。
费歇尔判别函数的判别变量是经由多个参数特征降维后得到的参与判别分类的分析变量,判别变量与费歇尔函数之间具有相关性,即判别变量在区分性别时其主要作用,则由表4可知,以每个区峰值压强为特征判别性别时,左、右足均是Meta 4和Toe 1起主要作用;以每个区峰值压强开始时间为特征判别性别时,左、右足均是Midfoot和Meta 1起主要作用;以每个区峰值压强结束时间为特征区分性别时,左、右足均是Midfoot、Heel 1和Heel 2起主要作用;以各区接触百分比为特征区分性别时,左足起主要作用的区域分别是Toe 2-5、Meta 2和Midfoot,右足起主要作用的分别是Toe 2-5、Meta 3和Midfoot。由此可得, Midfoot与性别相关性较大。
由表5可知,男性有一人被误分类,女性没有存在误分类的现象,由判别准确率的计算公式可得,以足底每个区的峰值压强、峰值压强开始时间、结束时间和接触百分比四个参数作为特征判别性别时的准确率为97.50%,明显高于以单一参数为特征的准确率。
在费歇尔判别函数的判别变量中,参数特征通过降维得到的判别变量越多,说明该判别变量与区分性别的相关性越大。由表6可知,输入个数最多的变量是峰值压强,其次是接触百分比,最后是峰值压强开始时间和结束时间,因此在区分不同性别人群时,峰值压强这个参数特征起主要作用,其次是接触百分比这一参数特征,最后是峰值压强开始时间和结束时间两个参数特征,说明以峰值压强这一参数作为特征区分不同性别人群时重要性较大,接触百分比这一参数稍显重要,峰值压强开始时间和结束时间的重要性不高。
四、结论
在足底压力参数特征中,相较于以峰值压强开始时间或结束时间单一参数作为特征区分不同性别人群时,利用峰值压强特征或接触百分比特征区分不同性别人群有较好的准确度,在足底各区中,足弓区域与在区分性别时有着重要作用。
以峰值压强、峰值压强开始时间、结束时间、接触百分比四个参数特征区分不同性别人群比单个参数特征区分不同性别人群的准确率要高,且在区分性别时,峰值压强特征与接触百分比特征的重要性更高。因此,在利用足底压力特征区分不同性别人群时,尽可能选取与性别相关性较大的参数特征和多选取参数特征,同时也要防止参数特征过多,过度拟合等问题,这为进一步研究利用足底压力特征区分不同性别人群提供便利。