APP下载

基于多元异构数据融合的失信被执行人特征提取研究*

2020-12-02应一豪

法制博览 2020年32期
关键词:被执行人异构特征提取

陈 港 应一豪 王 钰

1.浙江公共安全技术研究院有限公司,浙江 杭州 310052;

2.浙江省玉环市人民法院,浙江 玉环 317600;

3.浙江公共安全技术研究院有限公司,浙江 杭州 310052

失信被执行人目前并没有明确的概念,从广义上而言,失信行为的范围可以包括日常生活、经济领域、政治领域以及司法领域等当中的失信行为。在民事执行程序当中,失信被执行人的失信行为主要从狭义角度分析,在司法领域当中对失信行为特有的内涵及特征进行提取。根据不同的失信行为严重程度,将失信行为分为失信和严重失信行为,前者通常严重程度较低,对他人或社会造成损害较小,而后者会对他人及社会的合法权益造成严重的损害[1]。当前针对被执行人特征提取的相关技术,无论是在学术研究还是在应用上都存在较大的发展空间[2]。对此,本文提出一种基于多元异构数据融合的失信被执行人特征提取研究。

一、基于多元异构数据融合的失信被执行人特征提取方法

(一)建立失信被执行人多维数据标签体系

在利用多元异构数据融合技术对失信被执行人特征进行提取前,首先应当根据失信被执行人的行为特征,构建面向失信被执行人的多维数据标签体系,见图1。

由图1可知,本文构建的面向失信被执行人的多维数据标签体系中共包含九个维度,分别覆盖失信被执行人的基本信息、日常生活信息、经济信息、政治信息等。失信被执行人基本信息主要包括:姓名、性别、年龄等。[3]。将九个维度数据标签存储为不同的属性Property,并将属性存储在图的顶点或边上。以此实现对大规模数据进行存储,对千亿级特征数据实时检索、分析、计算达到秒级响应速度。

图1 面向失信被执行人的多维数据标签体系

(二)基于多元异构数据融合的特征提取算法

根据本文上述构建的失信被执行人多维数据标签体系,针对多维数据对其进行基于多元异构数据融合的特征提取计算。利用曲线排齐算法对两种数据特征进行融合。假设两个序列分别为X1和X2,在X1和X2之间的错位函数为:

当通过公式(3)计算得出的相关系数最大值达到实现特征提取方位时,则说明该人员属于失信被执行人属性,其相关信息将立即被提取。

对于本身不存在相关性的序列,不需要进行序列的曲线排齐。针对如何选择需要进行排齐的序列的问题,本文首先将所有的多维数据标签进行分类,将相同维度数据标签分为一组。假设在同一组维度数据标签中,其内部的数据有着一定的相关性,则说明,在同一组维度数据标签中,可以进行随机的选择,选出任意一个作为参照序列都不会对后续的曲线排齐产生影响。

二、实验论证分析

由于失信被执行人的相关信息在一定程度上还属于隐私信息,以此本文实验主要采用公开的UCI smartphone数据集作为实验对象,从数据集中选取30名参与者,年龄分布在25-45周岁之间。根据本文构建的面向失信被执行人的多维数据标签体系,提取九个维度的数据信息。分别选取6-8个图像作为训练样本。实验组采用本文提出的基于多元异构数据融合的失信被执行人特征提取方法对特征进行提取,对照组采用传统方法对特征进行提取。根据上述实验准备,完成对比实验,将实验结果记录,见表1。

表1 实验结果对比表

对表1中的数据进行纵向比较可以得出,实验组通过增加训练样本的个数可以有效提高对特征信息数据的提取量,而对照组通过增加训练样本的个数无法实现对特征信息数据提取量的增加。通过对比实验可知,本文提出的基于多元异构数据融合的失信被执行人特征提取的提取效率明显优于传统提取方法,可以有效保证后续失信被执行人特征识别的准确性,具有更高的应用价值。

三、结束语

本文通过对失信被执行人行为的研究,提出一种基于多元异构数据融合的特征提取方法,从一定程度上减轻了传统特征提取方法由于受到外界和内在因素影响造成提取信息不完整的问题。在后续的研究中还将对后续特征提取和识别进行更加深入的研究,从而降低失信被执行人对社会造成的不利影响。

猜你喜欢

被执行人异构特征提取
试论同课异构之“同”与“异”
“列入失信被执行人名单” 和 “限制高消费”有何区别
江西省高级人民法院失信被执行人名单
基于Daubechies(dbN)的飞行器音频特征提取
将协助执行人变更追加为被执行人的问题研究
异构醇醚在超浓缩洗衣液中的应用探索
Bagging RCSP脑电特征提取算法
overlay SDN实现异构兼容的关键技术
LTE异构网技术与组网研究
基于MED和循环域解调的多故障特征提取