基于人工智能技术的司法大数据应用风险评估方法设计
2022-03-15赵晓林
赵晓林
(贵州省司法厅, 贵州 贵阳 550001)
0 引言
近几年,司法系统逐渐与多种现代化的信息技术相结合。现代科技为促进司法领域与时代发展趋势的紧密结合提供了支持,但与此同时也造成了不利影响。例如由于司法本身是具有固定属性的,因此在与更多现代化信息技术融合的过程中,会在不同程度上受到冲击,进而产生新的风险。同时,由于风险存在潜在性、非指涉性等特点,因此当前现有法律规范与信息技术伦理之间无法实现全覆盖。在该背景下,如何认清司法大数据在应用过程中可能潜在的风险成为实现新型技术风险预防过程中亟需解决的问题。针对司法场景的特殊性,采用传统的信息技术已经无法准确地对其存在的风险以及问题进行评估,针对该问题,该文引入人工智能技术。当前,人工智能技术在各领域中应用得十分广泛,在不同领域中具备辅助、预测等功能,并最大程度地利用数据信息。因此,结合人工智能技术的应用优势,通过该技术对司法大数据应用风险评估方法进行研究。
1 基于人工智能技术的司法大数据应用风险评估方法设计
人工智能技术是研究、开发用于模拟、延伸和扩展人的智能的一系列理论和方法,是计算机领域的重要分支。目前,可以利用人工智能技术完成部分以往仅有人工才能完成的工作,自然也可以完成对司法大数据应用风险的评估。因此,为提升司法大数据应用的风险评估效果和速度,该文利用人工智能技术设计了一种司法大数据应用风险评估方法,其设计步骤如图1所示。
图1 设计方法操作步骤
1.1 基于人工智能技术获取风险因素动态关联规则
由于风险因素处于一种动态变化的过程中,在不同阶段,其影响有强有弱,如果不对其进行分析,就有可能导致需要分析的数据过多,为风险评价带来更多的数据负担,降低评价效率。而且对司法系统的运行和应用环境来说,在对其存在的风险问题进行评估时,风险因素关联规则通常是静态不变的。但当前司法系统引入大数据技术后,司法大数据运行环境发生了改变,相应的信息管理平台也发生了改变,如果在管理过程中仍然采用传统的静态关联规则对风险进行评估,就无法确保评估结果的准确性。因此,基于该问题,该文首先引入人工智能技术,利用人工智能技术的强大数据分析能力对不同风险因素的支持度和置信度进行计算,再对风险因素动态关联规则在时间变化过程中的动态特性进行详细描述。其中,支持度表示某一安全应用风险事件与某一风险因素同时出现的概率,如公式(1)所示。
式中:为支持度,即某一安全应用风险事件与某一风险因素同时出现的概率;为存在和同时发生的事件次数;为所有事件发生的次数。
根据公式(1)求出支持度,再计算它的置信度,置信度可以用来表示在出现某一风险因素的同时造成某一安全应用风险事件发生的概率,如公式(2)所示。
式中:为置信度,即出现某一风险因素同时造成某一安全应用风险事件发生的概率;为发生某一安全应用风险事件的总次数。
在公式(1)和公式(2)的基础上,根据对支持度和置信度的计算可以排除无关的因素,减少数据分析的数量,提升风险评估的动态化水平和准确度。在司法大数据信息管理平台中,对所选择的评估样本进行分块处理,并将处理后的结果输入相应的集群节点中,利用现有静态关联规则对每个节点的支持度和置信度进行计算。同时,在司法大数据中寻找频繁项集时,引入关联规则可有效排除支持度和置信度过低的数据,从而进一步减轻评估的负担,如图2所示。
图2 风险因素动态关联规则示意图
风险因素在不同过程中的重要程度也不同,当其为不频繁因素时,与其相关的所有数据的支持度和置信度均过低,应该删除相关风险因素。而一旦其为频繁因素,就可以认为该风险因素十分关键,需要对其进行着重分析。例如如果某一风险因素为不频繁因素,即支持度和置信度过低,则与相关的、、以及等都不频繁,则可直接将其删除。而如果某一风险因素为频繁因素,即支持度和置信度较高,则与相关的、、以及等都较为频繁,需要对所有相关因素进行分析。在完成上述操作后,从信息管理平台中获取本地相关司法大数据信息集合,并在mapper中输入1个已知的数据进行记录.除此之外,还要尽可能地在信息管理平台中完成对内容的简单合并,并将关键值统一分配到reducer中,从而对数据进行简化、统计。最后,还要根据支持度从小到大的顺序对风险因素进行排列,并按照置信度从小到大的顺序对风险因素中的子因素进行排列,排除那些支持度和置信度过低的风险因素,以此减少无关数据的干扰,提升分析速度,从而获取风险因素动态关联规则。
1.2 司法大数据应用风险显著性因素计分
在获取司法大数据风险因素动态关联规则的基础上,对司法大数据应用风险显著性因素进行计分,在司法大数据信息管理平台中,根据上述内容按照从小到大的顺序对所有存在的风险因素进行排序,在该基础上进一步排列出4种不同等级程度的应用风险第二次出现的概率级别。其中,较差等级的计分范围为0~3,一般等级的计分范围为3~5,较好等级的计分范围为5~8,最好等级的计分范围为8~10。在划定好以上等级计分范围后,还需要对以上内容的含义进行深入认识。该文设定上述风险显著性因素的计分数值越高,则说明再次出现该应用风险事件的概率越高;如果风险显著性因素的计分数值越低,则说明再次出现应用风险事件的概率越低。
同时,在计分过程中,对计分的标准进行设定,例如对已经发生过的应用风险次数进行再次计分,如果没有出现类似风险问题,则记为3分;如果出现一次,则记为2分;如果出现2次或3次,则记为1分;如果出现4次及以上,则记为0分,以此类推完成对其他风险显著性因素的计分工作。而且还可以对已经发生过的应用风险事件持续时间进行打分,如果持续时间小于1 min,则记为3分;如果持续时间为1 min~5 min,则记为2分;如果持续时间为5 min~60 min,则记为1分;如果持续时间超过60 min,则记为0分。利用3种打分标准可以减少单一打分容易出错的问题,提高分析的准确性。
在按照上述打分标准,针对所有风险显著性因素进行打分后,可以为后续的司法大数据应用风险的量化提供重要数据支持。
1.3 司法大数据应用风险量化
将司法大数据信息管理平台中所有需要进行风险评估的样本作为评估集合,通过量化所有风险结果的方式对司法大数据应用风险进行评估。由于NSS具有系统交换和数据库的功能,可以存储相关数据并进行分析管理。因此,在量化过程中引入网络子系统(NSS)完成这一部署,如图3所示。
图3 NSS部署流程示意图
由图3可知,将不同的司法大数据输入NSS中,经由NSS分析处理并对其进行量化,可以输出对应的风险态势。在量化时,假设某一种司法大数据应用风险事件发生时,其对应的风险显著性因素权重为,则在某一节点上,发生这一风险事件的概率为,结合得到如公式(3)所示的量化公式。
式中:()为通过量化后得到的司法大数据应用风险评估结果。
将公式(3)带入司法大数据信息管理平台中,对不同时刻下平台的运行情况进行分析,并对其可能存在的司法大数据应用风险进行评估。同时,引入NSS后,能够结合量化后的评估结果对司法大数据应用运行风险的态势进行评估,再根据量化结果数据的变化,直观地描述司法大数据应用运行风险未来发生概率增高或降低的趋势,如果量化结果数值逐渐降低,则说明该风险事件发生的概率将会逐渐增加;反之,如果量化结果数值逐渐升高,则说明该风险事件发生的概率将会逐渐降低,从而为后续司法大数据的应用策略提出与设计提供更加直观的事实依据。同时,在对司法大数据信息管理平台进行维护时,也可以根据风险评估量化结果对平台运行等级进行划分,从而对整个司法大数据应用环境进行评估。
2 对比试验
通过该文的论述,从理论方面实现了对基于人工智能技术的评估方法设计。为进一步验证该方法在真实司法大数据应用环境中的风险评估水平,将该评估方法与传统评估方法(基于贝叶斯网络的风险评估方法)进行对比,使2种方法同时对相同的司法大数据应用问题进行风险评估。在评估时,选择司法系统中的部分案例作为评价对象,分别利用2种评估方法对其进行评价,为确保试验结果的客观性,将2种评估方法的最终结果按照表1的内容划分为5个不同等级。
表1 司法大数据应用风险评估等级
由于2种评估方法得出的评分结果标准不同并且由于传统评估方法未对不同风险因素的支持度和置信度进行计算,无法对其评估过程进行量化,因此,需要按照如公式(4)所示的方式对传统评估方法得出的结果进行初步量化。
式中:()为传统基于改进犹豫模糊集的评估方法评估结果的量化数值;p为司法系统中某一试验应用实例发生安全风险事件时的概率;w为司法系统中某一试验应用实例在评估过程中的权重数值。
按照上述内容,对传统评估方法的评估结果进行量化,并对2种评估方法得到的量化结果进行归一化处理,如公式(5)所示。
式中:为2种评估方法得出的评估结果归一化处理结果;为2种风险评估方法的评估量化结果;为不同评估指标下评估结果变化参数的平均值;为均值标准差。
根据公式(5),对2种方法评估结果进行归一化处理后,按照表1中的风险评估等级对其进行分类,并将分类结果与实际司法大数据应用实例的风险等级进行对比,从而验证2种评估方法的评估精度,方法A表示该文提出的基于人工智能技术的评估方法;方法B表示传统评估方法,试验结果见表2。
表2 2种评估方法评估结果等级划分
根据表2中的数据可以看出,在不同风险评估等级实例数量的影响下,该文方法评估结果与实际结果完全一致,而传统评估方法得出的结果与实际相差较大,差距最大可达到64例。由此可以证明与传统评估方法相比,该文设计方法的风险评估效果更好。
综上所述,将该文提出的基于人工智能技术的应用风险评估方法应用到实际司法大数据应用环境中,可提高安全风险事件评价的精度。将该方法应用于实际,可为司法大数据应用策略提供重要的事实依据,具有一定应用价值。
3 结语
针对当前信息管理平台在对司法系统在运行过程中存在的风险事件无法进行准确评估的问题,该文对其风险评估方法进行设计研究。通过引入人工智能技术提出了一种全新的评估方法,并结合对比试验验证了该方法的应用效果。但由于研究能力有限,该文在试验过程中所选择的对照条件只能够对风险事件进行定性评估,在对其量化时采用的方式可能不适用于该方法,因此造成了传统评估方法试验结果与实际出入较大的问题,使影响因素增加,最终得出的试验结果存在一定的不确定性。因此,针对这一问题,在后续的研究中,还将选择更符合试验需要的对照条件以及试验操作环节,从而确保试验结果的客观性,也为该文评估方法的进一步优化提供重要依据。