人工智能助力政法网络舆情风险防范
2022-04-07詹海宝
■詹海宝
习近平总书记指出:“让互联网成为我们同群众交流沟通的新平台,成为了解群众、贴近群众、为群众排忧解难的新途径,成为发扬人民民主、接受人民监督的新渠道。”在人工智能、大数据、全媒体时代背景下,政法网络舆情应对面临一系列新问题、新挑战。作为舆情中关涉面最广、影响程度最深、发生频率最高的政法网络舆情,是社会稳定的晴雨表,如若对其风险防范不慎,便可能对政法机关的公信力带来较大负面影响,甚至影响社会稳定。政法网络舆情风险防范是衡量司法公开成效、表征司法公正实现程度、测量民意走向的重要量化手段,利用人工智能技术助力政法网络舆情风险防范,不仅能破解传统技术支持下政法网络舆情风险评估诸多现实困境,而且还能提升司法公信力和司法权威,进而实现民意与司法的和谐互动。
传统技术支持下政法网络舆情风险防范的挑战
面对突发事件如潮的网络舆情,近年来各级政府、企事业单位及机构日益重视,成立专门机构,启用监测系统。但是,一些地方对舆情的风险评价仍然认识不足,重视不够,难以适应现实需求。现阶段政法网络舆情分析的不足可以主要归结为“人机不协调”的问题。在应当使用机器进行学习和处理的权重配比、走势预测、情感分析、效果检查上,现实应用显得机械化、浅层次;而在应当使用人工进行分析的特征维度划分、对策建议提供上,现实应用又显得粗糙、重复,且机器对人的辅助不够有力,分工协同的模式还不成熟。
得益于数理算法和计算机科学的发展,人工智能时代的机器学习能力日益增强,这为政法网络舆情分析领域实现自动化、精准化、智能化创造了新的契机,而实现新要求的关键点在于切实实现网络舆情分析领域中的人机互动与双向协同。尽管当前政法网络舆情风险评估的学理争鸣持续发酵,司法实务部门的试点改革也如火如荼,然而从防范结果的实际运用来看,仍面临着信度和效度的双重考验,以及防范结果的形式化和浅表化等现实困境。
传统技术环境下,基于小样本抽样调查的政法舆情风险评估与防范策略,无法避免个人经验的有限性对舆情风险评估与防范过程的客观性造成较大不利影响,而且无法实时动态评估与防范政法网络舆情风险。即便利用大数据技术可以实时抓取与分析政法网络舆情数据,但若缺乏人工智能技术强大的分析算法,所有的分析都难免粗糙与浅表,无法满足政法网络舆情风险准确实时评估的要求。
人工智能助力政法网络舆情风险准确实时评估
人工智能的数据挖掘技术、可视化技术和自动化分析在评估政法网络舆情风险中具有巨大的优势,可助推司法舆情监测的常态化、预警决策的精准化。通过政法网络舆情典型案例的人工智能语义分析与关键词识别,可以建立政法网络舆情辨识语料库,基于该语料库构建主题爬虫程序,全网采集信息形成该主题舆情大数据。对所采集的大数据舆情进行智能情感值判断,通过设定风险基准值构建政法网络舆情风险预警机制,以实时准确评估政法网络舆情风险水平,为政法网络舆情风险防范提高决策参考,为相关司法政策的制定提供重要支持。
人工智能算法强大的处理能力,以及大数据主题爬虫实时的采集能力,可保障政法网络舆情风险评估的实时性,大数据舆情信息来源的多样性与全样本性保障了评估的准确性。若该政法网络舆情信息的情感值低于所设定的风险基准值,应及时预警并根据政法网络舆情的传播规律科学引导,疏散相应极端负面舆情,以防范极端言论的肆意传播。
此外,大数据时代数据是创新理论研究与实践应用的重要驱动力,利用大数据的关联算法可深度挖掘研究主体或应用主体的潜在特质与规律。维度多元、噪音量低的大数据集非常难寻,特别是政法网络舆情意识形态数据的获取更是难上加难,建立此类问题研究或应用的基础数据共建共享机制便显得尤为必要。
政法网络舆情是一个对象特殊、意义重大的研究问题,其关涉社会稳定与国家安全,网络社会的隐匿性与易传播性使政法网络舆情的研究更为复杂,需要各界研究力量共同参与,以政法网络舆情的监测与干预开放案例库为基础,建立政法网络舆情数据库,通过共建共享机制,发挥学界、业界与政界等各方力量,按照一定的规范共同参与数据的上传、共同享用数据的使用权,数据内容涵盖该主题舆情事件的实体、关键词、事件要素与引导成效等维度。该数据库可实现学术资源的共享,为政法网络舆情相关研究提供数据支撑,同时也可为政法部门的决策提供一定的参考。
基于人工智能的政法网络舆情风险防范策略
人工智能技术虽有强大的分析算法,但若缺乏大量优秀经典的训练集作为机器学习的对象,算法模型的分析智力也只会处于初级水平。若要利用人工智能技术评估与防范政法网络舆情风险,就需要构建一个可供人工智能算法学习的政法网络舆情监测与干预案例库。人工智能算法在基于该数据库进行机器学习的过程中,可寻找出大量政法网络舆情概率上的特征,凭借之前的监测与干预经验,将有可能产生重大影响的政法网络舆情在萌芽期识别出来,并设计回应办法,进行智能化舆情引导,以达到风险防范之目的。
在此探讨一下政法网络舆情监测与干预案例库的构建方法。首先,基于监测过程中所采集到的政法网络舆情数据,利用政法舆情传播理论,推演出该政法网络舆情的传播规律,在深度分析传播规律的基础上,形成政法网络舆情的引导对策。接下来,收集完整的监测、引导活动,并以此为基础构建某主题舆情的监测与干预案例库。为保障该案例库中相似度计算和议题推演的科学运行,便于司法部门对相关案例进行检索和浏览,并能实时查看相关事件的处置决策办法与处置效果,需要对该案例库中每一个入库案例进行细致详尽的描述。案例库中事件字段越细粒度,新增案例知识的相似度计算越方便。为提高对类似舆情事件处理的参考性,还需专门设计数据表以存储舆情处置方法与过程、司法部门对舆情事件的干预措施。该案例库也可以遵循共建共享的原则,任何致力于研究或管理政法网络舆情的学术机构或管理机构,都可以申请加入该数据库的建设,贡献本机构拥有的相关数据,同时拥有对该数据库相应数据的使用权限,以此提高该数据库的生命力。
基于以上所构建的数据库进行人工智能分析,可归纳出政法网络舆情的议题框架,该议题框架可精准反映政法网络舆情存在的问题,为政法网络舆情风险防范策略的制定提供科学依据。
关于政法网络舆情议题框架的构建,包括基于语义网络的整体框架提取、议题框架量化分析两个过程。在整体框架提取的过程中,调用汉语分词系统进行文本分词等数据预处理,根据词频筛选来确定核心词汇,并对核心词汇进行共词分析,从而得到核心词汇的初步语义网络关系矩阵,再对该共词关系矩阵进行聚类分析,从而获取核心词汇的不同集群,采用核心算法,模块化分析全部案例的语义网络,识别出特质相异集群与其分布比例。最后,基于集群中的核心特征词汇,利用机器学习自动编码每个集群的议题,从而计算出整个案例库的议题框架分布。在议题框架量化的过程中,采用高阶统计语言模型对每个案例所含的议题框架进行精确统计,并且计算出每个议题讨论量的相对大小。
利用以上对政法网络舆情的大数据挖掘、人工智能语义网络分析以及无监督机器学习,可科学提取与量化其议题框架,动态精准诊断其中存在的问题,为政法网络舆情风险防范策略的制定提供科学依据。
应该说,人工智能的实现,得益于科学界量化整个世界的尝试。科学界试图构建模型来表达纷繁复杂的客观世界,并得到了许多成就。这些成就在一定程度上鼓励了“计算主义”哲学的发展,信奉计算主义的人认为世界在极大程度上是可以被量化的,因此,人工智能才能够比我们想象的更接近人类。显然,这种信仰并不代表真理,相反,有更多的学者质疑,我们的世界中不能量化的问题远远多于可以量化的问题。现代经济学、社会学、政治学的一些研究也表明,在人为世界中,人的复杂程度远超过人类自己的想象和技术可以完全把握的能力,所以人工智能只能无限接近人类而不能完全替代人类。