前 言
2021-11-25虎嵩林,赵军,唐杰等
虚假信息检测旨在综合应用自然语言处理、社交挖掘、跨模态分析等智能处理手段,发现并利用信息的内在特征、产生机理与传播规律,为以假新闻为代表的虚假、伪造信息的识别与干预提供理论和技术支持.《Science》在2018年3月一次刊发了2篇论文,讨论了假新闻的危害以及对其的科学观察与思考,引发了学术界与产业界对这一科学问题的持续关注.假新闻、谣言、水军贴等形态的虚假信息在新闻网站、社交媒体、电商应用等平台的泛滥,可能严重冲击经济、社会和政治秩序,对智能安全检测技术的创新发展提出了迫切需求.
为促进虚假信息检测领域的研究工作,《计算机研究与发展》推出了“虚假信息检测”专题,以反映该领域研究进展、展望未来趋势,分享典型虚假信息数据的量化分析与观察,并具体研讨基于文本、传播结构以及多模态的虚假信息检测新方法,探索虚假信息干预缓解的新思路.希望这些最新成果能够为读者提供启发和借鉴.
Amrita Bhattacharjee来自亚利桑那州立大学的刘欢教授组,他们的论文“网络信息生态系统中的虚假信息:检测、缓解与挑战”给出了新冠肺炎疫情期间虚假信息的案列研究,探讨了检测虚假信息与减缓影响的方法及其挑战,并简述了跨学科的研究进展,最后对未来研究方向进行了展望.
真实虚假信息数据的整理和量化分析,能够为后续研究工作的开展提供重要的基础.陈慧敏等作者的论文“新冠疫情相关社交媒体谣言传播量化分析”针对现有新冠疫情量化分析工作仅聚焦于谣言内容这一单一要素的不足,利用微博真实数据,对内容、传播者、受众以及效果等传播要素进行了全面分析,为传播现象的科学观察提供了有益素材.
基于文本的检测是虚假信息检测最常用的方法.张东杰等作者的论文“基于主题与情感联合预训练的虚假评论检测方法”采用了2种预训练模型编码器分别抽取评论的语义和情感上下文特征,并进行联合训练和优化,在性能提高的同时体现出了更强的泛化能力.
基于传播结构的方法则通过进一步利用传播结构特征以提升检测效果,是当前的热点研究方向.胡斗等作者的论文“一种基于多关系传播树的谣言检测方法”提出了一种关键节点增强的多关系图卷积模型,以共同建模传播树中父子节点间的层间依赖关系,以及被忽略了的同层转发(或评论)兄弟节点间的层内依赖关系,最终提升了谣言检测尤其是早期检测的性能;杨延杰等作者的论文“融合源信息和门控图神经网络的谣言检测研究”,针对传统基于图卷积网络方法聚合所有邻居节点可能带来的无效信息乃至噪声导入、源帖特征不突出、非相邻帖子间关系特征缺失问题,提出了一种集门控、多头注意力机制以及源帖信息增强的新方法,有效改善了检测效果;徐铭达等作者的论文“基于模体度的社交网络虚假信息传播机制研究”从传播学的新颖角度着眼,综合考虑广度传播和深度传播2种主要传播模式的作用,分别给出了广度和深度模体度的定义及计算方法,并提出了一种简单易用的检测方法,优化结果明显.在传播结构分析中,基于深度学习的图异常检测是常用的工具.陈波冯等作者的论文“基于深度学习的图异常检测技术综述”给出了静态图和动态图上的异常定义和评测指标,并分别介绍了2个方向上的相关研究进展,讨论了当前面对的挑战和未来趋势,帮助读者更好地了解、利用这一技术工具.
虚假信息内容的形态不仅包括文本,还会涉及音视频、图像,并呈现出向多模态发展的趋势,相关的检测技术也吸引了广泛的关注.亓鹏等作者的论文“语义增强的多模态虚假新闻检测”通过提取文本和视觉语义特征,并基于文本引导的注意力机制建模图文间的语义交互,更好地融合多模态特征,有效提高了多模态检测的性能.在听觉和视觉特征利用方面,王成龙等作者的论文“基于全局-时频注意力网络的语音伪造检测”针对现有模型忽略不同维度特征图的作用差异,缺乏全局视图关系利用等问题,提出了一种新型图卷积神经网络结构,取得了较好的效果;翁泽佳等作者的论文“基于域对抗学习的可泛化虚假人脸检测方法研究”,针对鉴别模型在不同生成方法上的迁移难题,引入领域对抗分支提取更鲁棒的特征,提升了模型鉴别性能和泛化能力.
在虚假信息缓解方面,曹玖新等作者的论文“社交网络信息传播预测与特定信息抑制”研究了虚假信息传播预测与免疫抑制问题,采用了一种独立信息转发预测机制进行预测, 并提出异步信息不平等竞争传播模型刻画特定信息与免疫信息的竞争传播,并设计了种子节点选择算法.通过向种子节点注入免疫信息,有效抑制了特定信息的传播.
本专题得到了海内外、产学两界研究人员的积极响应,最终收录了11篇文章. 在此,衷心感谢作者们以及审稿专家们的大力支持,特别感谢《计算机研究与发展》编委会和编辑部为这一专题立项、审校以及付梓等全过程所付出的辛勤工作.