前 言
2023-09-27高阳,钱宇华,连德富
在当前的科技发展背景下,人工智能(artificial intelligence, AI)已广泛渗透到我们的日常生活和工作中. 然而,当AI遭遇开放环境,其复杂和不确定的特性使得决策的偏见、算法的透明度、系统的安全性等问题变得更加凸显,深度挑战了AI的可信度. 因此,研究和开发面向开放环境的可信AI已成为一个紧迫且至关重要的任务. 面向开放环境的可信AI的研究动力,主要来源于几个方面:首先,公平性的考量. 为了避免决策偏见,需要研究如何在复杂的开放环境中保证算法的公平性;其次,透明度的追求. 以便用户可以理解和预测AI系统的行为,需要提升算法的透明度;最后,安全性的强化. AI系统需要在开放环境中,能够对各种可能的威胁进行有效应对,以保证系统的安全性. 构建可信AI不仅需要在技术层面提供解决方案,同时也需要在社会层面建立信任. 通过研发面向开放环境的可信AI,我们不仅可以构建更为公平、透明、安全的AI系统,而且可以提高公众对于AI在开放环境中应用的信任感,对于推动AI的广泛接受和应用,以及推动信息社会的全面发展具有深远的意义.
为了及时反映国内同行在面向开放场景的可信人工智能前沿领域的最新研究成果,加速我国可信人工智能方面研究的突破,《计算机研究与发展》组织策划了“面向开放场景的可信人工智能前沿进展”专题. 本专题通过公开征文共收到60篇投稿,论文从不同角度阐述了可信人工智能的算法设计、关键技术和热点应用,反映了该领域多个方面的最新研究成果. 本专题的审稿严格按照期刊的审稿要求,特邀编委邀请了相关领域的专家,历经初评、盲审、复审、终审等阶段,最终共精选出11篇高质量论文入选本专题,内容涵盖了开放场景域适应、可解释性和鲁棒性、可信人工智能的热点应用等方面,在一定程度上反映了当前国内可信人工智能领域的最新研究成果.
1 .开放场景域适应
针对域自适应中如何准确度量源域和目标域的概率分布距离的问题,孙昊等作者的“基于反向伪标签最优化传输的无监督域自适应”提出反向伪标签最优化传输方法,从最优化特征-拓扑传输的角度更准确地计算了分布之间的差异,并且设计了反向验证伪标签的模块来更有效地利用伪标签;针对传统领域自适应方法在开放集领域自适应场景中导致负迁移的问题,刘星宏等作者的“基于自步学习的开放集领域自适应”提出了一种基于自步学习的新颖框架并设计了一个跨领域混合方法,为目标域样本生成伪标签最大程度地减小了伪标签的噪声;针对域对抗对齐方法中对齐网络和分类网络彼此独立使得对齐任务无法直接服务于分类任务,封筠等作者的“二次解耦与活体特征渐进式对齐的域自适应人脸反欺诈”提出了一种二次解耦与活体特征课程学习渐进式对抗的域自适应方法,通过课程学习的方式对目标域特征与活体相关、无关特征的组合进行渐进式对抗对齐. 开放环境中数据往往是以流的方式呈现的,针对数据的特征可能随时间而演变、数据标记可能存在噪声等问题,张震宇等作者的“面向特征演变环境的标记噪声鲁棒学习算法”提出了一种在特征演变环境中针对标记带噪数据的差异度量方法,该差异度量启发了泛化误差分析,并根据泛化误差的理论分析设计了一种基于深度神经网络实现的学习算法.
2 .可解释性和鲁棒性
针对深度卷积网络现有解释结果依赖独立于原始模型的额外的分类器而出现的解释结果不符合原始模型逻辑的问题,赵小阳等作者的“ADIC:一种面向可解释图像识别的自适应解纠缠CNN分类器”提出了潜在空间自适应解纠缠的可解释 CNN 分类器,其中设计了一种类内概念图编码器学习类内基础概念及其潜在交互和实现不同依赖关系的基础概念不同程度解纠缠的正则化项;针对情境感知的自然语言推理的现有工作忽略了情境信息以及输入句子之间存在的虚假关联,张大操等作者的“针对情境感知的自然语言的因果去偏推理方法”提出一种全新的因果去偏推理方法,缓解了模型在充分考虑情境信息的条件下推理过程受到的有偏信息的影响. 蒙特卡洛树搜索已经成为开放环境下众多领域智能系统的关键通用方法,针对蒙特卡洛树搜索树由于计算资源匮乏或者计算成本昂贵等原因难以完全充分地对树结构进行搜索的问题,以及针对现有算法缺少识别误差和影响因素的分析使得算法的可信性和可解释性较差的问题,刘郭庆等作者的“给定预算下基于相对熵置信区间的蒙特卡洛树搜索最优动作识别算法”提出了固定预算设定下 MCTS 抽象模型的最优行动识别算法,推导了DLU 算法的识别误差上界,并分析了算法性能的影响因素.
3 .可信人工智能的热点应用
针对重购产品推荐忽略了对多层次信息融合建模方法的研究和忽略了重购推荐结果的可解释性需求的问题,耿杰等作者的“基于用户重购行为的产品推荐方法”构建了具有双层注意力机制的可解释用户重复消费推荐方法,通过多层次提取学习用户重购偏好,基于信息处理理论构建S型用户重购动态偏好函数,融合产品流行度信息进行重购产品和新颖产品的混合推荐,提高了模型可解释性和准确性;针对半监督学习范式的动态异质图表示学习方法存在监督信息昂贵和泛化性较差等问题,焦鹏飞等作者的“基于对比学习的全局增强动态异质图神经网络”提出了一种基于对比学习的全局增强动态异质图神经网络,通过对比学习来最大化局部节点表示和全局图表示的互信息来丰富节点表示中的全局语义信息;针对知识追踪方法的预测结果与学生知识画像存在时序、预测粒度不一致导致学生知识画像不可信的问题,王士进等作者的“可信的端到端深度学生知识画像建模方法”提出了一种深度知识画像模型,通过知识粒度上表征学习交互表征、学生知识状态变化建模、学生掌握度预测的设计,提升学生画像的可信性. 针对现有工作大多只在单一层次提取知识而忽略多层次信息交互而导致的特征提取不鲁棒的问题,余鹰等作者的“多层次知识自蒸馏联合多步骤训练的细粒度图像识别”提出了层次知识自蒸馏联合多步骤训练的细粒度图像识别模型,提取了更鲁棒的特征从而提高了整个模型的性能.
我们感激各位作者、审稿专家以及编辑部对本专题无私的贡献和全力支持,有赖于他们的努力,本专题得以顺利出版. 对此,我们致以诚挚的感谢. 可信人工智能是一个发展迅速且活跃的领域,学科前沿的瞬息万变对特邀编委和审稿人的审稿、选稿工作构成了巨大挑战. 受限于投稿数量众多、主题广泛,时间安排紧凑以及专题容量有限,本专题仅挑选了部分具有代表性的研究工作进行发表,遗憾无法全面反映该领域所有的最新研究成果. 因此,一些优秀的稿件未能入选本专题,对此我们感到抱歉,并敬请谅解.
我们特别感谢《计算机研究与发展》的编委会和编辑部的付出,从专题的设立、征稿公告的发布,到评审专家的邀请、评审意见的整合,以及最后的定稿、修改和出版工作,都体现了他们的勤勉和专业. 我们期望本专题的出版能够对相关领域的研究人员提供有益的启示和帮助. 在审稿过程中,若有任何失误或不足之处,我们恳请各位作者和读者的理解和宽容,并热烈欢迎同行的批评和建议. 最后,我们再次向所有参与本专题工作的作者、审稿专家、特邀编委以及编辑部表达最深的感谢,他们的辛勤工作对本专题的出版起到了决定性的作用.