算法“黑箱”下人工智能安全存疑可解释性让AI更透明

2022-12-18

中国科技财富 2022年2期

文／本刊记者陈杰

“AI的应用落地在不断提速，但在算法‘黑箱’下，AI的不可解释性让‘黑箱’很难释明，进而让人们对AI的安全难言放心。”日前，在2022年科技向善创新周上，与会专家围绕AI的透明和可解释难题从技术角度直指产业痛点。

与此同时，由腾讯研究院、优图实验室等多家机构组成的跨学科研究团队历时一年完成的《可解释AI发展报告2022》也引发热议。报告从可解释AI的概念、监管趋势、行业实践、发展建议等热点问题出发，抽丝剥茧地呈现可解释AI产业的现状和发展趋势，以期能为产业解决AI“黑箱”释明难题提供一份参考和借鉴。

可解释AI已成热点

目前，部分人工智能应用已成为通用型的技术，而人类对AI则一直有更高的期待。不少人坚信，科幻电影《Her》中的AI机器人可对行为作出解释，从而帮助人类作出决策，甚至与人类产生深度交流的一幕，迟早也会出现在人们的日常生活中。

虽然产业的发展已经起步并快速成为行业热点，但这些过于理想化的场景目前还只能存在于科幻作品中，实践中可解释AI不论在技术上还是体验上都还没达标。

如今，金融机构的贷款审批都是基于AI作出决策，如果这一复杂的算法风控系统拒绝申请，那么贷款人就没办法获得贷款。这只是AI在众多日常场景应用中的一幕，只要是AI做出了决策，公众就必须接受结果，至于什么原因，算法没有也不可能给出解释。

“有时候连开发人员都不能很好地理解AI算法‘黑箱’运作的具体细节，这就导致了AI模型的透明度和可解释性的问题。”腾讯研究院秘书长张钦坤表示，如果不解决这两个问题，不仅影响用户对AI应用的信任，而且也可能会带来算法歧视、算法安全和算法责任等方面的相关问题。

其实，人工智能的可解释以及科技伦理等问题已经成为AI领域的必选项，2021年起始的“十四五”规划里面也明确强调要健全科技伦理的体系。

厦门大学人文学院院长朱菁认为，AI可解释性问题之所以受到重视，主要因为AI的发展虽然变得越来越强大，但也变得越来越“黑”，再者AI虽然变得越来越实用，其可靠性和应用范围也得到提高。“在一些重要的应用领域，对于AI可信任性、安全性等方面的要求也越来越高，可解释性就是满足上述要求的认知基础。”

目前来看，国内企业在可解释AI实践方面还比较零碎，没有达到系统化的程度，但就整体而言，产业一直都是朝着可解释的方向发展。

鱼和熊掌不可兼得

AI快速深入日常生活，既带来了兴奋和期待，也带来一些忧虑，甚至恐慌。AI到底是人类的好帮手，还是会成为人类强劲的对手？其实这很大程度上取决于人类对AI的理解。只有打开了人工智能的黑箱，了解到AI背后的机制，并认为它是可解释、可理解的，人类在这种共识下才能真正达成对AI的信任。

然而，当前的AI可解释性及透明度与算法的高效率还是一个矛盾体。

微众银行首席人工智能官杨强认为，AI算法高效率的同时，可解释性就很差。同样，AI线性模型的准确率没有那么高，它的可解释性相对就会强一些。“这就意味着我们要在可解释和高效率两个维度上做一个取舍，但目前并没有两个维度都高的AI算法。目前可解释AI在各个行业都是一个起步，也都不可或缺，但如何做好AI可解释的量化，才是当前业界该考虑的重点。”

“不同人群、不同应用场景对AI算法的可解释性期待是不一样的，不应该搞一刀切。现阶段深度学习普遍缺乏可解释性的情况下，AI透明度就尤其重要。”腾讯天衍实验室负责人郑冶枫表示，AI算法应尽可能详尽披露模型、训练数据分布等情况。

朱菁也认为，目前来说，AI的可解释性和预测的准确性二者不可兼得，既提高预测准确性，同时还要把可解释性提高，要实现这件两全其美的事情难度比较大。其次，解释的多元化除了怎么都行的这种形态以外，还有孤岛式的、互动式的以及整合性的形态。“这些只是同一个整体的不同侧面，AI能不能做到这些，现在其实并不是很清楚。”

推动可解释模型构建

可解释是可信AI的重要组成部分，也是可信的前提条件之一，它有很强的独特性。当前可解释AI研究思路很多，但并没有一个明确的框架，毕竟解释对象的不同，框架也难统一。

香港中文大学（深圳）吴保元副教授认为，与其说AI的可解释性，还不如称之为AI的可解释力。“可解释性可能会让人们误认为这是一种性质，而可解释力就是一种可解释的能力，就如同人们常说的理解力、领导力，是一种手段，一种行为，一种操作的存在。”

《可解释AI发展报告2022》从科技向善的角度出发，认为需要找到一个平衡的可解释AI路径来实现可信AI，确保科技向善。张钦坤解释说，就是在设计可解释性要求时，需要充分考虑可解释性要求和其他重要的伦理价值和目的，可解释本身不是目的而是手段。“在设计可解释AI的时候，首先需要考虑实现什么样的目标，其次才是思考在特定的情境下如何更好地匹配这些目标。”

对于AI研究里的解释性问题的基本立场，朱菁的建议是解释的多元化：“针对不同的问题，哪怕是在同一个领域里，也不能指望只有唯一的解释方式或模式，要允许多种多样的解释模型存在。”