支撑人工智能质量保证
2022-06-25陈敏刚
文/陈敏刚
随着人工智能系统在各领域的广泛应用,人工智能系统的质量保证问题成为其实际应用中的关键因素。考虑到人工智能技术目前仍被认为在一定程度上存在“不确定性”,基于人工智能系统的质量保证领域尚存在诸多挑战。
加快行业布局
人工智能是我国重点发展的产业之一。2017年,国务院印发的《新一代人工智能发展规划》,提出了面向2 0 3 0 年我国新一代人工智能发展的指导思想、战略目标、重点任务和保障措施,构筑我国人工智能发展的先发态势,加快建设创新型国家和世界科技强国。2018年后,我国又先后出台了《促进新一代人工智能产业发展三年行动计划(2018—2020年)》《关于促进人工智能和实体经济深度融合的指导意见》等政策性文件,提出要加快行业布局和规划,在国际竞争中抢占先机。
上海将人工智能作为本市重点发展的三大先导产业之一,推动人工智能产业健康发展。2017年,上海发布《关于本市推动新一代人工智能发展的实施意见》,要求全面实施AI@SH行动。截至2020年,上海人工智能重点企业1 149家,全年产业规模达到2 246亿元;已形成了较为完备的人工智能产业链,重大创新成果接连涌现,应用赋能价值不断凸显,“4+X”特色载体格局基本形成,产业生态进一步完善;人工智能“上海方案”获批实施,国家新一代人工智能创新发展试验区、创新应用先导区建设稳步推进,3届世界人工智能大会成功举办,这些举措使品牌知名度进一步打响,为“十四五”期间建成人工智能“上海高地”、打造世界级产业集群奠定了良好基础。
行业的健康发展,离不开质量保证,新的产业发展目标同样也对质量保证工作提出了更高的要求。
质量保证活动
人工智能是一种软件系统,它所包含的需求分析、数据采集、设计与开发、测试和部署运维等环节都有必要进行适当的质量保证活动。据《上海市人工智能行业质量状况调查报告》显示,47.32%的企业对“人工智能系统的故障导致对人类生命、健康、财产或自然环境的威胁”进行评估,58.03%的企业对“人类或其他系统对人工智能系统攻击带来的安全隐患”进行评估,77.67%的企业对“人工智能系统对个人隐私数据带来的侵犯和泄露的风险”进行评估,这些风险评估都属于质量保证活动的一环。
举个简单的例子,新冠肺炎疫情期间,社会对智能测温仪器存在大量需求。测温仪器准不准、灵敏不灵敏、对工作环境要求高不高等,都将对防疫工作有重要影响。通过制定智能人体温度检测与识别系统的标准——《智能人体温度检测与识别系统技术要求和测试评价方法》(T/CESA 1008-2020),可解决这个问题。T/CESA 1008-2020主要包括功能指标和性能指标。功能指标要求人体智能测温不仅要检测出人脸,还要检测出额头(因为人体不同部位的温度不一致,所以统一以额头区域的温度作为基准),准确地检出体温异常的人员;性能指标则关注人体温度的测量精度和速度等,标准规定的温度误差不超过±0.4℃,测温时间则不大于1 s。
缺少标准化方法
人工智能系统的质量保证是个新的研究领域,目前缺少基于人工智能系统质量保证的标准化方法。鉴于自身的特性,人工智能系统在质量保证方面存在诸多挑战。
因斯布鲁克大学的Michael Felderer和奥地利哈根贝里软件中心的Rudolf Ramler在《基于人工智能系统的质量保证:概述和挑战》中阐述:软件应具有准确性和正确性,而基于人工智能的系统由于其内在的不确定性被认为是存在固有“缺陷”的,它通常在一个精度范围内运行。这与常规测试和质量保证原则及方法的假设是相悖的,即系统被默认应该是正确的。同时,机器学习和深度学习训练的模型被认为是不透明、不直观、难以理解的。开发人员和测试人员习惯于对传统软件系统进行规范和定义,这些规范和定义提供了理解、构建和测试系统所需的知识。但是,当人工智能模型确认存在缺陷时,模型的“黑盒子”特性会影响模型的测试。
因此,常规的测试标准和质量度量方法不能完全适用于基于人工智能的系统,而且目前,人工智能更迭速度非常快,其更新时间已经以天为单位。这就导致了行业标准水平远远落后于产业发展水平,一些系统在应用时无标准可以依据,质量保证工作也缺少对应的参照物。
结 语
人工智能行业对更高质量和更大范围标准的应用需求很大,需要全社会投入更多的资源去实践和探索人工智能的技术应用与测试评估规范,逐步建设一套完整的标准体系,为产业健康发展保驾护航。