人工智能的标准制定
2020-02-22孟昭青
编者按
国际标准化组织是世界上最大的国际标准开发和发布机构,是包含162个国家成员的国家标准机构网络。它是一个非政府组织,在公共和私营部门之间搭建桥梁。文章分析了应用人工智能技术较广泛的医疗健康领域、智能交通领域和金融领域,介绍了为人工智能建立通用术语和标准的必要性。本文原载于2019年12月的《质量文摘》(Quality Digest)。
随着人工智能(AI)在各个行业领域日益普及,为AI建立通用术语体系和标准,并检查AI的各种应用比以往任何时候都更加重要。在国际标准化领域,ISO(国际标准化组织)和IEC(国际电工委员会)的联合技术委员会JTC 1(信息技术委员会)SC 42(AI分技术委员会),正在进行大量工作,以建立一个精确和可行的AI定义。SC 42正在通过其WG 4(第四工作组)研究AI的各种用例和应用程序。WG 4的召集人是富士通实验室的高级AI专家丸山文裕。
目前,WG 4正在审查70个用例。其中,健康是一个被广泛关注的领域。丸山文裕描述了这样一个用例:一个应用程序对医学领域现有的研究论文和数据库中的100亿条信息进行“知识图谱”分析。然后,该应用程序试图呈现出给定基因突变到深度学习预测疾病的可能发展路径。
健康解决方案
拉德万•乌德瑞里是E a g l e Genomics公司的首席数据科学家,他从事“计算机模拟”研究,这是主要由计算机或数据驱动的创新。乌德瑞里关注的一个领域是微生物组,包括人的肠道、口腔或皮肤中的微生物(如细菌、病毒和真菌)包含的所有遗传物质。微生物组不局限于人类和其他动物身体上,因为海洋、土壤和河流都拥有影响整个生态系统的微生物群落。微生物组的数据非常复杂,因为它是多维和组合性的。乌德瑞里的同事使用AI和机器学习计算工具分析微生物组数据,以探询人类根本无法察觉的关联。这从根本上提高了生产率并获得了革命性的发现。它辨识了新的组成成分和治疗目标,并提供了更安全、更有效的行业实践。
AI技术已经被用于分析人类肿瘤,但是正如SC 42的加拿大代表、外科手术安全技术AI总监、多伦多大学的计算机科学副教授弗兰克•鲁齐兹指出的那样,这只是AI的应用之一。例如,最近的一个应用程序可以识别老年患者的早发性痴呆。之前,护理机构的医生通常每6个月对患者进行一次为期15分钟的评估,现在改为向他们发放平板电脑,并要求他们口头回答一系列问题。该应用程序会在发现问题后向医疗团队发出警报,例如患者的声音模式发生变化或患者无法在家庭组的图像中发现明显的人际关系等。
乌德瑞里还与一家公司合作开发了一个AI解决方案,该解决方案通过插入鞋底的芯片进行工作,最初旨在通过收集生物力学指标并测量诸如鞋子使用和运动表现等方面的数据,来使鞋子更智能。该应用程序非常成功,以至于相关技术的进步很快就可以用于检测患病(如帕金森氏症)的可能性,方法是通过分析个人的行走方式。
万物皆智能
当然,SC 42的工作将不仅影响健康领域。丸山文裕还列举了一个使用超声波检查风力涡轮机的AI程序。该程序会标记出涡轮机任何可能存在缺陷的部分,从而为人类检查专家指引道路,以便他们对解决方案做出明智的选择。更重要的是,由于该AI程序完成了初始检查,可以腾出时间来让人类专家检查更多的涡轮机。
智能交通系统是另一个已经高度依赖A I 的领域。O h m i o Automotion是一家是专注于智能交通系统的公司。该公司的研发负责人马哈茂德•希克马特特别提到了激光雷达技术。该技术使用激光而不是声音或无线电频率,来测量汽车与物体之间的距离。如果将几束激光相互叠加并以最快的速度旋转,将获得3D“点云”,显示给定对象可能的距离。该应用程序可用于无人驾驶汽车,它甚至可以区分不同植物的叶片。
希克马特还重点介绍了无人驾驶汽车的人群计数AI。这是一种预测分析应用程序,它从智能交通系统(而不是汽车本身)的基础设施提取数据。摄像机监视人们来回走动的情况,人工智能预测他们与他人交互时可能的“路线”。这些数据被汽车提取后,可用于防止任何可能的碰撞。
机器学习的行为训练
YOLO是一种对象识别技术,该技术可在最微小的程度上识别不同对象的差异之处。它在安全性方面具有明显的应用。行为克隆是AI的另一个领域,其中机器通过强化训练来学习一系列任务。希克马特解释说,这种方式“根据神经网络行为的正确与否对其进行奖励和惩罚”。根据从人类用户那里收到的奖励或惩罚信号,神经网络学习关于其应该如何“表现”的知识。
风险投资是乌德瑞里的一个关键工作领域,其中令人兴奋的部分是将“整个创业过程”数字化和系统化。该平台通过收集整个企业生命周期中的数据,识别创新挑战并对信息进行分类,从而提供有关公司绩效、增长潜力和估值的预测模型。这样建立的风险预测可以在风险投资选择过程和整个创业过程中发挥作用。到目前为止,这种信息是通过对人们的问卷调查而收集的。它们在本质上更聚合,不容易建立预测模型,或者常常导致产生偏差的结论。毕竟,公司所有者自然都希望他们的项目能够成功。
我们绝大多数人可能没有听说过上述例子中这些特定的AI技术,也很少了解它们的影响。当前的AI解决方案通常是在“孤岛”中开发的,并且是为非常专业的应用而构建的。当在整体框架(例如SC 42正在开发的横向框架)中进行考虑时,它们的真正力量将得到充分发挥。
标准的作用
有关AI的国际标准正在开发之中。乌德瑞里建议,这些标准需要“澄清炒作”,以便原本对AI的恐惧和反对变得能够被接受,或者被直接予以驳斥。关于AI的激进想法经常在媒体和其他公共论坛上得到大张旗鼓的宣传,无论好坏。然而,正如丸山文裕所指出的,许多想法永远都停留在概念验证阶段。
消费者确实需要保护,使他们免受公司使用“AI”这个词语抬升股价、促销产品给他们带来的伤害。鉴于AI数据处于软件工程、神经科学、决策制定等许多不同领域的交汇处,因此开发一个通用框架,使消费者、生产者和监管者能够拥有一种通用语言至关重要。
这并不像听起来那样荒谬或不太可能。专家们谈论“AI的冬天”,是因为前几代的AI技术达到顶峰后,由于实验方向的错误以及随之而来的资金撤出而衰落。同样的事情有可能再次发生,并破坏当今世界的许多进步。
现状
正是因为AI技术发展得如此之快,所以才需要相关的国际标准。用乌德瑞里的话来说,这些标准应该专注于“实践的现状,而不是行业的威胁”。SC 42已经编制了技术报告草案,并正在制定标准。SC 42正在与国际标准化组织统计方法应用标准化技术委员会(ISO / TC 69,统计方法的应用)合作,面向机器学习领域,在统计、软件工程、AI、数据科学和运筹学之间映射术语和概念。
丸山文裕认为,制定国际标准的最佳方法是围绕有限的替代方案进行整合,并“专注于技术已经稳定的方面”,越过概念证明阶段创建一种通用语言和标准来。另一个重点领域是描述开发AI应用程序的过程和生命周期,其中必须包括用例和应用程序中的道德和社会因素,它们将有助于满足消费者的广泛需求。第三个领域集中在模型验证上,它在本质上是高度技术性和统计性的,但是能确保应用程序和机器执行预期的工作。