2022AI指数报告:AI“造脸”真假难辨
2022-05-07常莽
常莽
近日,斯坦福大学发布了《人工智能指数2022》(Artificial Intelligence Index Report 2022)报告,这是斯坦福大学连续第5年发布该类型的报告,该报告旨在成为世界上最可信、最权威的AI数据和洞察来源。2022年的报告分为5个章节,包括最新的研究进展、技术、AI伦理、投资与教育和AI政策。
研发是推动AI快速发展的不可或缺的力量。每年学术界、工业界、政府和间组织通过量论、期刊章、人工智能会议等为AI研发做出贡献。2010 - 2021年,人工智能出版物的总数翻了一番,從2010年的162 444篇增长到2021年的334 497篇。
其中,2021年这些出版物的51.5 %是期刊章,21.5 %是会议论,17.0 %来自存储库。细分领域方面,自2015年以来,模式识别和机器学习方的出版物增加了倍多。其他受深度学习影响较的领域,如计算机视觉、数据挖掘和自然语言处理,增幅较小。
按论文来源的部门来分,教育机构仍是AI研究的主力,而美国和欧盟的公司参与研发的程度也很高。值得一提的是,中国是唯一一个教育比重不断上升的国家。而且,迄今为止,过去12年中美国和中国之间的合作数量最多,自2010年以来增加了5倍。其次是英国与美国和中国之间的合作,增加了自2010年以来增长了3倍多。2021年,美国和中国之间的合作数量是英国和中国之间的2.7倍。
按地区来看,2021年,东亚和太平洋地区以42.9 %的AI期刊出版物发文量领先,其次是欧洲和中亚(22.7 %)和北美(15.6 %)。此外,南亚、中东和北非的增最为显着,在过去12年中,它们的AI期刊出版物数量分别增长了约12倍和7倍。
按地理区域来分,中国保持领先地位,2021年为31.0 %,其次是欧盟和英国,为19.1 %,美国为13.7 %。
在论文的被引次数上,中国的份额逐渐增加,欧盟以及英国和美国的被引次数减少,这3个地理区域的总引量占全球总引量的66 %以上。
在专利方面,2021年提交的专利数量是2015年的30倍以上,复合年增率为76.9 %。中国的专利数已经占了世界半,并获得约6 %的授权。
AI开源软件库方面,TensorFlow仍最受欢迎的,GitHub累计星数约为161 000,2020年略有增加,远高于排名第二的OpenCV。
在今年的报告中技术性能这章节对AI各个领域的技术进步进了以往更多的分析,包括计算机视觉、语、强化学习等技术的趋势。
计算机视觉
图像分类:图像分类是指机器对图像中看到的内容进行分类的能力。过去年图像识别系统技术取得了巨大的进步,特别是研究人员已经采了更多的机器学习技术。截2021年底,顶级图像分类系统在Top-1准确度上每10次分类尝试平均产1个错误,相比之下,2012年底每10次尝试平均4次错误。2021年,最顶级的预训练系统是CoAtNets,由歌研究员制作。
图像生成:图像成是成与真实图像法区分的图像的任务。如下图所示,2021年,AI已经可以合成非常难以区分的人脸照片。
深度伪造检测:许多人工智能系统现在可以合成与真实图像算法区分的假图像,例如通过换脸来实现所谓的“深度伪造”。近几年,研究人员一直试图通过制作更强大的深度伪造检测算法来跟上伪造步伐。FaceForensics++是一个深度伪造检测基准测试。2012年,最强的AI技术可以在4个Face Forenics++数据集中正确识别69.9 %的深度伪造。2021年,该数字增加到97.7 %。
医学图像分割:医学图像分割是指AI系统在医学图像中分割感兴趣对象(例如器官、病变或肿瘤)的能力。目前,AI能够在CVC-ClinicDB数据集上以94.2 %的正确率识别结肠镜检查息,相比2015年提升了11.9个百分点。
人脸检测:虽然目前的一些面部识别算法的成功率接近100 %,但因为疫情的影响,戴口罩面部识别成为了AI技术新的挑战。2021年,北京邮电学的研究员发布了6 000张蒙脸的脸识别数据集,以应对规模戴罩带来的新识别挑战。研究人员在各种面部识别数据集上运了系列现有的最先进的检测算法,结果表明,与未蒙相,顶级法在蒙孔上的表现要差5~16个百分点。
语言理解
目前的英文语言理解用的最新基准测试为SuperGLUE,于2019年5月发布。在测试中,AI系统在8种不同的任务上进行测试。截至目前最先进的系统为SS-MoE模型,在Super GLUE上的得分为91.0,已经超过了人类。
在另一项斯坦福问答数据集(SQuAD)中,AI最新得分为95.7和93.2,也超过了人类的表现。
但是,对于需要逻辑推理的问题上AI貌似仍力不从心。在由新加坡国立大学科学家创建的数据集ReClor中,困难问题的最好表现只有69.3 %的准确率。
自然语言推理方面,目前斯坦福然语推理(SNLI)数据集表现最好的模型是FacebookAIUSA的EFL,其在2021年4月的得分为93.1%。
强化学习
强化学习的测试标准是2013年推出的Arcade Learning Environment(Atari-57),2019年末,DeepMind的MuZero算法在Atari-57上实现了最先进的性能。到了2021年,来自清华大学和字节跳动的研究人员开发出了GDI-H3模型,该模型在Atari上的性能超过了MuZero -57的近1倍。
机器人
调查结果显示在过去7年中,机器人手臂的价格有明显的下降趋势。2017年,价格中位数机器人手臂的价格是42 000美元。从那时起,价格已经下降了46.2 %,致达到了2021年的22 600美元。并且,现在机器人相关的AI技术的普及率也出现了大幅提升。
工作
新西兰的人工智能招聘增涨最快———2021年是2016年的2.42倍,其次是中国香港(1.56)、爱尔兰(1.28)、卢森堡(1.26)和瑞典(1.24)。此外,2020 - 2021年,許多国家或地区的AI招聘增涨率有所下降
在2021年所有职位发布中,人工智能职位发布的份额最高的是机器学习技能(占所有职位发布的0.6 %),其次是人工智能(0.33 %)、神经网络(0.16 %)和自然语言处理(0.13 %)。
美国信息部的所有职位发布中有3.30 %与AI相关,其次是科学和技术服务(占所有列表的2.59 %)、制造(2.02 %)和金融和保险(1.81 %)。
AI的渗透率方面,印度在智能技能渗透率方面领先世界是全球平均水平的3.09倍,紧随其后的是美国(2.24)和德国(1.7)。之后是中国(1.56)、以列(1.52)和加拿(1.41)。
投资
目前,私人投资仍是AI投融资的主流,其次是并购、公开发行和少数股权。2021年,全球对人工智能的私人投资总额约为935亿美元,是2020年私投资总额的2倍多。
在披露融资额的公司中,与2020年相比,2021年1亿美元~5亿美元的AI融资轮数增加了多倍,5 000万美元1亿美元的融资轮数也增加了很多。
2021年,美国在获得资助的AI公司的总体私人投资居世界首位,约为529亿美元,是排名第2的国家中国(172亿美元)。排在第三位的是英国(46.5亿美元),其次是以色列(24亿美元)和德国(19.8亿美元)。
2021年,美国有299家新投资的AI公司,其次是中国,有119家,英国有49家,以色列有28家。
行业领域方面,2021年人工智能领域最多的私人投资是数据管理、处理和云(约122亿美元)。在过去5年中,医疗和保健类别获得了全球最多的私人投资(289亿美元);其次是数据管理、处理和云计算(269亿美元);金融科技(249亿美元);和零售(219.5亿美元)。
教育
在北美,多数与智能相关的课程都是作为本科阶段CS课程的1部分。2010- 2020年,北美博士机构的新CS本科毕业生数量增加了3.5倍。2020年,超过31 000名本科生完成了计算机科学学位,2019年增加了11.60 %。并且,2020年每5名CS学生中就有1名获得了AI / ML博士学位。
2016~2021年,总共有25个国家通过了55项与人工智能相关的法案,其中美国以13项法案占据榜首,其次是俄罗斯、比利时、西班牙和英国。2021年颁布的法律数量上,西班牙、英国和美国领先,各超过3项。
美国2015年只有一项联邦法案与人工智能相关,2021年提升到了130项。
在2021财年(FY),国防美国政府机构共为AI研发支出分配了15.3亿美元,约为2018财年支出的2.7倍。预计2022财年这一数字将增至8.8%,申请总额为16.7亿美元。
而美国国防部2021年在500个人工智能研发项目中拨款92.6亿美元,比2020年的86.8亿美元增加6.68%。国防部在人工智能上的支出也是最多的,2021年,它在与人工智能相关的合同上花费了11.4亿美元。
总体来看,虽然2021年是个多事之秋,但人工智能的发展仍然一路高歌猛进,私人投资大幅增加、新技术不断突破都给这个行业的发展打了强心剂。尤其值得欣慰的是,在中美国家关系日趋复杂的现在,AI行业的中美合作仍很紧密,这是人类科学技术在冲突与斗争大环境下的一丝慰藉。