人工智能高薪传奇已不在
2020-03-25冯汉森
冯汉森
过年时节,亲戚朋友们总是对我学的专业“很有钱景”表示祝贺,好像与人工智能相关就是高薪的保障。对此我不置可否。我的专业确实与人工智能息息相关,但高薪也不是必然的。人们对人工智能的过高期待使得前两年从业者的薪资有些虚高了,所以会给大家“做人工智能肯定高薪”的错觉。我以为,今后人工智能的高薪现象或许依旧会存在,却将不再如此传奇,换句话来说,其价值必定匹配其薪资。
什么样的“智能”才算“人工智能”
人工智能行业看起来形势一片大好,然而,相信大家多多少少也能感觉到,现在“人工智能”这个概念已经被炒过头了,很多商家完全是在消费这个概念,靠卖概念来挣钱,实际的产品并没有多么“智能”,或者说只是“换皮智能”,用老的技术披个“智能”的名字罢了。
那什么样的“智能”是有新技术加持的智能?请允许我简单介绍一下这一波“人工智能热”的背景。
大家可能常常在媒体上听到“人工智能”“深度学习”“神经网络”“机器学习”这些概念,他们之间的关系是怎样的呢?下图给出了这个问题的答案。
这次人工智能热的主角其实是“深度学习”,可以说“人工智能”这个大概念很大程度上只是被“深度学习”这个子概念带火了而已。以当前的时间节点来看,越接近“深度学习”的技术,一般就是“智能程度”越高的技术。其他的智能技术各有其适用的场景,但它们并不是这次智能浪潮惊艳世界的主角。
深度学习的崛起是时代的选择,电子设备的快速发展和互聯网的普及功不可没,前者提供了强大的计算资源,后者提供了海量的训练数据,而深度学习的理论其实早有酝酿,并不特别。本领域的权威书籍《Deep Learning》(Goodfellow)是这样描述的:
一般认为,迄今为止深度学习经历了3次发展浪潮:20世纪40年代到60年代,深度学习的雏形出现在控制论中;20世纪80年代到90年代,深度学习表现为联结主义;直到2006年,才真正以深度学习之名复兴。
简单地来说,深度学习是一种简单有效地利用资源和数据的方法,它往往以神经网络的方法实现,尤其擅长解决难以形式化描述的任务,比如视觉任务、自然语言处理、棋牌博弈等。深度学习对硬件以及数据的数量和质量要求都很高,所以二十年前研究者觉得很难做,这些年硬件和数据都到位后,该领域却有了爆发式的增长,在某些场景下人工智能甚至能够超过人类的表现。
高薪是怎么来的
回到“人工智能高薪”这个话题,我想这首先还是市场需求催生出来的必然结果。
在我高考选专业的2016年,人工智能还只是一个“听起来不错但没那么火”的专业,并不是什么薪金远超其他专业的存在。然而自AlphaGo在围棋战胜人类之后,人工智能赚足了眼球,彻底从实验室走向台前,加之深度学习的门槛其实并不高——开发工具成熟、开源社区庞大、公共资源较多、学习成本不高,使原本的局外资本和从业者大量涌入成为了局内人。
当然,人工智能本身确实很有研究价值,无论是通用人工智能还是特定场景下的人工智能,都是解放生产力的大杀器,所以真正的人工智能值得投入,值得通过高薪来吸引人才。从2017和2018年的历史节点来看,人工智能行业确实存在人才缺口,高薪是大势所趋。
但过犹不及。据实验室的学长所说,2019年的实际招聘情况吊打了各路怀梦青年,竞争十分惨烈。很多人奔着年薪“本科平均20万元,硕士平均30万元,博士平均50万元”的口号转行进入这个领域,却在付出了大量时间和金钱后败兴而归。我综合了一下几位学长透露的零散消息,大概印象是:2017年左右,只要懂基础知识能调网络就有机会入职;2018年左右,只有理论实践都不错的人和论文产出比较好的人才能拿到高薪;2019年左右,顶级会议的论文才是大厂的入职敲门砖。顺带一提,深度学习最成熟的应用领域是计算机视觉和自然语言处理,计算机视觉的三大顶级会议CVPR、ICCV、ECCV的论文接收数量都在1000篇左右,CVPR 2019接收论文1300篇,ICCV 2019接收论文1077篇,ECCV两年一届所以2019没有召开。
回顾2017年到2019年的薪酬情况,相关公司想必早已醒过闷儿来了。人们给予了这个概念过多的期待,“欲戴王冠必承其重”,但深度学习这个技术的优点也是它的局限,它承受不了如此多的期待,很多投资项目的资金与精力都浪费在了重复的工作上。重新复盘,两年前的高薪岗位入职标准,不少有些“才不配位”。
“人均高薪”奇迹会消失,高质量人才永远被需要
我选择的研究方向属于计算机视觉,接下来的五年里我要继续读博深造,所以也对人工智能的前景有一些看法,在此提出仅作抛砖引玉,希望能给大家一些启发。
一方面是深度学习技术本身的问题。深度学习的特点是简单粗暴——实现简单、方法粗暴。深度学习早期一度被不少机器学习教授和数学系教授所嫌弃,以至于2019年暑假我听学术会议时还有教授感慨深度学习效果实在“出人意料”。只要数据和计算资源足够多,深度学习的关键就不再是“能不能做”的问题,而是效率和精度的问题。然而电子设备是有极限的,除非能在10年内进入量子计算时代,否则计算效率上会遭遇瓶颈。同理,有效数据的获取也是有极限的,然而这是高质量神经网络所必不可少的。人为标注大量的数据费钱费时费力,你可以试着把自己手机相册里每张照片出现的人都做一下标注,你就能理解这个工作之枯燥和代价之高了。另外实验室提出的模型在实际应用落地时效果往往会差一截子,泛化能力——即运用到其他地方的能力,参差不齐。非监督学习还不够成熟,而监督学习想解决实际应用问题只能采集更多的数据。上述矛盾的核心即在于,想要变得更好所需的数据量/训练开销和经济投入完全不成正比。由此推断,接下来的日子里,人工智能产业扩大的增速大概率会放缓,过饱和的市场大概会让平均薪金下降到更合理的地位。
另一方面,深度学习是人工智能,但人工智能不只是深度学习。将多个研究领域有机结合是现在研究的一个思路,用无监督学习自动标注也是一个思路,结合脑科学开发新模型又是一个思路……这样的思路有很多,都需要踏踏实实地做才可以。容易啃的骨头已经被啃光了,深度学习本身的路还很长,人工智能的路,更长。完全没有必要因为深度学习的缺陷而看衰人工智能行业,人工智能“人均高薪”的奇迹可能会消失,但其作为生产力的放大器,从业者的待遇总不会差的。
人工智能行业依然需要人才,但“调包侠”和“炼丹师”已不再受欢迎,迫切需要的是能够做切实研究的人,以及能够将研究落地的人。前者需要有扎实的理论基础和活跃的创新思维,这不是短时间之内能培养出来的,所以我们的人才缺口大到需要在高校单开一个“人工智能”本科专业。后者需要有熟练的软硬件开发经验,比如嵌入式开发或移动应用开发,人工智能对这方面的需求很大,与其让设计者一开始就考虑优化不如让开发人员去做,这是转专业的一个很好的切入点。
以上就是我对人工智能高薪现象的看法,希望想从事人工智能行业的同学们静下心来好好学习,夯实基础,同时多去尝试些新的技术,多去复现那些论文看看,让自己保持活跃的思维和积极的兴趣。不要只馋它的薪资,不论什么行业,只有你爱它,多思考多实践,才能创造出与众不同的花火,才会获得相应的回报。
责任编辑:朴添勤
常见人工智能概念名词的层级关系