工业革命,1;AI,100万
2017-09-08尹颖尧
尹颖尧
2017年年初,美國新媒体联盟(the New Media Consortium,简称NMC)颁布了《地平线报告》(2017年大学版),首次将人工智能(Artificial Intelligent,简称AI)列入其中。这份报告从短期、中期和长期三个时间轴,预测未来将改变高等教育的六大科技。今年的人工智能被标注在长期时间轴上。
人工智能时代真的到来了?它都要颠覆知识象牙塔高等教育了?前不久,记者采访了人工智能创业者、海知智能CEO谢殿侠。
“我叫谢殿侠,大家都喊我老谢。”
老谢说,从AI角度解释第一次见面和这句寒暄,就包括AI的三大基础领域:人脸识别、语音识别和语义理解。为了解释地通俗易懂,老谢科普了人工智能的三大技术要素:数据、计算能力和深度学习(deep learning)。此前受困于这三大技术要素,AI一直无法获得巨大突破。近年来,数据量不断增大,计算能力不断提高,深度学习得以良好运用,AI迎来第三次浪潮。目前,AI的人脸识别能力已经超过肉眼,语音识别接近人的语音识别,而语义理解与人的还有一段不小的差距。
早在2015年,在实验室场景下,AI的人脸识别准确率已经超过了人类肉眼。肉眼识别准确率大概是95%,而AI的准确识别率已经超过这个数字。老谢说,假如记者戴着AI眼镜,虽与他初次见面,AI眼镜也会准确地告诉记者:对方是海知智能CEO谢殿侠。
在语音识别方面,人的语音识别准确率大概是96%,而在理想实验室场景下,AI的语音识别准确率目前在94%~95%之间,AI的语音识别准确率已与人的相差无几。有数据预测,在未来一两年内,AI的语音识别准确率将会达到99%,超过人的水平。那时,记者一边采访老谢,AI一边将声音转化成文本,真正实现同步操作。而目前虽然市面上已有类似的语音转写软件,但实际应用场景下准确率不够高,仍需人工核对和修改。
AI虽听得懂“谢殿侠”,也知道他是海知智能CEO,却很难把“老谢”与“谢殿侠”对号入座。语义理解,仍是AI目前亟待攻克的方向。这是因为语言表达非常复杂,而且一定要结合当前使用环境、上下文来综合判断。
目前包括斯坦福大学、微软亚洲研究院等在内的大学和研究机构,都在研究语义理解,其中,阅读理解是前沿中的前沿。在限定了条件的话题讨论中,人的阅读理解能力大概85分,而AI也许只有70分,15分的差距需要很长一段时间才能赶上。
AI的阅读理解能力一旦与人的一样,将会产生颠覆性革命。
AI的优势在于能抓取网页上所有信息的意思,掌握古往今来的所有显性文明。未来,各行各业解决问题的过程和方式也将与我们现在的不一样。比如医疗领域,当患者把症状告诉AI,AI能根据描述和检查数据指标,结合此前学习的诊疗案例详细解释病情,乃至开药方。AI可以看做一个超级大脑(superbrain),当这台超级大脑被细分到各个领域后,各个领域的历史人物将被复活。比如孔子,AI可不是仅仅收集了儒家学说的所有知识,而是真正掌握了知识,能够判断、洞察、推理,还能与大家交流。
“孔老师,有人骂我怎么办?”
AI会以儒家的观点,回答提问者。
总之,AI不仅能听清和听懂,还会让机器有知识,甚至自我学习。
学语言的方式也将发生颠覆性变化,真正摆脱“人机交互”,实现“人人交互”,AI能够完全替代native speaker(说母语的人)。
老谢说,这仅是他自己大胆的预测,不过AI对人类社会的颠覆性革命太剧烈、太彻底,我们无法想象未来三十年、五十年的AI时代的样子。他认为,若第一次工业革命对人类的影响是1的话,那么AI革命将是100万。
在未来很多工作,比如传统的分析报告师、客服将被机器替代,但同时AI时代一定能提供更多新的岗位。老谢建议,愿意展望AI时代的同学,不妨读一读牛津大学历史学博士尤瓦尔·赫拉利的《人类简史》和《未来简史》两本书,从中构思自己的AI时代,找到自己的AI定位。
作为一名AI创业者,老谢当下所做的就足以震撼。
虽然通用人工智能还不能实现,但在“特定用户、特定场景、特定服务”之下,语义理解还是能极大地为人们带来便捷。比如音乐点播这件事,以“搜索周杰伦的歌”为例。海知智能抓取了网页上所有有关周杰伦的信息,分门别类,组成一个“周杰伦”的音乐知识图谱,以便AI能够理解。这个就相当于给AI“学习”了一个强大的知识库。当输入“我要听周董的歌”时,海知智能不会像其他音乐网站的软件说“没有”,因为它知道周董就是周杰伦。目前,老谢的AI已经储备2000万个音乐知识图谱。
像音乐这样的特定领域,还有很多很多,比如天气、交通、银行客服、中小学教育。老谢还有一个更大的梦想,打造知识图谱开源平台,让大家编写、共享自己的知识图谱,打造属于自己的机器人(Bot)。endprint