工业革命，1；AI，100万

2017-09-08尹颖尧

大学生 2017年9期

尹颖尧

2017年年初，美國新媒体联盟（the New Media Consortium，简称NMC）颁布了《地平线报告》（2017年大学版），首次将人工智能（Artificial Intelligent，简称AI）列入其中。这份报告从短期、中期和长期三个时间轴，预测未来将改变高等教育的六大科技。今年的人工智能被标注在长期时间轴上。

人工智能时代真的到来了？它都要颠覆知识象牙塔高等教育了？前不久，记者采访了人工智能创业者、海知智能CEO谢殿侠。

“我叫谢殿侠，大家都喊我老谢。”

老谢说，从AI角度解释第一次见面和这句寒暄，就包括AI的三大基础领域：人脸识别、语音识别和语义理解。为了解释地通俗易懂，老谢科普了人工智能的三大技术要素：数据、计算能力和深度学习（deep learning）。此前受困于这三大技术要素，AI一直无法获得巨大突破。近年来，数据量不断增大，计算能力不断提高，深度学习得以良好运用，AI迎来第三次浪潮。目前，AI的人脸识别能力已经超过肉眼，语音识别接近人的语音识别，而语义理解与人的还有一段不小的差距。

早在2015年，在实验室场景下，AI的人脸识别准确率已经超过了人类肉眼。肉眼识别准确率大概是95%，而AI的准确识别率已经超过这个数字。老谢说，假如记者戴着AI眼镜，虽与他初次见面，AI眼镜也会准确地告诉记者：对方是海知智能CEO谢殿侠。

在语音识别方面，人的语音识别准确率大概是96%，而在理想实验室场景下，AI的语音识别准确率目前在94%～95%之间，AI的语音识别准确率已与人的相差无几。有数据预测，在未来一两年内，AI的语音识别准确率将会达到99%，超过人的水平。那时，记者一边采访老谢，AI一边将声音转化成文本，真正实现同步操作。而目前虽然市面上已有类似的语音转写软件，但实际应用场景下准确率不够高，仍需人工核对和修改。

AI虽听得懂“谢殿侠”，也知道他是海知智能CEO，却很难把“老谢”与“谢殿侠”对号入座。语义理解，仍是AI目前亟待攻克的方向。这是因为语言表达非常复杂，而且一定要结合当前使用环境、上下文来综合判断。

目前包括斯坦福大学、微软亚洲研究院等在内的大学和研究机构，都在研究语义理解，其中，阅读理解是前沿中的前沿。在限定了条件的话题讨论中，人的阅读理解能力大概85分，而AI也许只有70分，15分的差距需要很长一段时间才能赶上。

AI的阅读理解能力一旦与人的一样，将会产生颠覆性革命。

AI的优势在于能抓取网页上所有信息的意思，掌握古往今来的所有显性文明。未来，各行各业解决问题的过程和方式也将与我们现在的不一样。比如医疗领域，当患者把症状告诉AI，AI能根据描述和检查数据指标，结合此前学习的诊疗案例详细解释病情，乃至开药方。AI可以看做一个超级大脑（superbrain），当这台超级大脑被细分到各个领域后，各个领域的历史人物将被复活。比如孔子，AI可不是仅仅收集了儒家学说的所有知识，而是真正掌握了知识，能够判断、洞察、推理，还能与大家交流。

“孔老师，有人骂我怎么办？”

AI会以儒家的观点，回答提问者。

总之，AI不仅能听清和听懂，还会让机器有知识，甚至自我学习。

学语言的方式也将发生颠覆性变化，真正摆脱“人机交互”，实现“人人交互”，AI能够完全替代native speaker（说母语的人）。

老谢说，这仅是他自己大胆的预测，不过AI对人类社会的颠覆性革命太剧烈、太彻底，我们无法想象未来三十年、五十年的AI时代的样子。他认为，若第一次工业革命对人类的影响是1的话，那么AI革命将是100万。

在未来很多工作，比如传统的分析报告师、客服将被机器替代，但同时AI时代一定能提供更多新的岗位。老谢建议，愿意展望AI时代的同学，不妨读一读牛津大学历史学博士尤瓦尔·赫拉利的《人类简史》和《未来简史》两本书，从中构思自己的AI时代，找到自己的AI定位。

作为一名AI创业者，老谢当下所做的就足以震撼。

虽然通用人工智能还不能实现，但在“特定用户、特定场景、特定服务”之下，语义理解还是能极大地为人们带来便捷。比如音乐点播这件事，以“搜索周杰伦的歌”为例。海知智能抓取了网页上所有有关周杰伦的信息，分门别类，组成一个“周杰伦”的音乐知识图谱，以便AI能够理解。这个就相当于给AI“学习”了一个强大的知识库。当输入“我要听周董的歌”时，海知智能不会像其他音乐网站的软件说“没有”，因为它知道周董就是周杰伦。目前，老谢的AI已经储备2000万个音乐知识图谱。

像音乐这样的特定领域，还有很多很多，比如天气、交通、银行客服、中小学教育。老谢还有一个更大的梦想，打造知识图谱开源平台，让大家编写、共享自己的知识图谱，打造属于自己的机器人（Bot）。endprint