领军AI的华裔女性
2018-03-19沐阳
沐阳
不久前,谷歌公布未来人工智能新布局,整合之前零散分布并各自独立于云计算业务部的各个机器学习团队,成立了新组织,并任命一位华人女性为新组织的首席科学家。消息一出,令业界震惊又兴奋。
这位科学家名叫李飞飞,是当今站在金字塔顶端的科学家之一。她36岁就成为斯坦福大学终身教授,任斯坦福人工智能实验室和视觉实验室的主任。她倡导的 ImageNet 竞赛,每年都牵动着整个业界的心弦。她的高质量论文,在顶级期刊发表超过100篇,被引用高达4万余次。她入选“世界百大思想者”,被评为美国“年度杰出移民”之一(爱因斯坦、基辛格也曾获此殊荣)。
从中国到美国,握住命运
李飞飞如今光鲜亮丽的背后,还有一段不平凡的早年人生。她1976年出生于北京一户普通家庭,父母起的名字也极其普通:“飞飞”。 李飞飞出生后不久,一家人就搬到了四川成都。
当时生活条件不高,成都远没有今天繁华。但飞飞父母特别保护孩子的求知欲和好奇心,只要成都有展览就带飞飞去,尽可能扩大她的眼界,接触更大的世界、更新奇的事物。同时家里还有一条很有趣的家规:飞飞放学回家后只能在40分钟内做作业,40分钟后就可以看课外书、可以玩,干啥都可以,但就是不能再做作业。父母此举就是为飞飞养成专注高效的习惯,做事不拖延不左顾右盼,然后为自己留出充足时间,做自己感兴趣的事。
有了浓厚兴趣和好习惯的保障,飞飞从小学习就不错,后来考进四川重点中学成都七中(今为成都中学,全国四所国家级示范高中之一)。
进入成都七中前途似乎就一片光明,然而这时李飞飞的命运却迎来了重大转折。为了梦想,她父亲决定到美国打拼,后来母亲带她也去了美国。当时李飞飞仅16岁,陡然间进入一个语言、文化完全迥异的环境,如何适应生存下去,成为李飞飞面临的最大障碍。
另一大障碍,就是没有钱。李飞飞父母虽然都受过高等教育,但英语关过不了,无法从事类似于国内的好工作。迫于生计,父亲成了照相机修理工,母亲成了超市收银员,勉强维持温饱。因此除了上学,她还要尽可能补贴家用,课余时间去中餐馆、洗衣店打零工,去别人家打扫房子。打工和上学就成了她适应美国新生活的全部内容,最辛苦时一天睡不到4小时。
精英学霸,执着梦想
但在生活学习的重压下,李飞飞从没屈服。也得益于幼年养成的好习惯,不到3年时间,在1995年高中毕业时,李飞飞已经从听不懂英语的移民“差生”,跃升至成绩前5%、排名第6的优秀毕业生,而且她还以最高荣誉拿到了世界名校普林斯顿大学的录取通知书,并且获得普林斯顿提供的全额奖学金。这个优异成绩连当地人都很难达到,为此当地报纸专门采访报道了她。
1999年,李飞飞以优异成绩获得普林斯顿大学物理专业学士学位。当时美国就业形势大好,华尔街正是牛市,而她获得了华尔街的青睐,甚至高盛直接给出数十万美元年薪录取她。但是面对高薪又体面的工作,她却选择回环境恶劣的中国西藏,去研究自己一直怀着浓厚兴趣的藏医药。这个决定疯狂又令人费解,但她得到父母支持,因为父母当初来美国就是为了实现梦想。
这个决定与她一贯以来的兴趣、好奇心、求知欲有关。李飞飞从小好奇心很强,喜欢探求真理,对问题追本溯源,比如宇宙的起源、生命的意义。她渴望拥有这种智慧,梦想通过学术研究造福人类,通过科技改变世界。虽然本科学物理,但她对藏医药的浓厚兴趣不减,希望能从科学、哲学层面,来研究此神秘领域。
于是接下来整整一年她都呆在西藏,克服高原寒区各种困难,毫无怨言,愉快地融入当地生活医疗,进行藏医药研究。这段经历对李飞飞影响很大,长久以来,西方的科学方法论和哲学思维占据学术界的主导地位,而以藏医药为切入点(之一),她体会到整个人类思想宝库中完全不同的另一面,对于突破西方哲学、科学的方法论大有裨益。
研究冷门,依旧梦想
从西藏回来后,李飞飞没有进入职场,而是选择攻读研究生。在父母支持和自己辛勤努力下,李飞飞拿到了加州理工学院电子工程专业的博士学位,具体研究方向是人工智能和计算神经科学。这绝对是一把炙手可热的金钥匙,当时无数人趋之若鹜的咨询公司麦肯锡也向她抛出了入职的橄榄枝。
然而这一次李飞飞又拒绝了,转而选择进高校任教做研究,坚守自己以学术研究造福世界的梦想,不为金钱不为地位,也不为环境所迫。不仅如此,在高校工作时她再一次做了“惊人”决定——专攻计算机图像识别技术。这是当时的冷门研究,冷门到其他教授看不到结果,认为拿不到终身教授,都不愿与之合作。
通俗地说,计算机图像识别就是让计算机认出任意一张图片里包含的内容。比如让计算机认猫,那么首先告诉计算机,猫是圆脸、胖身子、两只尖耳朵和一条长尾巴构成的东西。然而现实生活中,单单猫的品种就有成千上万,就算同一只猫,也可能摆出上百种不同姿势。如果遇到一些骨骼清奇的猫,换个姿势可能计算机就傻眼了。当时,图像识别技术已发展了20个年头,但计算机能够识别的物体也不过十几种。大千世界何其多样,区区这几种物品远远不够。
坚守不懈,成就梦想
面对图像识别如此匮乏的“词汇量”,李飞飞却有疯狂的想法。她不仅毫不退缩,还“异想天开”拿出字典,要让图像识别涵盖到字典里每一个词条!
最终确定的方法很原始也很简单,就是像人类婴儿识别猫那样。人类的眼睛就像一架生物照相机,每200毫秒就能获取一幅图片。婴儿从未被灌输猫的特征,却能很快认出猫,无论什么品种什么姿势。
因此李飞飞开始训练计算机,让它看更多图片。2007年起她在网上下载了近10亿幅图片,然后给它们分类、打标签,建立题库为计算机看图训练而用。由于工作量太大,几个月后研究经费几乎用光,而且照此进度需十几年才能完成建立题库的目标。在最困难时,李飞飞想过重操旧业开干洗店筹集经费,但从未想过放弃。
当大家一筹莫展时,美国最大电商亚马逊的众包平台帮了大忙。通过众包平台,李飞飞在网上雇佣了167个国家共计5万人,给10億张图片筛选、排序、打标签。2009年时题库就包含了1500万张图片,涵盖2万多种物品。最后,这个题库发展成今天大名鼎鼎的ImageNet数据库。
更可贵的是,ImageNet如此庞大的图片数据是免费的。它向全球开放,所有致力于计算机视觉识别技术的团队,都能从它里面直接拿“试题”,训练自家识别技术的准确率。如今计算机识别的错误率已经从28%降到3.6%,比人眼识别错误率5.1%还要低。这都要归功于ImageNet数据库以及李飞飞团队的努力。
梦想点亮未来
计算机图像识别,是人工智能领域至关重要的技术,也因此“李飞飞”这三个字如今是AI界无人不晓的名字。
计算机的图像识别目前还只是用于识别衣服品牌和人脸,只能给人类一点辅助性帮助,而未来计算机将学会如何理解图片,即自行学习,能像真正的人类一样去看待世界。届时,计算机将赋予视觉智能,为后世子孙创造更美好的未来。
所有这些AI研究,都是为了最终服务于人类,就需要学术和产业有效结合。为拉近AI研究与人类日常生活的距离,也为了使AI更接地气,或许就是因此李飞飞走出实验室加入了谷歌。
现在,这位图像识别领域的领军人、人工智能顶峰的科学家、美貌与智慧并存的华裔奇女子,执掌了世界上最负盛名的谷歌AI产业,她会带来什么样的AI前景,又会把人类带到什么样的未知领域?我们翘首以待吧。