沈翔:让人工智能落地的应用科学家
2023-12-29谨文
![](https://img.fx361.cc/images/2025/0208/RRteyvwxs2q3kwGDwcJPzL.webp)
2023年3月的第三周被很多人称为神奇的一周,也有人说,这可能是人工智能发展最快的一周。在这一周里,斯坦福大学发布了只花600美元训练出的GPT-3.5平替Alpaca;前OpenAI成员出走并正式发布了Claude聊天机器人;Google在云端办公平台GoogleWorkspace引入了AI功能组;百度发布了国产大模型文心一言;OpenAI在万众瞩目下发布了GPT-4……有人戏称,如果未来人工智能征服了人类,他们会指着日历上的这一周说,这就是他们征程开始的时刻。
而这一周,在西雅图的办公室里,沈翔博士坐在电脑前,对着目不暇接的新工作,思索着如何将这些人工智能的发展成果用在现下自己想要解决的问题上。
博士时期,梦想起航
2014年,当沈翔从复旦大学毕业,刚来到美国的时候,现在这些令人惊奇的人工智能模型背后的深度学习技术才刚刚升温,距离现在大模型背后的基础元件Transformer的问世还有三年。当时的沈翔已经打下了深厚的数学基础,但对于如何应用自己的数学知识还是一头雾水——他的理想并不是成为一名研究纯数学的数学家,而是让这些在别人看来晦涩难懂的知识在现实世界里实现价值。
初来美国的沈翔选修了一门叫作“统计学习”的课程,授课的巴鲁特教授不仅讲授了统计学习和机器学习的基本内容,更是用了大量时间,在课上介绍现代深度学习的发展。这些内容深深地吸引了沈翔,他课下积极与巴鲁特交流,两人还在一些研究项目上进行了合作。巴鲁特认为未来属于擅长深度学习的人,他告诉沈翔:“哪怕你只懂得一点深度学习的皮毛,你都必将在人才市场上受到欢迎,因为我们投入在深度学习上的注意力还远远不够。”
这样的观点像种子一样在沈翔心中发了芽。此后,他在研究统计学习理论的同时,也忍不住开始探索和思考机器学习的应用问题。
在乔治华盛顿大学攻读统计学博士期间,沈翔专注于半参数回归的模型平均方法来平衡模型的推断能力和解释性,尤其是建模的特征多并且不确定的时候。传统的方法往往先选择一个特征集合,固定特征来建模,以实现解释性的最大化。而模型平均的方法通过多个特征集优化了特征不确定带来的推断能力下降,但很有可能会牺牲掉原本的解释性。沈翔通过一些数学推理,还原证明了这种解释性的存在,并使用模拟实验验证了这个方法。
在思考数学和统计问题的同时,沈翔也致力于探索统计方法在实际问题上的应用。2019年,沈翔和另外两位统计学博士合作参加了美国统计学会举办的数据展示大赛。该比赛的宗旨是,在美国纽约居民普查的数据基础上,使用统计方法展现对纽约市房屋情况的洞见。沈翔团队经过多次实验和实践,提出使用岭回归和时空序列建模的方法,该方法不仅创建了总结房屋条件的指数,还能充分预测房租的变化。
在报告前夜,沈翔粗读了其他参赛者的作品,然后笑着对合作伙伴说:“这次第一名我们拿定了!”合作伙伴问他为何如此自信,沈翔却笑而不语。
第二天,沈翔团队出色的方案果然获得了评委的一致认可,并赢得了第一名1500美金的奖金,而这个方案也在不久后刊于《统计计算》杂志。
事后第三天,沈翔才告诉同伴:“其他所有参赛者的方案都忽视了数据,没有通过对数据的处理,把自己的方法和数据结合起来。因此,我们脱颖而出是毫无悬念的。”
精耕细作,数据为王
的确,数据是沈博士一直以来对于研究和工作的坚持。初步分析和处理数据是非常枯燥而辛苦的,因此,很多科学家都不愿意做这种“脏活”。然而,数据才是使一个方法能够成功应用的本质。沈博士认为,很多看似先进的方法因为脱离了数据的假设,根本无法成功,而这种思想也正好暗合了机器学习里著名的“没有免费午餐”定理,即没有一种机器学习方法是适用于所有数据的。
沈翔博士的第一任老板十分欣赏这种愿意“让手变脏”的科学家,邀请他在毕业后加入Expedia人工智能实验室研发对话系统。这份工作对于沈博士来说是一个很大的挑战,他从此没有任何时间思考任何数学问题,甚至有时候,他和朋友家人开玩笑,说自己逐渐变笨了,但其实,他对于现在人工智能系统的理解和洞见在飞速增长。
在Expedia工作期间,沈博士阅读了大量对话系统相关的文献,开始了对自然语言处理相关问题的研究,以及商用聊天机器人的开发。对话系统的基础任务是在对话中识别用户的意图,然后才能进一步提供相应的响应。为了提高聊天机器人的识别能力,沈博士始终坚持亲自收集第一手数据。为此,他阅读了大量用户和聊天机器人、以及用户和客服人员的对话日志,并经常和不同用途的各种聊天机器人对话。
在一次对话中,沈博士发现聊天机器人已经能比较好地识别出常见的意图,但是对于从没见过的新意图,它难以准确理解,并可能做出完全错误的指令。恰好在新冠病毒大流行期间,旅游市场经历了非常大的冲击和变动,与之相关的用户意图非常多,而这些几乎都是聊天机器人以前没有见过的,于是,聊天机器人往往给用户带来非常差的体验。
针对这一问题,沈翔博士开发了基于对比学习的半参数意图识别框架,这一技术能够自动发现用户的新意图,并使聊天机器人能够及时对这种新意图进行识别和设置,从而达到了更好的用户体验。后来,沈博士的这一研究被人工智能对话中的自然语言处理研讨会收录,来自业界的科学家都对这个研究非常感兴趣,很多同行纷纷表示,他们也曾遇到过类似的问题,感谢沈博士提供的这条新思路。对于同行提出的相关问题,沈博士一一做出了解答。
值得一提的是,因为疫情原因,这次研讨会是在线上进行的——这是过去两年人工智能会议的常态。即使如此,这项工作仍然引起了业界的关注。沈博士认为,目前学术界好的研究很多,但真正能够被应用的研究其实很少,一方面是因为来自实验室的研究者对于实际面临的问题缺乏理解,往往基于精选的数据对真实世界进行猜测;另一方面在于工业界的工程师和科学家对于新的研究成果不能完全理解,而现在人工智能技术日新月异,没有深刻的理解,研究成果就难以得到充分的应用。正因为如此,才让像沈博士这样的应用科学家更有价值。
迎难而上,让人工智能落地
工作之外的沈博士是一个乐高爱好者,他家的储藏间里堆积了接近两百套乐高,由于工作忙,其中不少乐高都还没有拆封。对沈博士来说,拼搭乐高不仅仅是一个从小的爱好,更能帮助他缓解工作压力。有时,他很喜欢的乐高套装已绝版,他就会去二级市场淘货,而淘到的二手乐高往往会有零件缺少或者损坏的问题,这时,他便从自己的零件库中寻找替补,或者找电商购买缺件。在沈博士看来,这种补齐一件套装的快乐,不亚于修好机器学习系统中的漏洞并让它完整上线。
目前,沈翔博士已经离开以前的岗位,但他仍然致力于使用人工智能技术解决实际问题。新的工作给他带来了新的挑战,他依旧每天早晨一起床就查看新的相关论文,思考着自己的问题。在沈博士看来,在人工智能飞速发展的时代,每天关注新的研究工作,思考这些工作对自己的价值,是每个应用科学家的必修课。即使身为深耕细分领域多年的研究者,他仍然经常会被新的研究成果所震惊,比如OpenAI新出品的ChatGPT聊天机器人。沈博士认为这是一个伟大的产品,是工程师和科学家们如何做好一件系统工程的样本,但也许并不是人工智能科学的重大突破。沈博士在它发布的第一天就使用了这个机器人,并开始思考,如何让这个产品为自己所用,充分发挥模型的价值,将它应用在细分的产品上。
在采访的最后,沈博士告诉记者:“未来,我将继续从事人工智能应用的研究,将深度学习的技术更好地应用在实际问题当中。这不仅需要对深度学习技术有深刻的理解,也需要相应地理解业务的需求,并不断研发出更多稳定性强、可复用性高的方法和产品。让人工智能落地,这项工作肯定会遇到很多困难,但作为科学家,我必须迎难而上!”
让我们祝愿沈博士的科研道路越走越宽!
编辑/朱艳君