用知识连接世界 用温度打造机器
——记同济大学设计创意学院博士生导师王昊奋
2023-07-31肖贞林黄雪霜
肖贞林 黄雪霜
时代在进步,科技在创新。无人超市、无人汽车、海底捞“无人餐厅”……人工智能逐渐以各种各样的方式渗透到人们生活的各个领域。
2017年7月,国务院发布了《新一代人工智能发展规划纲要》,将“人工智能”上升到国家战略层面;随后召开的党的十九大更是“把整个国家带入人工智能的时代”。
2017年年底在新华网20周年庆典上,人工智能之风以一种独特的形式向大众展现——现场播报新闻的主播变成了一位优雅且知性的虚拟主播“琥珀·虚颜”。通过人工智能技术,她能与现场观众交流互动,表演唱歌、跳舞、演奏乐器等拿手绝活。这是主流媒体与人工智能虚拟生命的首次“触电”。
这个有些神秘的主播究竟来自哪里?她就是由深圳狗尾草智能科技有限公司(简称“狗尾草”)研发的全球首个人工智能虚拟生命女主播。而对全力打造、给予“琥珀·虚颜”新生命的狗尾草首席技术官、上海乐言信息科技有限公司CTO、同济大学设计创意学院博士生导师、知识图谱专家王昊奋来说,他等待这一天已经很久了。
致力于人工智能、知识图谱、智能问答、聊天对话机器人等方向研究多年,研究越深入,王昊奋也越坚信:人工智能时代已经来临。
“知识图谱就是我要做的事”
在网络上搜索“王昊奋”3个字,随即出现的满屏信息都与“人工智能”“知识图谱”等词语相关。他是全球最大的中文开放知识图谱联盟OpenKG的发起人之一,主持了多项国家、省部级人工智能相关项目,发表了100余篇相关领域高水平论文,多次受邀在世界人工智能大会上作代表发言。近年来,他不仅构建了全球首个可交互养成的虚拟偶像“琥珀·虚颜”,还带领团队将面向电商的智能客服机器人收入囊中,累计服务用户超过10亿人次,并成功入选中国人工智能产业发展联盟“最佳AI应用案例”。
2012年,谷歌率先提出知识图谱,主要是为了将传统的基于关键词的搜索模型向基于语义的搜索进一步升级。这样一来,知识图谱就可以用来更好地查询复杂的关联信息,从语义层面理解用户的意图,从而改进搜索质量。在此基础上,百度、搜狗等各大互联网公司和一些科研院所开始对知识图谱进行深入研究,推出了以知识图谱为核心的语义搜索引擎,甚至将其摆在与深度学习同等重要的地位,这也让更多人心中有了疑问:知识图谱能够做什么?
简单来说,知识图谱就是从海量、杂乱的数据中高效地提取有价值的信息,再将不同种类的信息以图谱的形式连接在一起而形成的一个关系网络。用王昊奋的话来解释知识图谱,就是“变得更简单明了”——第一能让机器更好地理解数据;第二就是能让机器更好地解释现象。
王昊奋
早在大学期间,王昊奋就在老师的带领下,和几名同学参与了微软“创新杯”全球学生大赛,并一路闯进全国总决赛,最终获得二等奖的好成绩。这个结果给了王昊奋更大的信心,而这段经历也在某种意义上成为他日后在知识图谱科研路上的“启蒙老师”。
启蒙阶段,往往是一个人建立兴趣的关键时期。2005年,还在上大四的王昊奋有机会接触到知识图谱,当时的知识图谱还不叫知识图谱,而是称为“语义万维网”(Semantic Web),但他几乎是“立刻就迷上了”相关技术。此后,他一直在知识图谱领域里潜心“修炼”。从博士开始,他就相继发表多篇高质量关于知识图谱的论文研究,仅博士期间的论文就多达50余篇,先后刊登在国际先进人工智能协会年会(AAAI)、数据管理国际会议(SIGMOD)、国际万维网大会(WWW)等国际顶级会议,以及《网络语义学杂志》(Journal of Web Semantics)、《IEEE智能系统》(IEEE Intelligent System)等多个国际知名期刊上。此外,他还作为技术骨干参与了国家自然科学基金、国家“863”项目、国家科技支撑等多个项目。
取得的荣誉已成过往,知识图谱的未来才是王昊奋最关心的,从事科研多年来,他从未忘却初心,也正是这份对初心的坚守让他在知识图谱的探索海洋里收获了丰富的馈赠。
做科研何时都不晚
尽管在他人眼中,王昊奋算得上知识图谱领域里最早“吃螃蟹”的人之一,如今也已经在人工智能和知识图谱等领域里颇有建树,但在王昊奋看来,大四才正式接触科研,还是有些“晚”。
从2001年进入上海交通大学计算机科学与工程系,一直到2013年完成博士阶段学业,其间王昊奋一直都在上海交通大学计算机科学与工程系学习。大三那年,王昊奋刚有机会进入实验室做科研就遇到了人生的“十字路口”,还有一年即将毕业,是继续读研,还是出国深造,或是找工作?
那时,我国的自主软件产业在国内外的影响力和市场份额都十分有限,软件人才也大多集中在外企。尽管这些企业对王昊奋同样有吸引力,但已然踏入科研大门的他,决定选择不退出,于是在硕士、博士时期,他基本都从事着与知识图谱相关的工作,毅然决然地一路“研”到底。
随着研究的深入,王昊奋看到了知识图谱的巨大潜在价值。他认为,将原本杂乱无章毫无联系的数据连通并整合,为医疗、金融、通信、交通等多个领域提供更有价值的决策支持,“这本身就是件很神奇而有巨大价值的事”,值得他躬耕其中。而参与成立狗尾草公司让王昊奋看到了将梦想付诸实践的希望。狗尾草公司以人工智能为核心,致力于将科技与设计感相结合开发出让大众容易接受且流行的科技产品。有梦就有动力,在目标的牵引之下,2014年加入狗尾草公司后,王昊奋就组织团队开始研发一款主打情感陪伴和恋爱管家功能的机器人——公子小白。
据王昊奋介绍,之所以选择研发“公子小白”,还有一些“小插曲”。2011年苹果公司推出iPhone 4S手机,这款手机里有个不得不提的新功能——Siri个人助手。它使很多人第一次意识到,人工智能可以为我们的日常生活提供如此多的便利。只要通过麦克风,Siri就能轻松实现备忘、发短信、打电话、地址查询等功能。“这种搜索、问答、对话聊天的方式很新颖,摈弃了传统的图形用户界面(GUI)交互,转而采用更灵活和自由的对话用户界面(CUI)交互,这需要对用户的需求进行理解,并通过背后的庞大知识库反馈精准的答案,和我一直研究的方向很契合。”这加深了他进一步探索人工智能和知识图谱的信念,也开始为研发问答和聊天机器人储备相关技术支撑。
但不久,Siri便因为功能极为有限、不完善等问题屡屡被人诟病,王昊奋也因此想到如果仅以这种冷冰冰的模式构建机器人,不是长远之计。为此他利用多年积累的知识图谱技术及应用方面的经验,在各种家庭场景的细粒度定义、机器人设计和世界观的建模,以及情感计算等方面进行了深度打磨,从而赋予了“公子小白”独特的个性,使其拥有“情感输出和表达”的功能,可以和用户实现自由“畅聊”。值得一提的是,“公子小白”还有“情侣款”的机器人,王昊奋带领团队将情侣模式的图谱植入“公子小白”,实现了它与用户的感情升华。
此后,王昊奋在相关方向上继续发力,开始侧重研发有“温度”的虚拟生命,也就是后来家喻户晓的“琥珀·虚颜”。为了能让大家从各个角度、全方位地看到栩栩如生的人物动态,王昊奋带领团队使用了单光源的3D全息投影,通过合成技术,形成前后左右4个面的成像,通过制造的光影,起到增强效果的作用。开发过程中,王昊奋也在如何快速实现机器人建模、机器人认知进化、机器人情感输出和多模态交互等方面做了更多基础性与探索性的工作,为新一代泛在知识图谱的研究奠定了更坚实的基础。
2020年年初,一场疫情悄然袭来。眼看着疫情快速蔓延,越来越多的人为抵抗新冠病毒献出了生命,王昊奋也在用自己的力量为抗疫作出贡献。作为全球最大的开放中文知识图谱平台OpenKG的发起人之一,借助这一平台,他与来自同济大学、浙江大学、东南大学、文因互联、小米人工智能实验室的多位知识图谱技术专家联合构建了新冠知识图谱,其间还不断更新和科普新冠的预防、治疗、药物研发、抗疫英雄事迹等各方面的知识与资料。平台完全免费开放,并提供下载与问答等功能,在疫情初期帮助公众对病毒有了清晰准确的认识。
是改变,也是新起点
上海青年科学家合影
艰难困苦,玉汝于成。多年来,王昊奋带领科研团队依靠自主创新,在知识图谱、聊天机器人等方向上取得了多项重大突破。众人看到的是鲜花掌声,只有他和伙伴们心里清楚,研发过程中总能遇到一些无法解开的困惑。随着研究越发深入,他也越能感受到交叉学科的魅力和创新的重要性。他想,是时候做些改变了。
2014年,王昊奋告别了生活学习12年的上海交通大学,选择了一个全新的起点——华东理工大学。他一边在狗尾草公司继续科研,一边在华东理工大学信息学院计算机科学与工程系任教,负责大数据驱动的知识图谱教学与研究工作。
王昊奋常常跟学生们说,创新固然重要,但在此之前,一定要打好科研基础。他也一直以身作则,把脚踏实地、夯实基础的良好传统传递给青年学子。之所以这样坚持,王昊奋有位不得不提的“贵人”——上海交通大学教授俞勇。俞教授曾指导上海交通大学在2002年夺得了有着计算机界“奥林匹克”之称的ACM国际大学生程序设计竞赛世界总冠军。作为王昊奋硕士和博士期间的导师,俞勇教授不止在科研学术上为其指点迷津,还适当“放手”,给了王昊奋更多的自主学习空间。他鼓励王昊奋多做一些前沿技术研究,也培养了王昊奋在沟通、学习、分析、领导等诸多方面的能力。一开始承接项目时,王昊奋显得有些“小心翼翼”,总觉得自己不能胜任,但俞教授劝他大胆去做,“做一个顶天立地的人”。王昊奋所理解的“顶天”不仅要保持大格局,还要有宽广的视野;“立地”则是要踏踏实实做好科研中的每一件事。这句话一直伴随着王昊奋走到现在,也让他在科研每一次遇阻的艰难时分都选择迎难而上。
一边教学一边科研,王昊奋乐在其中,也稍有些“不安”。无暇全力兼顾教学和科研的他,最终决定将天平偏向科研。2018年,王昊奋来到乐言科技公司,选择将汗水洒向电商客服领域。
在电商场景下,商品、店家、商家政策各不相同。人工智能需要具备很好的“理解力”,才能应对大大小小的问题,并做出正确回复。知识图谱在其中起着关键作用,为了尽快研发出可以读懂用户、商品、店铺、优惠政策等信息的人工智能产品,王昊奋进入乐言大家庭后,不断和团队加深对电商的了解,熟悉业务流程,并在反复的实际操作过程中总结经验,及时调整技术方向。
在团队共同协作下,乐言科技在自然语言处理、知识图谱、智能推荐和机器学习等人工智能技术的支撑下,成功研发出一种跨领域认知计算平台。平台利用知识图谱,赋予智能客服机器人更多“人情味”,不仅能“猜透”客户的意图、识别客户情绪,还能给予准确的拟人化回复方案。仅在2018年“双十一”当天,智能客服机器人就成功为4000多家电商领域的头部商家保驾护航,创下了总销售额107亿元的辉煌战绩。
除了驰骋在电商领域里,乐言科技的认知计算平台也如愿跨到了金融、医疗、政府等多个领域,实现了智能风控、智能问诊、政务咨询等服务功能。
目前,王昊奋还在一问一答、由人主动发起的问答、机器主动推送信息的推荐式问答、语音文字单模态问答、情感输出多模态问答等方向深耕。他表示,问答本身就是一种比搜索更自然的交互方式,可直接获得更精准的答案,而不是在海量资料里大海捞针。“我们希望做出能听懂用户说什么的机器,并能够得到交流和反馈。”
身处神经网络技术发展推动的第三次人工智能浪潮中,王昊奋希望能去迎接更多挑战,也希望有更多成果可以落地。“学校是我熟悉的环境,能给予我更多的土壤和养分。”为了实现心中的想法,2019年王昊奋作为“百人计划”特聘研究员、博士生导师来到同济大学设计创意学院,继续探索知识图谱、多模态知识问答领域里的国际前沿问题,也希望能够带领出一支知识图谱领军团队,脚踏实地迈好每一步,共同去翻越科学这座高峻山峰。