让电脑看脸色行事
2009-09-11桂祺莹
桂祺莹
在专业人士眼中,目前的表情识别只能拿来玩。因为要让计算机读懂人的表情,确定和不确定因素造成的困难都很多。何况一个人的表情,另一个真人都未必能读懂。
微软曾经在Office 97中推出过一个“屏幕助手”。今天提起来,不知道有几个人还能想起,那是个长着大眼睛的文件夹。这多少因为,“大眼夹”还没在这个世界玩闹多久,就“毙命”于用户的抱怨。而在摩比源公司的工程师吴飞看来,“大眼夹”的失败在于缺少表情识别,如果它能像虚拟视频中的小人们那样,懂得察言观色,通过用户表情,知道什么时候该咧嘴笑,什么时候该耍点小可爱,它的命运也许会有所改变。
颠覆你的视频娱乐
赵爱华是一位75岁的老太太,华夏老年大学的一名学生。在视频软件Fix8的虚拟世界中,她拥有千张面孔,比孙悟空还厉害。刚开始视频聊天,赵爱华只是为了能常常见到远在美国读书的孙女。慢慢地,她也跟着孙女学会了在视频中添加音乐和背景,甚至用上了更为花哨的虚拟视频。
坐在儿子新购置的电脑前,赵爱华熟练地点开软件,选择自己近期最爱的BOB头、蛤蟆镜外加一顶黑色礼帽,视频中的老太太立刻变身成“活力女孩”。“我还可以变成樱桃小丸子、蜡笔小新,不过我更喜欢把自己扮成年轻漂亮的女孩,美得冒泡美得理直气壮。”赵爱华说着就冲进了Fix8的虚拟世界。
Fix8是摩比源公司2005年成立初期研发的产品,吴飞是研发者之一。他说:“普通的视频欠缺创意,而虚拟视频能让人自由发挥。”吴飞一边说一边在电脑上打开网友上传的视频。
这是一段美国大选的视频。Fix8将真实世界中的总统大选搬到了虚拟世界,选民变身成希拉里、奥巴马或麦凯恩中的任何一个,通过YouTube平台进行在线辩论。只要一个网络摄像头,“希拉里”、“奥巴马”和“麦凯恩”们就可以跟随着真人进行移位及演讲。
“这个软件的关键是人类表情分析和重组技术。我们可以将用户的头部做成虚拟形象,通过网络摄像头捕捉用户脸部表情,显示在电脑上,形象通过Internet进行传输,显示在对方的视频窗口里,让用户可以即时互动。”吴飞说。
众所周知,人和人之间交谈时,面部器官的结构特征是次要的,语言和面部表情才是传递信息的主要载体。现在,虚拟视频仅仅通过网络传递对方的语言和面部表情,并且利用面部表情信号驱动虚拟人的头部模型进行相应的表情变化。这么一来,不仅能保护隐私,还能在大大节省带宽的情况下,尽可能地传递要表达的信息。所以,敏感的韩国电信运营商SK电讯在Fix8推出没多久就开始了和摩比源公司的合作。与此同时,虚拟视频也迅速火热起来。2008年5月10日,久游网和摩比源合作推出了劲秀团;9月,新浪与久游网携手推出变脸盛宴SINA SHOW;紧随其后的吐司网和9158视频社区也将陆续推出虚拟视频软件。
那么,这些虚拟视频就是传说中的表情识别么?Fix8能够通过定位和跟踪人脸部的特征点,将面部肌肉线条的运动刻画出来,但它并没有涉及到情感计算。在另一位同样研究表情识别的工程师陈浩民眼里,具有情感计算才能叫真正的表情识别,而且这样的表情识别会有更多应用。
在情感计算上升级
王斌是一名出租车司机,夜班。每天下午7点到第二天早上7点,他都会在首都机场“趴活”。虽然白天睡了几个小时,可到了凌晨2点,还是困得不行,脑袋再次和方向盘亲密接触后才彻底清醒。“好在不是在拉活的过程中打瞌睡,但不是每次都这般幸运。”王斌说。
瞌睡时,如果有个声音能及时提醒,王斌会安全很多。
所谓人脸表情识别,就是计算机能对人脸的表情信息进行特征提取分析,按照人的认识和思维方式加以归类和理解,能够分析理解人的情绪并且作出相应的判断。
人脸表情识别能应用的地方很多。譬如在人机交互当中,用户可以利用表情来指示计算机。用户眨一下眼睛,表示要求计算机取消当前的任务,眨两下眼睛就表示要求计算机将任务保存。如果计算机再聪明一点,就能主动地从用户的面部表情推测用户的内心情感,并自动地给出相应的人性化的服务。特别是在动画制作中,有了表情识别,动画人物微笑、眨眼都不再需要很多张图片组合起来,利用软件就能简单实现。
链接
情感计算
1971年,心理学家保罗·艾克曼与福里森最早提出人类有六种主要情感:愤怒、高兴、悲伤、惊讶、厌恶和恐惧,每种情感以惟一的表情来反映人的一种独特的心理活动。从解剖学出发,他们提出一种人脸表情运动的描述方法——人脸运动编码系统FACS ,根据面部肌肉的类型和运动特征定义了基本形变单元,人脸的各种表情最终能分解对应到各个基本形变单元上来,分析表情特征信息,就是分析面部基本形变单元的变化情况。后来,美国麻省理工学院媒体实验室的皮卡德教授提出了情感计算的说法。在实际操作中,主要是通过各种传感器获取由人的情感所引起的表情及生理变化信号,利用合适的“情感模型”对这些信号进行识别,从而理解人的情感并作出适当的响应。
表情如何识别
在表情识别系统中,计算机会通过对人脸样本集和非人脸样本集的学习,产生一个分类器。在对人脸表情特征提取和分类之前一般需要做几何归一化和灰度归一化。具体说来,几何归一化就是指根据人脸定位结果将图像中的人脸变换到同一位置和同样大小,灰度归一化是对图像进行光照补偿等处理,能够一定程度地克服光照变化的影响而提高识别率。预处理完成后,开始人脸表情特征的提取与识别。表情特征识别的方法很多,其中之一是通过几何特征的识别方法,也就是对人脸表情的显著特征,如眼睛、鼻子、眉毛、嘴等的位置变化进行定位、测量,确定其大小、距离、形状及相互比例等特征,进行表情识别。
(施月华摘自《新知客》)