三维人脸建模技术分析及应用
2012-03-31魏衍君郑青碧杨明莉
魏衍君,郑青碧,杨明莉
(商丘职业技术学院 计算机系,河南 商丘 476000)
自人类社会形成以来,人们对模拟人脸一直抱有浓厚的兴趣。最初实现人脸模拟的方法包括美术绘画、泥塑艺术,随着计算机技术的发展人脸建模技术的应用领域也日益广泛,人们利用计算机优良的数据计算和处理能力使人脸模拟技术日趋完善,不管是二维还是三维人脸图像,都可以在计算机上进行模拟和演示。现在三维人脸建模技术已经作为一个研究热点而广受关注。
当前虽然已经在三维人脸重建方面取得了一些成就,但在实现完美的三维人脸构建方面还存在有许多问题,从几何结构上来看,人脸表面具有极其复杂的外部轮廓曲线和纹理信息,只有利用精深的数学方法才能描绘这些特性。表情动作的仿真、头发的模拟、光照强度的调整、真实感纹理映射等这些问题的彻底解决都有一定的难度,近些年来图像图形学专家一直致力于解决这些难题。
三维人脸建模虽然存在许多难以解决的问题,但很多学者专家还是在坚持不懈的致力于该方面的研究,主要有以下两方面的原因:首先是现有的一些问题用二维图像的方法不能很好地解决。在人脸识别方面,最终识别效果主要是由表情变化问题来决定,如果充分利用三维信息来识别三维人脸模型,将会大大提高人脸识别的准确率和鲁棒性。其次,三维人脸模型被广泛应用于社会生活的各个领域,具有广阔的应用前景。目前,三维人脸模型已经普遍应用于科教、娱乐、医疗和安全检测等多个领域,而且随着计算机技术和科学技术的发展,三维人脸模型将会有越来越广阔的应用前景。
1 基于三维数据的建模方法
近年来,随着计算机技术的进一步发展,一些科研机构开始尝试根据三维扫描仪获得的人脸数据信息构建三维人脸模型。该方法通常是首先对数据信息进行预处理,然后根据计算机图形学方法对处理过的数据信息进行点云三角化,最后通过网格优化策略构建特定三维人脸模型。此方法适用于不要求结构信息的建模。
三维数据信息可以通过物理设备激光扫描仪获取。而且它可以同时获取模型的几何结构信息和纹理信息,也是获取距离数据的一个准确有效的手段,许多研究小组已经开始使用此设备进行科学研究。德国学者Blanz和Vette[1]创建了一个包含三维距离信息和表面纹理信息的头部数据;康柏剑桥研究所的Waters[2]等人利用激光扫描系统获取的三维数据信息进行三维头部建模。多伦多大学的Lee[3]等人利用激光扫描仪获取的三维几何数据信息和纹理信息,通过变换标准人脸网格模型构建特定人脸模型。国内不少研究者也对人脸建模和动画技术抱有浓厚的兴趣,不同的研究机构在该领域作了许多研究工作。中国科学技术大学、中国科学院计算技术研究所、清华大学、中国科学院自动化研究所和浙江大学等在获取三维人脸数据和三维人脸建模方面都取得了一定的成就。中科院自动化研究所使用激光扫描仪获取三维数据,为后续建模工作奠定了基础。根据三维数据创建的三维人脸模型具有较高的真实度,但该方法建模成本高,算法不容易实现,同时对三维数据的精度要求很高,目前还没有被普遍使用。
2 基于标准人脸模型的建模方法
基于标准人脸模型建模,通常是利用普通相机拍摄的二维图像为基础进行三维人脸建模。特定三维人脸模型的构建过程分为三个阶段:三维标准人脸模型的选择、特定三维人脸模型的变换、真实感纹理映射。华盛顿大学的Pinhin[4]等人采用多幅图像变形三维标准人脸模型,他们使用的标准模型是Toronto大学的线框模型。基于图像的三维人脸建模方法建模效率高,图像容易获取,虽然由于三维数据存在噪声问题,降低了建模的精确度,但它的实用性更强,适用范围更广,也是目前研究的主流方向。
标准人脸模型通常是根据第三方建模软件来获取。一个特定人脸的建模过程是对标准人脸模型的修改过程。从标准人脸模型到特定人脸模型的变换分两个步骤,第一步是整体变换,对标准人脸模型进行整体轮廓的调整,使其与特定人脸高度、宽度和深度相一致,且使脸部的五官位置相对应,实现模型的形似。第二步是局部变换,根据特定人脸的五官位置和形状对模型进行进一步的细致调整,使其与特定人脸在具体的人脸五官的形状和位置也相同,实现模型的神似。
基于一个标准模型的修改方法,为了控制和操作的可行性,试验中只从照片上得到了模型上特征点的空间坐标。存在的基本问题是:如何通过特征点的运动来控制模型上非特征点的变化,即空间变形问题。现有变形方法的实现主要是散乱数据插值方法,即在三维标准人脸模型和特定人脸模型之间建立一个映射关系函数。根据该函数可以求出任意位置的函数值。插值算法的好坏直接关系到模型的精确度,插值函数的设计是插值算法的核心问题。下面介绍几类常见的空间插值技术[5-7]:
1)最近邻点插值法 最近邻点插值法又被称为泰森多边形方法,它是一种最简单的插值方法,该算法的基本原理是:每一个插值输出像素的值就是在输入图像中与其最临近的采样点的值。
最近邻点插值方法使用较为广泛,不需其他附加条件,容易实现,执行速度快,而且由于它是均质无变化的,如果被插值的数据是均匀间隔的话,用该方法进行插值很有效。但是如果被插值的数据不是均匀间隔的话,很多区域将会有相同的函数值,因而往往会导致变量值的错误估计,并且由该插值算法产生的表面很粗糙。
2)距离反比加权法 距离反比加权插值法是最早实现的计算机内插方法。它的基本原理是假设平面上分布着若干个离散点,如果各个点的空间位置坐标 (Xi,Yi)和它们的属性值Zi都是已知的,那么P点的属性值可以利用周围分布的离散点的属性值,由距离加权插值算法求出。
距离反比加权插值法综合了最近邻点插值法和多元回归法的渐变方法的优点,能够以精确、平滑的方式实现插值算法,而且方法简便、易于实现。该算法的缺点是忽略了数据场在空间的分布情况,经常会由于采样点的分布不均而导致误差,因而在理论上,它属于一种纯几何性质的加权运算技术。
3)趋势面拟合法 趋势面拟合法是一种被广泛使用的整体插值算法,它能够使用有限个观测数据值对曲面进行拟合,从而完成对曲面的内插,以达到最佳插值效果。其基本原理是现象特征的变化趋向利用函数代表的曲面来拟合。描绘长距离渐变特征的最容易的方法是多项式回归分析。多项式回归分析的基本原理是根据数据是一维还是二维选择线或面的多项式,然后利用多项式表示的线或面按最小二乘法原理拟合数据点。
回归函数的次数通常为2或3就行了,并不是越高越好。次数较高的多项式能够很好对观测点进行逼近拟合,但同时会加大计算量,提高计算的难度,并且会减弱插值的效果。趋势面拟合方法不仅能够实现整体空间的孤立点内插,而且还能够将区域中在趋势规律之外的偏离部分展现出来。
4)样条函数插值法 样条函数插值算法具有稳定和光滑的特性,它成为在已知点之间完成插值的一种有效方法。样条函数的基本原理是己知数据点的逼近是通过分段多项式来实现,而且又能确保在各段连接的地方具有一定的平滑性。
样条函数适用于表面光滑的物体对象,而且要求样条函数必须有连续的一阶导数和二阶导数;样条函数的优点是二次样条函数和三次样条函数都可以得到了令人满意的插值效果,该插值方法尤其适合大量密集点内插等值线。样条函数的不足是无法对误差大小进行精确的估计,而且当点的分布比较稀疏时,不能达到令人满意的效果。
3 应 用
三维人脸建模系统的选择与其所面向的应用领域密切相关,不同的应用领域具有不同的选择标准。三维人脸建模技术主要应用于以下几个方面。
1)影视娱乐 专业的影视游戏制作人员一直在不断寻找最优的三维建模技术,从而给观众带来最佳的视觉盛宴。从几年前我国的《宝莲灯》到近期的《乐火男孩》,以及美国最近的电影《阿凡达》等,都充分体现了三维人脸建模技术的非凡魅力。
2)通讯领域 自从电话进入人们的生活后,给人们带来很大的方便,它已经成为人们日常生活的一个重要组成部分,但普通电话只是声音的传递工具,随着生活水平的提高,人们希望通话的同时可以看到对方。三维人脸建模技术可以满足人们的这一需求。
3)医学领域 在医学领域中,三维人脸建模技术主要适用于心理与行为研究和面部美容手术整形治疗等方面。不断成熟的三维人脸建模技术为心理学家进行心理活动和面部运动的研究提供了实验基础。心理学家能够在计算机上利用三维模型来完成他们的实验,这比用真人进行研究更加方便快捷。
4)计算机辅助教学 三维人脸建模技术可以应用到计算机辅助教学中。学生可以随时随地与类似真人的虚拟老师进行互动学习,营造良好的学习氛围,增强了学生的学习积极性。
5)人脸识别 人脸识别技术属于生物特征识别技术,是对生物体本身的特征来区分生物个体。经过很多专家学者坚持不懈的努力,在人脸识别领域已经取得了很大成就。特别是近些年来,三维人脸识别技术已经逐渐成熟,与二维人脸识别相比,它具有更高的精确性和鲁棒性,而且也具有更广阔的应用前景和更大的市场潜力。
总之,作为计算机视觉领域倍受关注的热点,真实感三维人脸建模技术的研究,不仅具有较高的理论研究价值,而且更具有潜在的实际应用价值。
4 结束语
近年来计算机技术的迅速发展及实际应用的需求推动了三维人脸建模技术的发展,但在该领域仍有许多问题尚待探索和解决。未来研究热点将会集中在以下几个方面:
1)利用单张二维图像结合计算机视觉技术进行三维数据获取。该技术是建模成本最为低廉,也是最为实用的一种建模方法。
2)构建三维人脸动画,丰富三维人脸表情,从而可以扩大使用范围。
3)提高建立特定三维人脸模型的实时性。虽然近年来出现了一些较好的算法,但是距离实用化、自动化还有一段距离,由于问题本身的难度,此方向依然是今后研究的难点。
由于三维人脸模型的复杂性和趣味性,引起了许多学者的关注,并且在此投入很大的精力。随着相关领域理论研究的迅猛发展,以及实际需求的推动和研究者的广泛关注,三维人脸建模将会在理论和应用两方面获得重大突破。
[1]Blanz V,Vetter T.A morphable model for the synthesis of 3D face[C]//In:SIGGRAPH Proceedings Orlando, FL USA,1999:71-78.
[2]Waters K, Terzopoulos D.Modeling; and animating faces using scanned data[J].Visualization and Computer Animation,1991,2(4):23-128.
[3]Lee Y C,Terzopoulos D,Waters K.Realistic face modeling for animation[C]//In:SIGGRAPH Proceeding Los Angeles,CA.USA,1995:55-62.
[4]Pighin F, Heeker J, Lischinski D, et al.Synthesizing realistic facial expression from photographs[C]//In:SIGGRAPH Proceeding Orlando, FL.USA,1998:75-84.
[5]Colombo A,Cusano C,Schettini R.3D face detection using curvatureanalysis[J].PatternRecognition,2006,39(3):444-455.
[6]Gong X,Wang G.Automatic 3D face segmentation based on facialfeatureextraction[C]//In:Proc.ofthe IEEEConf.on Industrial Technology.Mumbai:IEEEComputerSociety,2006:1154-1159.
[7]Gong X,Wang G Y.A dynamic component deforming model forfaceshapereconstruction[C]//Proceeding of the International Symposium on Visual Computing, USA,2007:488-497.