APP下载

居室环境心情调节系统设计

2012-07-12北京邮电大学王又立

电子世界 2012年19期
关键词:居室人脸音频

北京邮电大学 熊 朔 王又立 郑 凰 张 进

居室环境心情调节系统设计

北京邮电大学 熊 朔 王又立 郑 凰 张 进

本文介绍了一个通过智能改变居室内环境来调节人心情的综合性交互式系统的设计方案,来达到改善居室内目标对象情绪的目的。通过室内环境监测技术和人脸表情识别技术获得一般化的有助于改善人体心情的相关参数和信息,应用环境心理学的相关知识智能化处理分析,得出适合改善对象心情的调整居室环境的方案,最终实现在改变居室内环境要素(如环境色调、墙体图案和背景音乐等)的方案下实质性地改善目标对象的心情。从集成传感器检测并甄别天气因素和人脸表情识别系统解读人脸影像信息的环节开始,系统将智能化地对目标对象的置身环境和心情状况作出分析并输出调整居室环境的方案,然后作为执行端的组件将实现更改环境色调,调整墙体图案和辅助播放背景音乐等功能。该系统旨在通过室内客观实在的墙体图案,背景音乐形成的“景”唤起体验者的愉悦之“情”,并且通过色彩、图案、音乐的变换,形成不同的心情主题,给予在外奔波身心俱疲的现代人深切的人文关怀。

调节心情;人脸表情识别;环境心理学;环境监测

1.目的意义

现代人的生活圈被禁锢在了不断拔起的水泥森林的狭小空间内,面对的是恒定式的白色砖墙和扎眼的沥青马路,耳朵里塞满了嘈杂的汽笛和浮躁的鼠标键盘声。身心俱疲的我们需要生活环境的改善和居室现状的革新,与其说把城市环境夷平重新建设,远不如直接改善我们生活和工作的居室环境来得易行有效,这就是我设计这个居室心情调节系统的直接目的。

我设计研发的居室心情调节系统的诞生将具有广泛而深刻的意义。作为居室环境变化的心情调节方案,其设计本身不光具有环境心理学的内涵,更是居室设计美学的延伸,其实际意义在于设计一套可以随时按指令集命令或主观意愿更换居室装饰环境的智能图形投影系统。在智能选取或输出可选列表时,就可以随时像更换手机壁纸一样更换房间内的装饰背景和图案,这套系统的娱乐性和实用性又将增色不少。

另一方面,这个系统可以基本应用于小型家庭的装饰变换,这样不仅可以给很多家庭节省下来大量的装修费用,更能让使用者体验到不同风格,不同样式的装饰。而完成这一系列的变换,仅需让摄像头拍一张照片或轻触按键。

在节省部分高昂装修费用的同时,我们也远离了频繁接触装修材料对人体健康的损害。这样通过投射影像来改变环境背景的装饰方式在选择上的可塑性和二次利用价值都是固化的家居背景图案和材料无法比拟的。

娱乐性体现在随心情和天气变换的背景图案上,年轻人不喜欢一成不变而崇尚个性,在开放图案和背景音乐的数据库给用户的情况下,用户自行选择的余地和可操作性以及可玩性都将是设计的亮点,这也肯定会受到学生群体和年轻白领的大力追捧。实现“研究成果能够体现很好的专业技术的综合性或具有很好的可视化效果,容易在学生群体中产生感性反响。”

实用性体现在可以借助虚拟数据平台实现超大容量随时随地装载能改善心情的装饰方案,摒弃了费财费力的实体装修,几乎实现几乎零成本,零周期和零污染。而且,改善心情对于人的意义更是无法简单估量的,这更将大幅改善现代人的生活状态和身心健康,实现良好的社会效益。满足“成果一旦得到应用会产生现实的实用价值或社会效益。其影响面至少在一个局部产生效应。”

经济性体现在改装的硬件投入大多可由现有的家居设备来实现,比如背景音乐可以由家庭影院外接已由电脑智能控制的数字转盘来启动并播放。而且多维影音控制都可以在软件层面上给予很大的帮助。包括只需特定的几台投影设备即将实现背景图案的变化,都是以极低的成本达到良好的预期效果。再考虑与心情结合的一体化影音效果更能修身养性,满足“研究成果得到应用后的性价比高,经济效益好。”

2.系统实施技术路线

系统技术路线图见图1。

(1)输出捕获图像;

(2)综合分析处理加权人脸心情参数和加权环境心情参数;

(3)分析计算适合改善人心情的居室环境改变方案组;

(4)处理上级指令并调用影音数据库,输出配置方案;

(5)执行配置方案,投影图像并播放背景音乐。

图1 系统技术路线图

图2 系统总框图

图3 设计的基本DIB类图

图4 DIB处理模块

图5 初始化模块

首先,参与对象处于可采集影像的区域范围内时,系统将通过影像采集技术获取人脸图样并输入下一级影像处理单元进行人脸影像的分析,再应用人脸表情识别技术抓取特征表情细节,分析得出这些特征值所呈现出的相应表情参数Score-1(对表情呈现出的心情状况给出智能的评分),以此表征一个代表人物心情状况的参数按照预定的算法计算得出加权人脸心情参数Score-1 plus。在进行人脸表情影像采集及分析过程的同时,系统也将进行居室内环境参数的分析计算,其过程开始于系统通过其内的光强C1、温度C2、湿度C3和大气压C4等传感器感知输出各环境参量至下一级加权运算组件,在这一级运算中各参量将遵循预定的算法处理C1、C2、C3和C4数值得出加权环境心情参数Score-2 Plus。在同时得到加权人脸心情参数Score-1 plus和加权环境心情参数Score-2 Plus后,系统将会执行基于环境心理学的相关选择法则,分析计算后综合得出适合改善人心情的居室环境改变方案组。之后将调用影音数据库来具体化方案组的可备选的图像和音乐,通过投影仪组件和音响系统等输出设备来实现从视觉和听觉多重方面对人体心情的改善:投影仪将在墙体和预设区域投影出从方案组中随机选取的改善心情的图像,音响系统将遵循方案组的随机选择播放有助于改善心情的北京音乐。为了避免系统的选择因为个别对象的自身原因而产生对影像或音乐的不适应性,可通过对象自选或提供更换选择等方式来调整输出方案。

3.系统技术关键

3.1 人脸表情识别程序模块

程序采用Gabor变换与Visual Studio提供的关于位图的DIB支持来实现表情特征提取和表情分类算法。其中Gabor变换是短时Fourier变换中当窗函数取为高斯函数时的一种特殊情况,本质实际上还是对二维图像求卷积。而由于其属于加窗Fourier变换,Gabor函数可以在频域不同尺度、不同方向上提取相关的特征。另外,Gabor函数与人眼的生物作用相仿,所以经常用作纹理识别上,并可以取得较好的效果。在图像处理方面,采用VC++(Visual Studio中包含)提供的自定义类CDib处理数字图像,设计一个设备无关类CDib,里边封装了DIB位图处理所需要的基本成员变量和成员函数。目前已完成对已有数据库内表情的准确识别,7中种可识别表情分别是愉快、厌恶、愤怒、害怕、悲伤、震惊、中性。

可采用VS2008开发环境,MFC来实现界面。在运行软件之前先要完成模板初始化的工作,然后打开要进行处理的图片,即可进行表情识别。目前能进行识别的表情有愉快、厌恶、愤怒、害怕、悲伤、震惊、中性。系统总框图如图2所示。

(1)类图设计

设计的基本DIB类图如图3。

(2)目前调试好的模块的框图

DIB处理模块如图4。

(3)初始化模块

初始化模块:如图5。

3.2 音频流解决方案

基于对系统要求的考虑,音频流作为前承系统输入的心情及天气数据,中接处理分析平台给出的解决方案,并担当最终执行方案及数据流在硬件处理上的输出终端的一路重要组成部分,是需要根据系统的特性和需求来特别设计制作的。出于对诸如空间外壳材料及构造对音响系统箱体设计和落位的影响、PC端中心处理平台数据交换接口的统一和并用、PC平台音频模拟通道干扰及机内系统资源分配导致的预处理时延等因素的细致考量,可通过多方探索和深入研究,最终讨论决定将并行实行两套预定的音频流解决方案,并在系统各组件协同工作的整合阶段,根据中心算法的大框架下整合接口和资源的需求,择优选取将在后期重点采用的音频流解决方案。

现先介绍下这两组预定的音频流解决方案:(注:“->”符号表示执行信息流方向和通过各级硬件的数据流方向。)

方案一:中心算法给出心情调节方案->提取音频方案信息->基于播放软件FOOBAR2000载入音频方案(软件中已加有自行编写的DSP组件、输出预处理方案和音效优化代码)->PCI外置声卡(或火线外置声卡,再或者USB外置声卡)的双路模拟口输出(两组)->功放前级->功放后级->定制扬声器(两路协同放音)。

方案二:中心算法给出心情调节方案->提取音频方案信息->基于播放软件FOOBAR2000载入音频方案(软件中已加有自行编写的DSP组件、输出预处理方案和音效优化代码)->作数模转换的音频解码器的模拟口输出->多路模拟声分路预放大设备(可以在功放前级端实现,也可以在定制的AV分路放大模块端实现)->功放后级->定制扬声器(两路协同放音)。

出于对系统整合阶段将面临的软硬件端都要分别统一接口以及PC系统资源分配对于数字或模拟音频信号输出效果的影像等情况的考虑,我给出的这两种音频解决方案都各自侧重及偏向于各自适合的系统整合方案。

这两种解决方案相较于传统家庭影院中的音频解决方案都有着几点创新性设计和优化性定制理念,以下将依照数据流和执行信息流方向并分各模块组件对创新性设计和优化性定制理念进行说明。

对于我用PC端作为音源的音频流方案的核心创新思想,一言以蔽之即是:在PC端即处理AV信号的分离并在播放软件端就预设好对于输出信号的操作和处理,在声音输出端(扬声器组)做自适应的校音(对扬声器箱体及分频器等做定制设计)。

这样一来,就从传统PC端家庭影院方案中创新并独立出音频流,在PC内部时钟能做好音频和视频的同步和异步这一点不同于其他流媒体(如DVD,HDDVD和蓝光DVD等影音媒体硬载)的优势上,能将音频流独立于视频流做数字解码和模拟放大,是对于音频效果在音源端的极大解放,能达到更加优秀的音效素质。在音频解码器这级上,排除了机内板载声卡、内置声卡和合并功放等形式,将DAC模块定位由外置声卡或独立的数模转换器担当,这样由板载卡或内置卡带来的机内干扰及屏蔽问题就不会再是问题,而且合并功放不独立的前后级将带给后面难以多路输入输出的难题也将迎刃而解。无论最终系统中采用何种多路放大处理方案,都将视频流隔绝在了整个声音处理的解码放大过程中。当然,原本音频的放大设备——AV功放(将视频流和音频流合并式放大的装置)也有音效和复路的特色功能,这些都将在PC端的音频播放软件FOOBAR2000上进行自行编写代码来进行预设音效、DSP设置和音效优化等操作来实现更好的原先由AV功放实现并强调了的声道隔离度、延迟时间范围、各种声场模式(DSP系统、家用THX系统,杜比AC-3系统)等指标参数,并独立于AV功放多出的会影响声音质量的有关视频部分的操作和功用。

方案中有别于传统PC联袂AV功放的独立式设计和更加融合PC端软件层面的处理方式,将带来如下的声音改善。

最自然的声音才能不会对的处理方案更加趋近于Hi-Fi,即英语High-Fidelity的缩写——高度保真,这将尽量要求音响设备在重放过程中,对声音信号各项指标不失真地放大、处理,辅以微妙的音乐风格理解带来的声音染色,实现对音乐重放的听觉享受;如今主流PC端视音重现都AV功放(更低级别的多媒体音箱并不需要考虑,毕竟低级别的多媒体音箱并没沿袭有源音箱高保真的特性,反而以适应影像的混响和易用性等有悖良好声音特性的特点作为设计初衷),是汇集了音频和视频两种信号处理的视听放大器,强调的是声场的混响和氛围,现在是家庭影院的主力放大设备。二者在技术指标、声场氛围不同、放音声道数目、输入输出接口类型及数目和电路设计等都存在很大差异。谈及差距,AV功放对声音的劣化又是显而易见的。

(1)AV功放在播放大信号声源时动态范围不佳和瞬态拖沓,底气不足;音频流将使单独解码和放大,动态和频响处理更从容。

AV放大器在双声道状态下的输出功率比在四声道及以上状态下的输出功率大,因为功率的重分配将导致电压摆幅和电流摆幅的减小。当重放大动态范围的音乐时,本来音频输出功率就不够足的AV功放则将明显力不从心。这是因为AV功放的总功率消耗大,电源功率储量不富余,而系统下的功放后级将是单独的电源和变压设备,能足够满足音频信号的放大,如果有更高要求甚至可以大三芯平衡输入输出,这样处理大瞬态和大动态范围的音乐将更加从容不迫。

(2)AV功放走线多将带来更多的干扰和更复杂的屏蔽处理模块;而放大模块是单对同类型接口的输入和输出,不需要走线和飞线,布线的优势将体现在屏蔽方面。

AV放大器设置多种视频、音频端口,接入多组音频、视频信号源,造成信号走线多而杂,极易造成信号的相互干扰。尤其是分布电容的存在,对高音频及其谐波的影响最大,使优质信号源原有的丰富高频分量受到衰减或干扰,使听者领略不到高保真的效果。

(3)传统多媒体显示的多界面也会干扰音质。整合了视频界面和音频界面的传统面板注重方便的多功能操作,面板上设有大型荧光显示器,使操作直观生动,但荧光屏用低压交流灯丝加热,在脉冲信号的驱动下进行字符显示,将对周围辐射出许多电磁干扰,将对各放大器件的工作产生影响。

基于上述多个层面的考虑,开始时可分别在硬件和软件平台上分别设计、施行并完善相应的模块,已完成的分部件测试向项目组成员预示了这俩组音频流方案将会达到最终预期的效果。

4.调节心情系统的发展趋势

未来随着投影仪的性能提升,室内投影影像将达到媲美真实装饰的效果;多媒体集成一体化将实现影像和声音的无缝操作,并使用更高清和高保真的影音体验增强系统的用户体验;识别和传感技术的发展将更大化实现系统的效能;更多关注于调整人心情的方法将加入到系统当中,使系统的执行效果更加优秀。

[1]孟昭兰.情绪心理学[M].北京:北京大学出版社,2005,3.

[2]朱熊兆,罗伏生,姚树桥等.认知情绪调节问卷[J].中国临床心理学杂志,2007,15(2):121-124.

[3]宗君斌.基于Gabor小波系数融合的人脸识别[D].浙江工业大学,2009.

猜你喜欢

居室人脸音频
有特点的人脸
一起学画人脸
必须了解的音频基础知识 家庭影院入门攻略:音频认证与推荐标准篇
基于Daubechies(dbN)的飞行器音频特征提取
三国漫——人脸解锁
进入画家居室的是谁
音频分析仪中低失真音频信号的发生方法
进入画家居室的是谁
论色彩在儿童居室中的应用
Pro Tools音频剪辑及修正