APP下载

基于复杂度的抑郁障碍患者作答童年创伤问卷的面部运动特征分析

2023-10-31杨志伟李晨曦曾令伟刘旭峰苗丹民

空军军医大学学报 2023年10期
关键词:测验复杂度人群

杨志伟,李晨曦,曾令伟,刘旭峰,苗丹民

(空军军医大学军事医学心理学系,陕西 西安 710032)

为弥补传统自陈测验诸如信息来源单一、被试掩饰性及社会赞许性等固有缺陷,多质融合心理检测理论和技术逐步受到重视[1-4],其主要目的是被试在进行自陈测验同时,采集被试意识反应当下的认知神经及生理信号,对多通道的神经及生理信号进行多质融合分析,期望能从多个角度精准探测评判被试的意识倾向,进而提高心理检测的客观性与精确度[5-7]。研究发现,多种意识反应都会驱动面部运动,例如情绪反应、非语言性交流、深度思考、疼痛感知等[8]。在体现意识反应的多种神经及生理信号中,面部运动是近年来的热点研究领域。当面部运动主要由情绪反应驱动时,就成为了面部表情,面部表情是公认的最敏感的外在情绪显示器[9]。虽然内在情绪状态难以客观测量,但是研究发现,通过面部运动特征指标推测内在情绪,是一条可行的途径[10]。

面部运动编码系统,是由美国心理学家EKMAN在1978年建立的一套面部运动测量系统,他结合人脸解剖学的特点,从形态学和动力学的角度,将人的面部动作进行系统的分析,按照可靠的判定标准将面部运动分解成多个面部运动单元(action unit,AU),通过各个AU动作的时间、幅度、形态以及组合等特征可以对几乎所有的面部运动及背后不同的意识状态进行精细地量化区分[11-12]。而机器视觉及人工智能技术的不断发展,使得对AU运动的识别和定量分析成为可能。

大量研究表明,童年创伤与抑郁障碍有显著病因学关系,且童年创伤相关测验能够诱发被试的情绪反应[13-17]。综合上述分析,本研究融合自陈测验和面部运动特征,对受试的抑郁倾向进行分析。实验以童年创伤问卷作为自陈测验材料,采用AU自动识别技术,分析被试作答童年创伤问卷时的面部运动特征,验证童年创伤问卷对被试面部运动的诱发作用,并探索抑郁障碍人群进行童年创伤问卷测验时面部运动特征的特异性。

1 对象与方法

1.1 对象

抑郁障碍患者(患者组)从解放军第九○四医院住院患者中招募。纳入标准:经精神科医生明确诊断的抑郁症患者,年龄16~36岁,具有初中及以上文化程度,能够轻松阅读中文。排除标准:有其他精神共病,或有面部神经和肌肉相关病史,或在研究前的访谈中面部出现异常运动。

健康对照者(对照组)从社会中招募。纳入标准:年龄16~36岁,具有初中及以上文化程度,能够轻松阅读中文,身心健康。排除标准:面部神经和肌肉相关病史,入组访谈时出现面部异常动作,有药物滥用、吸毒、精神疾病史,3个月内服用过抗精神病类药物。

实验前采用Gpower 3.1进行效力分析,实验拟采用2测验×2组别的存在交互作用的重复测量设计,分析显示总样本数为54,单组样本量应在27例以上。通过分析最终采集有效病例47人(患者组),平均年龄(23.85±5.91)岁,其中男性33人,女性14人。对照组53人,平均年龄(23.58±3.63)岁,其中男性51人,女性2人。经检验,患者组与对照组年龄无显著差异,性别比存在显著差异。

所有被试都签署了书面知情同意书,遇有不适情况可以随时退出试验,并确保有医疗人员应急处置。实验获得空军军医大学西京医院伦理委员会批准(许可证号:KY20182047-X-1),符合《赫尔辛基宣言》的原则。

1.2 方法

1.2.1 实验材料

1.2.1.1 童年期创伤问卷(Childhood Trauma Questionnaire,CTQ) 问卷由BERNSTEIN等[18]开发,可广泛用于评估童年期(16岁以前)创伤经历。问卷由28个题目组成,分别测量身体虐待、情感虐待、性虐待、身体忽视、情感忽视五个维度的童年创伤经历。每个题目采用5级Likert评分,1~5分分别代表从不、偶尔、有时、经常、总是。中文版CTQ量表由赵幸福组织翻译并修订。傅文青等[19]将中文版CTQ在中国高校大学生中进行信效度研究,报告重测信度为0.43~0.82,分半信度为0.45~0.70,Cronbach’s α系数为0.51~0.71,因子分析表明五因子模式符合量表的理论构想。HE等[20]在中国大学生及抑郁患者中对CTQ进行的信效度研究,同样报告了较好的信效度指标,表明CTQ是测量童年创伤的一项有效工具。

1.2.1.2 自编常识判断测验 课题组前期研究发现,多数被试即使在静息态,如注视电脑空白屏上“+”时,仍然有明显的面部运动发生。验证CTQ测验确实能够诱发面部运动,需要设置合理的对照测验。本研究采用自编常识判断测验作为CTQ的自然语言对照测验,按照形式相同,字数和答题时间相当,无情绪词及自传体记忆线索词的原则编制。常识判断测验由指导语及16个常识判断题目构成,每个题目的题干为一个常识陈述句子,包括物理、地理、生物等方面内容,选项为正确与错误的二选项。CTQ的题干平均字数为(14.8±4.4)个,常识判断测验题干平均字数为(12.6±4.2)个,统计显示二者无显著差异。实验分析指标都进行了答题时间的标准化,排除了被试在测验内及测验间答题时间不一致的影响。

1.2.2 实验设备 本实验采用Tobii Spectrum 300眼动系统进行题目呈现及答题操作。眼动系统扩展罗技C930e摄像头,基于眼动系统的时间轴对被试面部运动进行录相,面部视频为mp4格式,分辨率为640×480,帧率为每秒9帧,每帧间隔为110 ms。使用CAC人脸表情识别系统对面部视频进行AU自动识别。CAC系统由国内某公司基于美国面部表情识别工具包Affdex SDK开发,相关研究表明其识别准确率处于当前市面表情及AU识别软件准确度的一流水平[21-24]。CAC的AU识别指标按照视频帧进行报告,能够识别20个AU或组合,分别为AU1(内侧眉毛提起)、AU2(外侧眉毛提起)、AU4(眉毛降下)、AU6(面颊提起)、AU7(眼睑收紧)、AU43(眼睛闭合)、AU9(鼻子皱起)、AU10(上嘴唇提起)、AU14(挤出酒窝)、AU15(嘴角下撇)、AU17(下巴提起)、AU18(嘴唇皱起)、AU20(嘴唇拉伸)、AU24(紧压嘴唇)、AU25(微张嘴唇)、AU26(下巴落下)、AU28(内吸嘴唇)、AU1+AU2+AU5(CoAU1,眼睑扩大)、AU6+AU12+AU25(CoAU2,微笑)、Unilateral AU12(UniAU12,蔑视),AU强度报告值区间为0~100。

1.2.3 实验流程 将常识判断测验及CTQ的每个题目制作成图片,每个测验的图片设置成眼动系统的一个项目,项目中图片连续呈现以实现题目连续作答,项目流程如图1。采用眼动系统进行题目呈现及答题操作,摄像机同步录制被试面部视频。整个过程在安静、光线充足的房间内进行。测验前主试进行详细的操作说明,确保被试理解准确,被试在测验过程中不能进行交流。测验过程中,主试离开操作台1 m以上距离,保持静默状态,以避免说话及非言语性交流等产生的面部运动。

1.2.4 数据分析 本研究通过图片呈现及面部视频录制同时的眼动系统时间轴,建立每张图片与每帧AU识别值的匹配关系,通过Matlab 2012函数计算,获得测验题目和AU识别值匹配后的数据以进行后续统计分析。通过观察发现,AU信号普遍呈现非稳定、不规则的特征,呈现出典型的非线性动力系统特征,因此本研究采用非线性动力指标描述AU的运动特征。在本研究中,主要计算并提取每个AU识别值的复杂度[25-28]来描述AU强度值所构建的时间序列出现新模式的速率,以此度量AU在测验过程中的激活程度。20世纪60年代ARATO等[29]对系统的复杂度进行定义:系统的复杂程度与该系统行为(空间结构或时间序列所表示的变化)的最小描述有关,一般称为柯尔莫哥洛夫复杂性。但柯尔莫哥洛夫复杂性不可量化计算,到1976年,LEMPEL和ZIV[30]提出一种度量符号序列复杂性的计算方法,称为Lempel-Ziv复杂度(Lempel-Ziv complexity,LZC),其计算过程如下:

令c(n)为某一给定的序列S=(s1s2…sn)的复杂性计数(复杂度)。令S、Q分别代表两个字符串,SQ表示把两个字符串连接成新的字符串,SQP表示把SQ中最后一个字符串删除得到的字符串(P为删除操作)。令V(SQP)表示SQP所有不同的子串集合。c(n),S、Q的初始化为c(n)=1,S=s1,Q=s2,因此,SPQ=s1。假定S=s1s2…sr,Q=sr+1。若Q∈V(SQP),则表示sr+1是S=s1s2…sr的字符串的一个子串,那么S保持不变,只将Q更新为Q=sr+1sr+2,再判断是否Q∈V(SQP),如此反复,直到发现Q不再属于V(SQP)为止,此时Q=sr+1sr+2…sr+i,即表示sr+1sr+2…sr+i不是sr+1sr+2…sr-i的子串。因此c(n)值将增加1,然后将上述Q组合到S中,使S更新为S=s1s2…srsr+1…sr+i,进而取Q为Q=sr+i+1。

重复上述步骤,直到Q取到最后一位为止,这样将S分成了c(n)个不同的子串。随后,用如下公式计算LZC:

(1)

CLZN(n)=c(n)/b(n)

(2)

1.2.5 统计学分析 按照2次测验(常识判断测验/童年创伤测验)×2组(患者组/对照组)的重复测验实验设计,在SPSS 19.0中采用广义估计方程(generalized estimating equations,GEE)对每个AU的LZC进行分析。GEE以每个AU的复杂度为因变量,以测验为组内变量,以测验、分组、测验与分组的交互作用为模型预测因子,以各测验的帧数(帧数代表测验时长,由于各被试在各测验上的时长不同可能影响到分析结果)以及性别比(两组的性别比差异可能影响分析结果)为协变量,工作相关矩阵采用非结构化模型。

2 结果

2.1 CTQ测验得分的比较结果

中文版CTQ在本测验中的Cronbach’s α信度系数为0.878,分半信度系统为0.852。情感虐待、身体虐待、性虐待、情感忽视、身体忽视五个维度的Cronbach’s α信度系数分别是0.876、0.895、0.487、0.882、0.710,五个维度的分半信度系数分别是0.857、0.921、0.883、0.841、0.808。测验的五个维度两组间均存在显著差异(tEA=5.540,PEA<0.001;tPA=3.500,PPA=0.001;tSA=2.854,PSA=0.006;tEN=5.882,PEN<0.001;tPN=4.733,PPN<0.001,表1)。

表1 患者组与对照组CTQ测验得分比较 (分,

根据BERNSTEIN等[18]编制的量表划界分数,量表得分中同时满足情感虐待<13分,身体虐待<10分,性虐待<8分,情感忽视<15分,身体忽视<10分,视为童年创伤阴性,其余视为童年创伤阳性。本实验采用相同的划界分数,结果显示患者组童年创伤阳性率占77.8%,对照组童年创伤率占22.2%,阳性者占比在组间比较存在显著差异(χ2=19.978,P<0.001)。

2.2 AU复杂度的分析结果

2.2.1 GEE模型检验总体结果 模型检验显示14个AU(占AU识别数的70%)的测验效应显著。相比于常识判断测验题目,AU1、AU2等14个AU在被试童年创伤问卷中的复杂度发生显著变化,表明在不考虑分组的情况下,这70% AU的复杂度在中文版CTQ及常识测验间是有显著差异的,说明中文版CTQ可以诱发AU的活动。其中,4个AU(占AU识别数的20%)的组别效应显著,具体为AU2、AU20、AU24、CoAU2,表明在不考虑测验因素的情况下,这20% AU的复杂度在患者组与对照组间存在显著差异(表2)。

表2 AU复杂度以及GEE分析模型效应检验结果

2.2.2 分组别进行测验间比较的结果 对于AU复杂度,分别在两组人群下进行中文版CTQ及对照测验间的比较。患者组有5个AU(占AU识别数的25%)复杂度显著小于对照组AU复杂度,分别是AU6、AU43、AU14、AU17、CoAU1,只有AU25(MD=0.020,P=0.046)显著大于对照组AU复杂度。对照组有13个AU(占AU识别数的75%)复杂度显著小于对照组AU复杂度,具体为AU1、AU2、AU4、AU6、AU7、AU43、AU9、AU10、AU18、AU24、AU28、CoAU1、CoAU2(表3)。

2.2.3 分测验进行组间比较的结果 对AU复杂度,分别在两个测验下进行患者组与对照组间的比较。CTQ测验中,患者组与对照组间在8个AU复杂度上有显著差异,且全部表现为患者组大于对照组,具体为AU2、AU4、AU6、AU9、AU20、AU24、AU25、CoAU2。对照测验中,两组间AU复杂度均无显著差异(表4)。

表4 患者组与对照组在两个测验中的AU复杂度比较结果

3 讨论

本研究旨在探索抑郁障碍人群在作答童年创伤问卷时的面部运动特征,为应用特异性面部运动特征进行抑郁障碍人群的早期检测提供理论基础。通过提取被试CTQ和常识判断测验中AU的随时间变化的强度的时间序列,并提取其复杂度特征,进行测验间及组间比较。研究发现,抑郁障碍人群有6个AU在童年创伤测验与基线测验间存在显著差异,童年创伤测验时有8个AU在抑郁障碍人群及健康人群间存在显著差异。

本测验报告的内部一致性信度系数表明童年创伤问卷具有较好的稳定性。测验得分显示,患者组及对照组在童年创伤全部五个维度得分以及童年创伤阳性者比例上均存显著差异。HE等[20]对3 431名在校大学生及234名心理诊所的抑郁障碍患者进行CTQ测验的结果与本实验测验结果非常接近。GILBERT等[31]的研究显示,2009年中国18岁以下青少年身体虐待的报告发生率为26.6%,情感虐待的发生率为19.6%,性虐待的发生率为8.7%,忽视的发生率为26.0%,与本实验童年创伤阳性者的比例非常接近。以上结果表明童年创伤是抑郁障碍的重要易感因素,CTQ测验题目具有很好的童年创伤经历与体验的代表性,具备诱发患者人群与健康人群差异化卷入程度及情感唤醒的可能。

通过观察发现,AU的强度随时间变化是非线性的,因此本研究将AU激活强度随时间变化产生的“时间序列”视作非线性动力学系统进行进一步分析。Lempel-Ziv复杂度是一种描述非线性信号动态变化的重要特征之一,反映的是一个时间序列里出现新模式的速率[32]。复杂度的值越高,说明时间序列出现新模式的速率越高,进一步反映由测验所诱发的AU运动的相关规律。

模型检验显示,有14个AU复杂度的测验效应显著,提示对照测验与CTQ测验对面部运动的诱发作用不同。事后检验显示,患者组中,有6个AU复杂度在两测验间存在显著差异,其中5个在对照测验中大于CTQ测验中,分别是AU6、AU43、AU14、AU17、CoAU1,仅AU25在CTQ测验中大于对照测验中,这项结果提示抑郁障碍人群在CTQ测验中可能面部中下部分相比上部分有更大的反应度。对照组有13个AU复杂度在两测验间存在显著差异,且全部表现为在对照测验中大于CTQ测验中,分别是AU1、AU2、AU4、AU6、AU7、AU43、AU9、AU10、AU18、AU24、AU28、CoAU1、CoAU2,此13个AU基本分布于面部各个部分,在认知活动的面部运动反应度上没有存在面部上部分与中下部分的差异,这与抑郁障碍人群存在明显不同,抑郁障碍人群眉及以上部位的AU没有在测验间出现反应度差异。

测验间存在显著差异的AU复杂度绝大部分表现为对照测验大于CTQ测验,提示被试普遍在对照测验中比在CTQ测验中激活了更多的AU,其原因可能在于常识判断题目的难度偏大,引起了一定程度的认知负荷。但只有患者组在AU25的复杂度上表现为在CTQ中大于对照测验中。AU25可能出现在各种基本情绪类别中[33],本研究中在大小倾向上的唯一性提示AU25可能对抑郁障碍人群具有潜在的标记意义。

模型检测总体结果报告有4个AU的组别效应显著,提示患者组与对照组在测验面部运动反应上的差异性。进一步事后比较显示,在对照测验中没有AU存在组间显著性差异,而在CTQ测验中有8个AU报告了两组间的显著性差异,而且全部表现为患者组的AU复杂度大于对照组,分别是AU2、AU4、AU6、AU9、AU20、AU24、AU25、CoAU2。AU2通常出现于害怕、惊讶两种基本情绪中,AU4通常出现于害怕、愤怒、悲伤三种基本情绪中,AU6主要出现于快乐的基本情绪中,也可能出现于悲伤的基本情绪中,AU9通常出现于厌恶的基本情绪中,AU20通常出现于害怕的基本情绪中,AU24通常出现于愤怒的基本情绪中,CoAU2反映了快乐的基本情绪,AU25则在各种基本情绪类型中都可能出现[33-34]。这8个AU分布在面部上中下各个部分,全部6种基本情绪类型也都有涉及,既有负性情绪反应,也出现了微笑的正性情绪反应,提示在CTQ测验中抑郁障碍人群相比健康对照人群可能产生了更多的情绪反应,且可能更多表现为复合情绪。以上结果充分表明CTQ测验对抑郁症患者的面部运动具有明显的诱发作用,且此诱发作用在抑郁障碍人群与健康人群间存在显著差异,为下一步应用CTQ或其他自陈测验的面部运动特征进行人群区分提供了理论基础。

相关面部表情研究表明深度思考等认知任务同样会诱发面部运动[35-36]。在本研究中,抑郁障碍人群相比健康人群可能对CTQ测验有更大的认知负荷,进而产生更大的面部运动反应。但前述测验间的比较结果表明常识判断测验对两组人群的认知负荷均显著大于CTQ测验,且在认知负荷较大的常识判断测验中两组人群的面部运动反应并无显著差异,因此基本可以排除认知负荷差异导致CTQ测验中两组人群面部运动反应差异的可能,表明CTQ测验中患者组更大的面部运动反应基本来源于患者由CTQ诱发的情绪反应。

CTQ测验中抑郁障碍患者相比健康人群产生了更大的情绪反应,可能来源于抑郁障碍患者对童年创伤题目有更大的卷入度,导致童年创伤测验对患者组产生更强的情绪唤醒作用。这种情绪唤醒可能与自传体记忆提取有关。作答童年创伤题目过程中,被试需要完成童年经历回忆或者自我评价两类认知任务,两类认知任务都要经过自传体记忆提取的认知过程[37-38]。由于情绪信息是自传体记忆编码的基本要素之一,自传体记忆的提取通常伴随着情绪信息的提取,进而激活了情绪反应[39-42]。

本研究还存在一些不足之处:一是AU特征具有明显的丰富性及不规则性,仅用一个非线性指标难以进行全面描述,后期还需要开发一系列特征指标,例如AU形态学特征及组合运动特征等;二是对照测验的难度相对偏大,对设置下行基线水平来剥离CTQ测验中认知负荷对面部运动的诱发作用产生了影响,未来需要在这些方面进一步改进完善。

猜你喜欢

测验复杂度人群
在逃犯
糖尿病早预防、早控制
一种低复杂度的惯性/GNSS矢量深组合方法
《新年大测验》大揭榜
我走进人群
财富焦虑人群
求图上广探树的时间复杂度
两个处理t测验与F测验的数学关系
某雷达导51 头中心控制软件圈复杂度分析与改进
出口技术复杂度研究回顾与评述