APP下载

基于行为数据的心理抑郁症状检测研究

2018-12-14熊笑颜陈栩刘云花陈艳

现代电子技术 2018年24期
关键词:抑郁症

熊笑颜 陈栩 刘云花 陈艳

关键词: 抑郁症; 症状检测; 行为感知; 贝克抑郁量表; 建模方法; 情绪监测

中图分类号: TN919?34; TP391.9               文献标识码: A                    文章编号: 1004?373X(2018)24?0121?04

Research on psychological depression symptom detection based on behavior data

XIONG Xiaoyan, CHEN Xu, LIU Yunhua, CHEN Yan

(School of Science and Technology, Nanchang University, Nanchang 330029, China)

Abstract: The symptom changes of the depression are explored in this paper by analyzing the data collected by the user′s smartphone, so as to analyze the changes in depression symptom and patient behavior, and then track and treat the disease. Two modeling methods are adopted to analyze the characteristics of patients′ physical activity, sleep, and emotional state, so as to better predict depression symptom changes. By comparing features selected by the two modeling methods, it is found that there exist some common key features. The growth of the Beck′s depression inventory (BDI) is predicted to obtain the model based on the measured data, and the accuracy of the model is verified.

Keywords: depression; symptom detection; behavior perception; BDI; modeling method; emotional monitoring

本文采用贝克抑郁量表(Becks Depression Inventory,BDI)[1]通过日常用户输入影响与价值准则(Circumplex模型)的调查结果和被动感知的用户活动数据,探索其测量抑郁症状长期变化的能力,并将每日的Circumplex结果与被动感知用户活动行为的效用进行比较[2?3]。研究发现,日常自我调查评估的衡量准则与患者情绪长期变化衡量准则之间的关系复杂。而通过分析观测得到用户活动水平和睡眠持续时间等数据,其对抑郁症状增加的预测性远超出日常调查评估。BDI特征与情绪变化之间的相关性强度是通过p值建立其线性回归模型系数,它在Lasso惩罚线性模型中被选择为大系数[4?5]。本文的研究表明,睡眠持续时间与抑郁症状预测的相关性较强。同时,也发现调查中的单个异常值能够严重影响调查结果。这说明了需要调查多样性人群,以防止人为过度拟合的数据集而造成误差。

1  现场研究及数据建模

為了证实每日自我情绪评估与日常活动、睡眠的监测及情绪的整体变化如何相关,本文对107名学生进行数据采集。这些学生被要求随时携带一台Android智能手机,并安装定制程序。在8周研究期间,该应用程序将提示用户每天4次输入其健康和能量水平(Circumplex影响和价值)。此外,还收集了来自传感器的各种数据。

表1所示为研究中用于描述参与者的特征及其在研究期间的行为特性。每个信号的分布计算观测熵特征,其量化了信号的不规则性。特征的差异性试图量化从基准值到研究结束的变化,而不考虑中间波动[6?7]。本文用1周的时间作为时标,以稳定日常波动,表明每周的情绪均值与每周的PHQ?9分数相关。采用的PHQ?9模型公式为:

[α=KK-1·1-i=1kσ2Yσ2X] (1)

式中:[K]是测试项目的数量,此处为9;[σ2Y]是总体得分的方差;[σ2X]是当前样本的方差;[α]取值在[0,1]之间,当[α]<0.5时结果不可接受,数值越高代表结果越好。

根据各特征值调查结果对BDI增长预测的模型如下:

[W=β0i+β1i+β2i+β3i+β4i+β5i+β6i+β7i+α] (2)

[β0i=γ0i+γ1i+γ2i+γ3i+γ4i+γ5i+γ6i+γ7i] (3)

式(2)和式(3)描述了针对Big5因素与白天活动及夜间睡眠时长等进行BDI增长预测的模型。其中,[β(1~7)i]分别对应用户神经质、外向性、开放性、和蔼度、良心度、日间活动时长和夜间睡眠时长的均值;[γ(1~7)i]为这7项特征包含排除在外的样本的均值;[β0i]为异常值平均加权;[α]为PHQ?9分数。

研究目标是了解参与者的抑郁症状(BDI评分)长期变化所产生的相关行为因素;第二个目标是使用这些因素预测抑郁症状表现的变化。为了识别相关和预测特征,文中选择使用线性模型。因其有明确的解释,因此是特征选择与模型分析的理想选择。

1) 特征选择。为探索特征的相关性,本文使用线性回归模型,并针对这些模型采用两种特征选择方法:使用贝叶斯信息准则(BIC)进行前向选择,以选择在每个后续步骤中应添加哪些特征或何时前向选择应被终止;线性回归与L1(Lasso)惩罚。这两种方法均产生了具有有限数量的项数及表明其对模型贡献的系数。

2) 特征比较。为了使特征的权重相当,本文将所有特征量化为单位方差,其产生的特征是可比的尺度模型。因此,特征系数之间的比较更具有参考性。

3) 异常值。研究中一个参与者的数据集中存在异常值,说明该参与者经历了一个特别困难的时期。由于本次调查规模较小,该异常值会对模型产生较大影响。相对于控制观察,本文提供了包含和排除异常值的模型。

2  数据结果分析

上述使用的回归方法的特征选择、模型拟合和预测精度之间的比较如表2所示。

2.1  具有正向选择和BIC的线性回归

表2小括号中为适当情况下的线性回归系数的p值,“*”表示小于0.001的值。异常值的基线为83.212,移除的异常值为25.184。方括号中的数字是以非离群值集合计算的MSE,第一列系数表示适合整个数据集的线性模型。通过使用最小化BIC的模型和前向选择模型来选取这些特征。该建模程序选择了6个特征,其中5个具有统计学显著性(p值<0.05)。除了量化参与者的个性特征外,所有其他特征均来自传感器测量。该模型具有较高的R2为0.785,表明数据的可变性主要由这5个特征来解释。

2.2  L1惩罚线性模型

表2中的第3列系数为被选中的L1(Lasso)惩罚线性回归模型。采用该建模方法,每当新的系数被包含进来时,通过对模型精度项添加惩罚因子进行特征选择[8?9]。此过程会将不必要项的系数递归为零,进而将其从模型中移除。Lasso方法选择了可观察到的最大模型,具有8个特征。与正向选择相同,参与者个性的开放性被选为对该时期BDI评分增加的高度预测。同时,描述参与者白天静止和“睡眠”的多样性、变化性的特征也被选中。Lasso惩罚线性模型选择了表示参与者自我评估能量水平的多样性和变化性的两个特征,还选择了描述平均活动水平与日间平均活动水平变化的两个特征。虽选择了参与者能量水平的两个特征,但并未选择参与者的自我评估功能。在所选的8个功能中,有5个描述了传感器测量到的活动。

2.3  删除异常值

在收集的数据集中存在一个异常值。异常值是由于一个参与者经历了一个特别困难的时期,其BDI评分增加了50分。分数第二大变化是14分,故该参与者是一个异常值,对模型选择有重大影响。为了探索以前模型的鲁棒性,文中使用相同的方法将两个模型应用于剔除单个异常值参与者后的数据集中。这两个模型在表2中的第2和第4列系数中呈现。

所得到的模型与包含异常值的模型不同。这一结果表明,模型对参与者的经验极为敏感。然而,参与者的开放度仍被选为前向选择和Lasso惩罚回归的特征,这意味著该个性特征与BDI得分的变化强烈相关。另外,在使用Lasso惩罚回归的模型从研究的开始到结束中,自我评估的能量变化特征也被选中。

2.4  一次性预测精度

最终测试时将采用这些模型进行抑郁症预测,并测试这些模型与对比组间的预测精度。由于数据集的大小受限,本文使用一次性的交叉验证。在该方法中,一个用户被保持在外,使用所有其他用户来训练该模型。随后通过对保持在外的用户预测误差,来测量训练模型的误差。对所有用户重复此过程,测量的最终误差用所有参与者之间均方误差(MSE)衡量[10],如表2最后一行所示。较低的MSE表示模型的预测性能较好,零表示完美的模型。为选择一个模型比较的参考基准,以对比其预测性能,本文选择使用空模型的结果作为基准MSE。当包含异常值时,该空模型计算的基准MSE为83.212;当异常值从数据集中排除时,为25.184。可以看到,用正向选择和BIC构建的模型产生的MSE低于基准,这意味着这些模型具有更优的预测精度,可均匀地预测数据集的均值。适合Lasso惩罚模型产生的预测MSE(96.149)高于基准(83.212)。然而,当排除异常值时,Lasso惩罚模型则呈现出比具有两个特征的基准(MSE = 25.184)更优的模型(MSE = 16.939)。这表明了参与者的开放度与本时期BDI评分相关性的强弱。

图1显示当异常值参与者被包括在数据集中时,观察到的BDI评分增长预测与实际BDI增长预测的分布。图2与其类似,但其显示了在排除异常值后数据集上的预测分布。两个数字预测均是通过拟合线性模型来形成的,这些模型基于前向选择所确定的特征,而BIC则是以一对一的交叉验证方案。两个数字在预测误差中显示出较小的差异,即BDI增加不一定低于或超过预测。此外,这些数据大多预测在BDI的真实评估浮动的5分(虚线)之内。

3  结  语

本文探讨了不同特征数据对预测评估抑郁症的效用。研究发现,两种建模方法的R2值相对较大。同时,还分析了不同模型对抑郁症数据集的预测能力,证明了被动感知的数据在两种模型中比预期的用户自我评估输入更能预测BDI的增加。尽管研究证实了所提算法可以衡量行为模式,并可以预测抑郁症情绪状况。但未来仍需进行更多的工作,尤其是针对更大的数据样本进行调查研究。此外,比较具有不同BDI评分分布的临床抑郁人群的结果也是值得进一步研究的领域。

参考文献

[1] 陈茜,史殿习,杨若松.多维数据特征融合的用户情绪识别[J].计算机科学与探索,2016,10(6):751?760.

CHEN Qian, SHI Dianxi, YANG Ruosong. User emotion recognition based on multidimensional data feature fusion [J]. Journal of frontiers of computer science & technology, 2016, 10(6): 751?760.

[2] 张振.基于智能移动终端触屏行为的情绪识别研究[D].重庆:重庆邮电大学,2016.

ZHANG Zhen. Emotional state detection from touch?based behavior on touch?screen device [D]. Chongqing: Chongqing University of Posts and Telecommunications, 2016.

[3] 帅静.行为决策信息与情绪间的关系[D].西安:西北大学,2015.

SHUAI Jing. Relationship between behavioral decision?making information and emotions [D]. Xian: Northwestern University, 2015.

[4] 朱响斌,邱慧玲.基于智能手机传感器数据的人类行为识别研究[J].计算机工程与应用,2016,52(23):1?5.

ZHU Xiangbin, QIU Huiling. Human activity recognition with smartphone sensor data [J]. Computer engineering and applications, 2016, 52(23): 1?5.

[5] 郭傲.基于智能手机的个人行为特征分析系统的设计与实现[D].武汉:华中科技大学,2016.

GUO Ao. Design and implementation of personal behavior feature analysis system based on smartphone [D]. Wuhan: Huazhong University of Science and Technology, 2016.

[6] 熊娜.手持移动设备中基于记忆心理学的效率型服务设计研究[D].杭州:浙江大学,2012.

XIONG Na. Research on efficient service design based on memory psychology for hand?held mobile device [D]. Hangzhou: Zhejiang University, 2012.

[7] 沈麒.基于校园网的用户行为分析系统的设计与实现[D].苏州:苏州大学,2011.

SHEN Qi. Design and implementation of user behavior analysis system based on campus network [D]. Suzhou: Soochow University, 2011.

[8] 叶舒雁,张未展,齐天亮,等.一种基于传感器与用户行为数据分析的移动学习场景感知分类方法[J].计算机研究与发展,2016,53(12):2721?2728.

YE Shuyan, ZHANG Weizhan, QI Tianliang, et al. A sensor and user behavior data analysis based method of mobile learning situation perception [J]. Journal of computer research and development, 2016, 53(12): 2721?2728.

[9] 任艳.微信息大数据粗糙集的近似约简[J].沈阳工业大学学报,2016,38(3):309?313.

REN Yan. Approximate reduction of micro?message big data rough set [J]. Journal of Shenyang University of Technology, 2016, 38(3): 309?313.

[10] LATHIA N, PEJOVIC V, RACHURI K K, et al. Smartphones for large?scale behavior change interventions [J]. IEEE pervasive computing, 2013, 12(3): 66?73.

猜你喜欢

抑郁症
心理护理干预对抑郁症患者临床疗效的影响
细致化护理在改善抑郁症患者心理状态中的作用分析
联合家属健康干预对社区糖尿病伴抑郁症患者疗效的影响
年轻人患“抑郁症”的背后
三种抗抑郁症药物治疗伴躯体疼痛症状的抑郁症患者的对比研究
无抽搐电休克治疗抑郁症的疗效初步分析与报道
对一例因抑郁症有自杀倾向的案例分析
文拉法辛联合米氮平治疗老年抑郁症的效果及安全性
西酞普兰治疗抑郁症的疗效及安全性
有关“抑郁症”的新知