基于音频的罪犯自杀危险性评估

2023-04-29郑子强何得淮廖潇楠兰琳蒋静文张伟

四川大学学报(自然科学版) 2023年6期

郑子强何得淮廖潇楠兰琳蒋静文张伟

摘要：现较为主流的罪犯自我伤害风险评估主要通过量表实现，但存在耗时长、虚报率高的问题，缺乏客观有效的识别方法.音频数据不受个体语言限制，有采集方便、信息丰富等特征，目前基于音频数据构建的自我伤害风险识别模型取得了不错的效果.通过访谈获取罪犯音频数据，对音频进行预处理后提取音频关键特征，采用4种机器学习算法构建分类模型.实验结果表明，罪犯音频能有效区分罪犯是否具有自我伤害、自杀倾向，平均F1分数为86.88%.

关键词：罪犯评估；自伤自杀；音频；机器学习

收稿日期： 2023-04-05

基金项目：罪犯综合评估系统研发项目（HX20220768）；四川省科技计划（2020YFS0575）

作者简介：郑子强（1994-），男，研究实习员，硕士，研究方向为自然语言处理与语音信号处理. E-mail： zhengziqiang@wchscu.cn

通讯作者：张伟. E-mail： zhangwei@wchscu.cn

Audio based suicide risk assessment of criminals

ZHENG Zi-Qiang¹， HE De-Huai¹， LIAO Xiao-Nan¹，

LAN Lin²， JIANG Jing-Wen¹， ZHANG Wei¹

（1.West China Biomedical Big Data Center， West China Hospital， Sichuan University， Chengdu 610044， China;

2. Education and Correction Department， Sichuan Provincial Administration of Prisons， Chengdu 610016， China）

The mainstream suicide risk assessment of criminals is achieved through scales， but there are some problems such as long time consuming， high false reporting rate and lack of objective and effective identification. Since audio data is convenient and informative while not restricted by individual language， previous studies have achieved good results in audio-based modeling of criminal suicide. In this study， the audio data of criminals were obtained through interviews. After pre-processing， the key audio features were extracted for machine learning modeling， and four classifiers were used to build the classification model. The experimental results show that the audio of criminals can effectively distinguish whether criminals have suicidal tendencies with the average F1 score of 86.88%.

Assessment of criminal; Self-harm and suicide; Audio; Machine learning

1 引言

自杀是全球监狱中罪犯的主要死因之一，罪犯自杀率是普通人群的三倍以上^[1].自杀死亡的罪犯中有一半以上曾有过自伤事件记录^[2].据统计，监狱中男性罪犯自伤事件发生率在5%～6%，女性罪犯自伤事件发生率在20%～24%^[3]，自伤罪犯在狱中自杀的风险是其他罪犯的6～8倍^[4].国内学者的研究表明，我国的服刑人员也是自杀风险较高的人群之一，但在有效及时的管控措施下，自杀死亡率远低于国外比例^[5].罪犯自伤自残尤其是自杀等非正常死亡事件常会引起媒体和社会的关注，对监狱内工作人员、其他罪犯以及监狱系统造成严重影响，对自伤自杀罪犯的治疗与监管还会进一步增加成本.2007年世界卫生组织将减少监狱自杀人数列为国际优先事务^[6]，许多国家都制定了预防罪犯自伤自杀的标准和指南^[^7]，但如何有效评估罪犯自杀风险成为了各国监狱的研究重点.

预防罪犯自杀，首先需要了解该类事件的产生因素.Duthé 等^[8]研究了法国男性囚犯的监禁特征与自杀风险之间的联系，结果显示自杀与罪名、年龄相关，多发生于住院期间和惩戒室内，亲属探视可有效降低自杀率.2014年，《柳叶刀》发布了一项关于英格兰和威尔士监狱罪犯自伤的研究报告^[9]，表明自伤人群主要为年轻人和白人，与监狱类型、刑期、罪名相关，同时自伤事件的后续一个月以内是自杀高风险期.此项工作已经对英格兰和威尔士监狱管理局对危险犯的管理方式产生了影响.目前国内外对于罪犯自伤自杀的相关危险因素研究较多，也得到了基本共识，与罪犯自伤自杀最相关的因素有罪犯的自杀意念、自杀自残史、精神疾病和单独监禁^[10^，11].

尽管目前已经有如此多的研究确定了罪犯自伤自杀行为的广泛风险因素，但并没有确定哪些罪犯最有可能在监禁期间对他们的自杀意念采取行动，大多数有自杀意念的人没有自杀行为^[^12]，这意味着自杀意念并不是一个充分的原因.Favril等^[13]从比利时15个监狱中随机抽取了1203名男性罪犯，以自我报告的形式来了解他们的自杀意念，约三分之一的参与者存在自杀念头，其中26%的人在狱中企图自杀，占所有参与者的9%.该研究显示，对于存在自杀意念的罪犯，需要关注是否有吸毒、暴力犯罪、非自杀性自残史，这些因素是该群体高自杀风险的标志.

既往的研究主要聚焦于实证研究，宏观地考察了自杀罪犯与环境、生理、心理等因素之间的关系，而犯人作为个体的声音则一直被排除在研究的内容之外.目前对于自伤自杀言语特征的研究较少，相关文献不多，而且基本上都是与抑郁症相关联.实际上，重度抑郁症和双相情感障碍这两种情绪障碍在自杀死亡中占很大比例^[14]，新出现的证据进一步支持了情绪障碍严重程度与自杀风险之间存在强有力的表型关系^[^15].从听感上，早期研究者形容自杀倾向者说话时音调单一^[16].有研究发现，声带抖动和声门频谱参数对近期自杀患者、抑郁患者、非抑郁对照组有良好的识别能力，支持了语音与自杀风险之间的联系^[17^，18].对抑郁患者和高自杀风险者的语音特征进行分析，结果表明梅尔倒谱系数（Mel Frequency Cepstrum Coefficient， MFCC）和声门谱斜率参数在重度抑郁相对应的声带指标上略高，组间分离表现较好^[19].

国内外暂未查见基于音频的罪犯自杀评估研究，还处于话语分析、解释归因形成评估量表的阶段.相较于传统的量表筛查方法，机器学习和深度学习方法可以为自杀筛查和评估提供更精确客观的指标^[20]，主要应用于问卷调查^[^21]、语音学^[^22]、电子健康记录^[^23]、fMRI^[24]等，均取得了不错的效果.受限于场景和成本，文章仅围绕罪犯音频开展研究，为现代化监狱的罪犯自杀危险性评估奠定语音研究基础.

2 相关工作

语音信号形简意丰，由语言和音频构成，语言是语音的内容，用于表达语义，音频是语音信号的载体，体现的是语音的声学特征.通常情况下，语音分析是结合语言特征和音频特征共同分析，但对于小语种或方言，人工理解尚有困难，计算机对于这些资源稀缺语言的识别性能更差，若人工转录成本又过高，因此研究者们尝试仅通过自杀患者的声学特征来学习自杀意念和自杀行为的检测方法，并已证明了声学特征与自杀倾向之间的关系^[17^，18].

2.1 自杀音频声学特征

自杀音频声学特征主要分为韵律特征、声源特征、共振峰特征和频谱特征.

（1）韵律特征（Prosodic Feature）.韵律特征主要体现说话人的语速、节奏、能量、基频（也称为F0）等特征，其中能量和基频能够直接反映声音的响度和音高，因此是最常用的特征.自杀倾向者存在声能降低、音高变化少等特点^[25]，并且语音信号的衰减速度更加缓慢.

（2）声源特征（Source Feature）.声源特征测量的是发声过程中的声音质量，表现从肺部通过声门时的气流变化.自杀倾向者的喉部控制会受到影响，出现刺耳、呼吸音、尖锐音，这一变化可以反映在声源特征上^[26].自杀音频分析中广泛使用的声源特征包括基频微扰（Jitter）、振幅微扰（Shimmer）、谐波噪声比，这些声源特征与声带振动直接相关，已被证明与自杀倾向相关^[17，27].

（3）共振峰特征（Formant Feature）.共振峰特征是测量鼻腔和声道共振的物理特征，因此喉咙肌肉张力、唾液分泌的变化，均可以通过共振峰特征捕捉.许多研究已经证明共振峰特征变化与自杀状态之间的关系，例如，France等^[28]研究发现，自杀倾向者的共振峰频率增加和带宽减少.Stasak等^[29]研究表明共振峰特征有助于识别自杀患者.

（4）频谱特征（Spectral Features）.频谱特征表示在给定时间内语音信号的频率分布.自杀音频分析中常用的频谱特征有梅尔倒谱系数（Mel Frequency Cepstral Cofficients， MFCC）和功率谱密度（Power Spectral Density， PSD）.多项研究表明，将MFCC和其他声学特征相结合，能够有效提升非抑郁患者、近期自杀患者和抑郁症患者的识别准确率^[19，30^-32].

2.2 基于音频的自杀检测方法

目前基于音频的自杀检测方法主要分为两类，一类是统计分析法，另一类是机器学习分类法.统计分析法是将音频特征作为观测变量，应用统计学方法挖掘相关特征及特征维度之间的关系，用于描述自杀者与健康者音频之间的独特性^{[17，28，33]}.机器学习分类法是对具有相似音频特征的人群进行分类，以期望将自杀者和健康者区分开来.目前使用最多的机器学习分类方法是支持向量机（Support Vector Machines， SVM）^[18，34]，也有结合AdaBoostM1^[35]、K近邻（K-Nearest Neighbor， KNN）^[29]等算法对自杀者和非自杀者的音频特征进行二分类学习.除此之外，还有研究用高斯混合模型对自杀者的音频特征分布进行建模^[32，36].尽管深度学习模型已经在抑郁症检测^[37]、阿尔兹海默症检测^[^38]等任务上取得了不错的效果，但很少应用于基于音频的自杀倾向检测.

3 研究方法

研究方法主要包括四个步骤：（1）获取罪犯音频数据；（2）对音频数据进行数据处理；（3）音频特征提取，并选择关键特征；（4）训练分类模型，并在测试音频上进行有/无自杀倾向的人群分类实验.文章提出的方法整体流程如图1所示.

3.1 音频数据获取

研究数据来源于对监狱罪犯的访谈. 访谈室为监区内独立办公室，环境设置参考了其他访谈数据集的环境，同时结合了心理医生访谈环境和监狱心理咨询民警的意见.室内摆放一张圆桌和两张座椅，访谈员和罪犯呈桌角式落座，可以让双方有自由的目光接触，给罪犯带来轻松自在的心理感受.罪犯由民警带入访谈室，然后民警在访谈室外等待访谈结束后，进入访谈室将罪犯带离.为了能够让罪犯畅所欲言，访谈室内仅罪犯和访者两人，无第三者在场.访者在访谈开始时声明本次谈话仅作为学术之用，对罪犯在狱内的表现、加扣分、刑期等均无影响，尽可能让罪犯保持自然状态.在访谈过程中进行音视频的同步记录，禁止人员进出、室外交谈走动，以减少噪音干扰，保证数据质量.

3.2 音频数据处理

录制下来的音频为完整的访谈音频，包含访者和罪犯两人，因此需要对音频进行剪辑处理.音频剪辑流程如图2所示，基于python工具包实现.

剪辑完成后得到采样率为16 kHz，采样位宽为16 bit，单声道的wav文件.

3.3 音频特征提取

文章采用openSMILE提取音频特征，选用2016年ComParE_2016特征集，包含了MFCC、基频、响度等65个低水平特征，基于这些低水平特征计算得到高级统计量共6373维特征.该特征集的音频特征十分全面，但是过多的特征会降低模型的可解释性，因此采用特征选择从特征集合中选择出相关特征子集.

特征选择算法分为过滤式、包装式和嵌入式三种，其中嵌入式结合了过滤式和包装式的优点，将特征选择嵌入到模型构建的过程中，常用方法有Lasso和树模型.

3.4 分类模型训练

选用KNN、SVM、随机森林（Random Forest， RF）和逻辑回归（Logistic Regression， LR）等四种监督学习算法对人群进行分类模型训练.

（1）KNN：每个样本都可以用它最接近的k个邻居来预测它的类别；（2）SVM：在特征空间中找到一个使正负例间隔最大的超平面；（3）RF：由多个决策树组成，个别决策树选择的众数决定输出类别；（4）LR：通过logistic回归分析，得到自变量的权重，根据该权重来预测类别.

4 实验与分析

4.1 实验数据

2022年7月，项目组联合四川省监狱管理局和四川大学华西医院组织访谈员对某监狱内服刑人员进行访谈调查，本次访谈共41人，其中有12人曾实施过自伤自杀或具有不同程度的自伤自杀倾向，作为有自杀倾向的实验组，其余29人作为无自杀倾向的对照组.完整访谈数据时间长达12.43 h，平均每段访谈时长18.2 min，经过数据处理后，罪犯音频平均时长为9.7 min.本研究及其程序得到了华西医院生物医学伦理委员会的批准，所有的方法都按照相关的准则和规定进行，整个实验遵循《赫尔辛基宣言》.

4.2 评估指标

在评估指标的选取方面，文章使用了四种性能度量：精度（Precision， Pre）、召回率（Recall）、F1分数（F1）、ROC曲线下面积（Area Under Curve， AUC）.各指标的解释如下：

（1）Pre：正确预测为有自杀倾向样本的数量与所有预测为有自杀倾向样本的数量之比；（2）Recall：所有实际有自杀倾向样本中被预测正确的比例；（3）F1：精度和召回率的调和平均值；（4）AUC：用于比较多个模型的分类效果，值越大说明分类效果越好.

4.3 实验结果与分析

4.3.1 特征选择实验

采用随机森林对转换后的6373维特征进行特征选择，并按重要性进行排序，选定排名前40的特征，重要性排名前十的特征如表1所示.在选定的40个特征中，有39个特征是基于梅尔频谱和梅尔倒谱系数计算得到，还有一个特征为最终基频候选的发声概率，与前文所述语音信号衰减速度相关.

4.3.2 人群分类实验

为了说明特征选择实验的有效性，将原始特征集表示为D_A，筛选后的特征集表示为D_S.由于实验数据样本量较少，在实验过程中，使用十折交叉验证对数据集进行划分，并进行10次，最后计算各指标均值用于模型评估，得到的最佳平均性能如表2所示.

由表2可知，特征选择使整体分类效果都得到了大幅提升，其中RF取得了最好的分类效果，平均F1值达到了86.88%.由于自杀检测常与抑郁症检测进行对照，并且存在方法上的相似性，因此本文与目前基于音频的自杀检测方法和抑郁症检测方法进行了对比，结果如表3所示.其中深度学习方法为多模态融合方法，在本实验中仅采用了音频模型部分参与对比，实验结果说明了本文的方法在判别罪犯是否具有自伤自杀倾向具有更好的识别效果.

在验证了特征选择和模型有效性后，文章还探究了在不同时间段提取的罪犯音频对于模型分类效果的影响.罪犯音频平均时长为9.7 min，为了避免提取的音频子段存在太多重合，以min为时间单位，将提取的最大子段限定为5 min.音频的前段、中段、后段分别用B、M、E表示，用下标表示时间长度，如B₂表示音频开始的2 min，M₃表示音频中间的3 min，E₅表示音频最后的5 min.基于音频子段的人群分类实验选择分类效果最好的RF进行，实验设置和评估与前文一致，实验结果如表4所示.

4.3.3 实验分析

结合表2和表4的数据可知，总体趋势为音频时间越长，模型分类效果越好.值得关注的是，当音频时长小于3 min时，音频中段的分类效果最佳，当时长大于3min后，音频中段的分类效果下降，音频前段和后段的分类效果超过音频中段，逐渐接近完整音频的分类效果.此现象可能与音频整体时长、访谈问题的设置有关.音频整体平均时长为9.7 min，均分成三段，每段时长约3 min，此时音频无重叠.当超过3 min后，前段和后段音频与中段音频的重叠部分增加，分类效果均在提升，但中段音频随着重叠部分的增加，分类性能反而降低，这表现出了中段数据对于整体的有效性和局部的特异性.

为了探究中段数据的异常现象，研究人员对访谈音频进行了回顾分析.访谈数据整体为自由交谈，内容大致分为三部分：（1）罪犯描述自己的罪行；（2）罪犯描述在狱内的身心状况；（3）罪犯描述对未来的憧憬.自杀风险组罪犯的音频平均时长低于对照组，虽然具体音频时长有差异，但访谈内容分布与时间分割段基本对应，全长音频的特征相比于子段音频特征减少了因为访谈问题不同而引起的差异，其中梅尔频率倒谱系数（MFCC）、频谱（Spectrum）等系列特征差异显著（P<0.05）.结合表4的实验结果，当罪犯在自我描述狱内身心状况时，最能体现出与自伤自杀相关的音频特征，这对于后续访谈问题的设置具有重要的参考意义.

4.3.4 讨论

本文以音频数据为例探究了罪犯自杀危险性评估工作未来的应用场景，对于目前的监狱工作具有启发与指导作用，结合大数据技术进行监狱现代化管理是必然的发展趋势.与前人研究结果相似，本文也发现自杀风险组与对照组在共振峰特征、频谱特征、韵律特征上存在差异，但发现自杀风险罪犯在访谈时的讲话时间要低于对照组，这与之前的研究结果相反，需要后续扩大数据样本进一步验证.

针对本文数据量少、数据模态单一的问题，提出以下两点发展方向：（1）构建获取罪犯音频的规范化流程.通过访谈获取音频数据耗时长，且自然交谈的方式具有随机性，无法保证谈话内容的质量与时长.构建获取音频的规范化流程，包括让罪犯保持自然状态的环境、有针对性的问题、回答问题设置倒计时等，如人机问答、日常打卡的形式，从而获取高质量音频数据.（2）融合罪犯多模态数据进行危险性评估.罪犯多模态数据包括行为表现、文本、生理信号等，行为表现包括动作、姿态、语音、表情、睡眠等数据，文本包括狱侦、狱政等记录数据，生理信号包括心率、呼吸、血压、温度等.随着信息化技术的发展与专用设备的研发，未来对罪犯实时监测预警评估成为可能.

5 结论

文章提出了一种基于音频的罪犯自杀危险性评估方法，利用机器学习对罪犯进行分类，实验表明RF能够有效区分罪犯是否具有自杀倾向，相较于传统的问卷评估更加实时和便捷.我国罪犯的自杀成功率低得利于及时有效的管控措施，但这本质上属于事后干预，如何在事发前进行防控才是研究重点，本文为现代化监狱推进罪犯的分级分类提供了新的思路和方法.在未来的工作中，将尝试采用深度学习与机器学习融合分析的方法，纳入罪犯的视频、语言、生理等信息，探索多模态数据有效融合的算法，以取得更好的罪犯个体危险性评估效果.

参考文献：

[1]Slade K， Edelman R. Can theory predict the process of suicide on entry to prison？ Predicting dynamic risk factors for suicide ideation in a high-risk prison population [J]. Crisis， 2014， 35： 82.

[2]Humber N， Webb R， Piper M， et al. A national case-control study of risk factors among prisoners in England and Wales[J]. Soc Psych Psych Epid， 2013， 48： 1177.

[3]Favril L， Indig D， Gear C， et al. Mental disorders and risk of suicide attempt in prisoners[J]. Soc Psych Psych Epid， 2020， 55： 1145.

[4]Fazel S， Cartwright J， Norman-Nott A， et al. Suicide in prisoners： a systematic review of risk factors[J]. J Clin Psychiat， 2008， 69： 1721.

[5]吕成荣. 服刑罪犯自杀行为调查分析[J]. 中国健康心理学杂志， 2011， 19： 304.

[6]Organization W H. International association for suicide prevention： preventing suicide in jails and prisons [J]. Brit J Psychiat， 2007， 309： 364.

[7]Daigle M S， Daniel A E， Dear G E， et al. Preventing suicide in prisons， Part II： International comparisons of suicide prevention services in correctional facilities [J]. Crisis， 2007， 28： 122.

[8]Duthé G， Hazard A， Kensey A， et al. Suicide among male prisoners in France： a prospective population-based study [J]. Forensic Sci Int， 2013， 233： 273.

[9]Hawton K， Linsell L， Adeniji T， et al. Self-harm in prisons in England and Wales： an epidemiological study of prevalence， risk factors， clustering， and subsequent suicide [J]. Lancet， 2014， 383： 1147.

[10]Favril L，Yu R Q， Hawton K， et al. Risk factors for self-harm in prison： a systematic review and meta-analysis [J]. Lancet Psychiat， 2020， 7： 682.

[11]Zhong S L， Senior M， Yu R Q， et al. Risk factors for suicide in prisons： a systematic review and meta-analysis [J]. Lancet Public Health， 2021， 6： e164.

[12]Nock M K， Borges G， Bromet E J， et al. Cross-national prevalence and risk factors for suicidal ideation， plans and attempts [J]. Brit J Psychiat， 2008， 192： 98.

[13]Favril L， OConnor R C， Hawton K， et al. Factors associated with the transition from suicidal ideation to suicide attempt in prison[J]. Eur Psychiat， 2020， 63： e101

[14]Jackson N A， Jabbi M M. Integrating biobehavioral information to predict mood disorder suicide risk[J]. Brain Behavi Immuni-Heal， 2022， 24： 100495.

[15]Jabbi M， Weber W， Welge J， et al. Frontolimbic brain volume abnormalities in bipolar disorder with suicide attempts [J]. Psychiat Res， 2020， 294： 113516.

[16]Hall J A， Harrigan J A， Rosenthal R. Nonverbal behavior in clinician—patient interaction [J]. Appl Prev Psychol， 1995， 4： 21.

[17]Ozdas A， Shiavi R G， Silverman S E， et al. Investigation of vocal jitter and glottal flow spectrum as possible cues for depression and near-term suicidal risk [J]. IEEE T Bio-med Eng， 2004， 51： 1530.

[18]Scherer S， Pestian J， Morency L P. Investigating the speech characteristics of suicidal adolescents[C]//Proceedings of the International Conference on Acoustics， Speech and Signal Processing. Vancouver： IEEE， 2013.

[19]Akkaralaertsest T， Yingthawornsuk T. Comparative analysis of vocal characteristics in speakers with depression and high-risk suicide [J]. IJCTE， 2015， 7： 448.

[20]Torous J， Larsen M E， Depp C， et al. Smartphones， sensors， and machine learning to advance real-time prediction and interventions for suicide prevention： a review of current progress and next steps[J]. Curr Psychiat Rep， 2018， 20： 51.

[21]Naghavi A， Teismann T， Asgari Z， et al. Accurate diagnosis of suicide ideation/behavior using robust ensemble machine learning： a university student population in the Middle East and North Africa （MENA）Region [J]. Diagnostics， 2020， 10： 956.

[22]杨劲寅. 主题统觉测验用于自杀风险识别[D]. 上海：华东师范大学， 2022.

[23]Boudreaux E D， Rundensteiner E， Liu F F， et al. Applying machine learning approaches to suicide prediction using healthcare data： Overview and future directions[J]. Front Psychiatry， 2021， 12： 707916.

[24]Just M A， Pan L， Cherkassky V L， et al. Machine learning of neural representations of suicide and emotion concepts identifies suicidal youth[J]. Nat Hum Behav， 2017， 1： 911.

[25]Silverman M M. The language of suicidology [J]. Suicide Life-Threat， 2006， 36： 519.

[26]Drugman T， Bozkurt B， Dutoit T. A comparative study of glottal source estimation techniques [J]. Comput Speech Lang， 2012， 26： 20.

[27]Quatieri T F， Malyska N. Vocal-source biomarkers for depression：a link to psychomotor activity [C]//Proceedings of Thirteenth Annual Conference of the International Speech Communication Association. Portland： ISCA， 2012.

[28]France D J， Shiavi R G， Silverman S， et al. Acoustical properties of speech as indicators of depression and suicidal risk [J]. IEEE T Bio-med Eng， 2000， 47： 829.

[29]Stasak B， Epps J， Schatten H T， et al. Read speech voice quality and disfluency in individuals with recent suicidal ideation or suicide attempt [J]. Speech Commun， 2021， 132： 10.

[30]Keskinpala H K， Yingthawornsuk T， Wilkes D M，et al. Screening for high risk suicidal states using mel-cepstral coefficients and energy in frequency bands [C]//Proceedings of the 15th European Signal Processing Conference. Poznan： IEEE， 2007.

[31]Anunvrapong P， Yingthawornsuk T. Characterization of ΔMFCC in depressed speech sample as assessment of suicidal risk[C]//Proceedings of the 2014 International Conference on Advanced Computational Technologies & Creative Media. Pattaya： IIE， 2014.

[32]Ozdas A， Shiavi R G， Wilkes D M， et al. Analysis of vocal tract characteristics for near-term suicidal risk assessment[J]. Method Inform Med， 2004， 43： 36.

[33]NH NNW， Wilkes M D， Salomon R M. Timing patterns of speech as potential indicators of near-term suicidal risk [J]. Int J Multidiscip Curr Res， 2015， 3： 1104.

[34]Chakravarthula S N， Nasir M， Tseng S Y， et al. Automatic prediction of suicidal risk in military couples using multimodal interaction cues from couples conversations [C]//Proceedings of the IEEE International Conference on Acoustics， Speech and Signal Processing. Barcelona： IEEE， 2020.

[35]Venek V， Scherer S， Morency L P， et al. Adolescent suicidal risk assessment in clinician-patient interaction[J]. IEEE T Affect Comput， 2017， 8： 204.

[36]Yingthawornsuk T， Shiavi R G. Distinguishing depression and suicidal risk in men using GMM based frequency contents of affective vocal tract response[C]//Proceedings of the International Conference on Control， Automation and Systems. Seoul： IEEE， 2008.

[37]He L， Cao C. Automated depression analysis using convolutional neural networks from speech [J]. J Biomed Inform， 2018， 83： 103.

[38]Amini S， Hao B R， Zhang L F， et al. Automated detection of mild cognitive impairment and dementia from voice recordings： a natural language processing approach [J]. Alzheimers Dement， 2023， 19： 946.

[39]吴晓华. 基于机器学习的语音特征模型在单双相抑郁患者自杀风险识别中的应用[D]. 广州：南方医科大学， 2021.

[40]Alhanai T， Ghassemi M M， Glass J. Detecting depression with audio/text sequence modeling of interviews [C]//Proceedings of 19th Annual Conference of the International Speech Communication Association. Hyderabad： ISCA， 2018.

[41]Shen Y， Yang H， Lin L. Automatic depression detection： An emotional audio-textual corpus and a gru/bilstm-based model[C]//Proceedings of 2022 IEEE International Conference on Acoustics， Speech and Signal Processing. Singapore： IEEE， 2022.

引用本文格式：

中文：郑子强，何得淮，廖潇楠，等. 基于音频的罪犯自杀危险性评估[J]. 四川大学学报：自然科学版， 2023， 60： 063005.

英文： Zheng Z Q， He D H， Liao X N， et al. Audio based suicide risk assessment of criminals [J]. J Sichuan Univ： Nat Sci Ed， 2023， 60： 063005.