APP下载

机器学习在心理测量中的应用

2021-03-15王一溢占继尔陈泽龙田渊明

电脑知识与技术 2021年3期
关键词:机器学习人工智能

王一溢 占继尔 陈泽龙 田渊明

摘要:心理测量是利用标准化的测量工具对人的行为加以数量化的描述,来推测其个体心理过程和特征的技术。机器学习是让计算机在大量数据的基础上建立模型以获得自主识别与学习新知识能力的方法。现在心理学研究者们将机器学习与心理测量相结合,在医疗、心理咨询、用户分析等相关领域的运用进行了探索,且其独特的优势正受到越来越多的学者的关注。该文综述了当前机器学习在心理测量中应用现状,并探究了其相应的社会价值和未来趋势。

关键词:人工智能;机器学习;心理测量

中图分类号:TP3        文献标识码:A

文章编号:1009-3044(2021)03-0204-03

1 引言

心理测量是利用标准化的测量工具对人的行为加以数量化的描述,来推测个体心理过程和特征的技术[1]。心理学的传统研究方法主要有观察法、实验法和问卷法等,这些方法中的样本规模较小,无法满足日益增长的代表性需求。具体来讲,观察法虽然能较好地保持生态性和客观性,但是难以重复验证和精确分析。实验法具有可重复性,可得出因果关系,但人为性较高,易使被试出现迎合特征,出现社会赞许效应。在数据爆炸的时代,由于样本量激增,问卷的制作、筛选和后期分析的工作量不断增加。上述传统的方法在心理现象的历史文化及主观能动性等特征的研究中已然存在缺陷[2]。在传统推论统计方法下,心理学还面临着“可重复危机”的挑战,机器学习正成为更优良的验证方法[3]。机器学习是一门多学科交叉专业,涵盖概率论知识,统计学知识,近似理论知识和复杂算法知识,使用计算机作为工具致力于真实实时的模拟人类学习方式, 并将现有内容进行知识结构划分来有效提高学习效率的方法[4]。机器学习包括强化学习、监督学习和深度学习,该方法可基于被试的语音、表情、文本等数据,对被试的心理状态进行判断。

除了对验证方法的更新,研究者在心理测量工具上也进行了人工智能领域的探索。心理学者们不断尝试通过问卷、量表等工具对人的心理特征进行测量,这类对心理潜在特质的间接测量方法本质上即一种可采用支持向量机进行建模的軟测量[5]。然而在传统的心理测量工具的编制中,研究者往往采用因素分析法;在信效度检验方面,则多采用多元回归的方法。上述方法仍停留于统计学的范畴,要求数据必须是等距变量、呈线性相关,且总体须为正态[6]。然而在数据量呈几何级数增长的今天,传统的统计方法已难以适用,其结论信效度也会受到影响[7]。将人工智能领域中的粗糙集和神经网络与传统测量方法进行对比分析发现,粗糙集在离散化数据与决策表中约简能力更高,神经网络则可以解决变量的非线性问题。运用该方法对员工胜任力的实践研究进行处理,最终得到的正确分类率的均值为82.92%,显著高于未使用该两种处理的分类率均值[6]。因此在研究对象存在不确定性时,使用粗糙集的方法可以无须对数据集合外进行先验假设,让结论更客观。

2016年,AlphaGo战败李世石,其技术核心即采用策略网络和蒙特卡洛模拟缩小搜索广度和深度,结合在线搜索与深度学习,评估胜算和走法[8]。然而,AlphaGo是基于大规模的强化与深度学习产生的,如何在少样本的情况下进行精度学习是机器学习应用于心理测量的必要过程。解决方法有三:产生式计算模型——可以通过少数样本的学习获得抽象概念;逆向推理技术——以贝叶斯网络为代表推测最大概率导致目前结果的原因;深度学习——将抽象问题分解为多个层次加以学习,提高神经网络的计算效率。其目的是让人工智能在有限资源下高效运行,使得机器在图像、主题、语句的识别与分类中获得更加高效的发展[8]。心理测量的本质是结构化的理论和数据模型,而人工智能的基础是数据和算法。基于互联网的特点,将机器学习与之相联系不仅能提高诊断的时空效率,还能扩大诊断的范围,甚至降低诊断费用,弥补了传统方法的不足。

随着互联网的不断发展,数据海量扩充,信息碎片化严重。为了更准确地诊断患者健康状态、把握使用者的个性偏好、提高企业的服务质量、辅助政府预测舆论风向,基于机器学习的用户测量正逐渐成为医疗、市场、政务等领域关注的热点。

2 机器学习在心理测量领域中的应用

2.1 身体测量

机器学习在医疗领域上的应用提高了诊断准确率。传统的儿童心理障碍诊断主要以他人提供病史、精神心理创伤测量结果等为依据,面对不同的儿童需进行多次人工诊断,耗时、效率低下。然而利用人工神经网络开发的诊断系统则弥补了这一缺陷[9]。研究者利用关系数据库oracle设计用户的症状输入模块,将收集的临床资料建立资料库作为神经网络学习的模板,使得系统可基于动态响应来处理外部输入信息。对该系统进行测验,同一病例在双盲条件下,医生对患者进行临床诊断后,通过神经网络对输入病症进行判断,在共查对的195对病例中人机诊断均完全符合,并未发现错诊漏诊的情况。且该系统具有高度自学习性,自组织性,自适应性,具有很强的容错能力对未见过的输入数据组具有综合推理能力。大大节省了时间及人工成本。

2.2 行为测量

随着机器人在人类生活中重要性的增强,人们开始探究人类共情如何走向智能体共情[10]。人类的共情是个体基于与他人进行交互而不断发展的。通过计算建模的方法对人类语音、图像进行识别,可以提供人机和谐的基础,借助深度学习使机器在交互的过程进行自我学习,以发展和人类相似的共情系统即机器人识别对象的外部特征、分析筛选出与其相一致的情绪,通过对情绪类型与场景间的相关性计算给予适当的行为反馈。这样的智能体共情系统已被运用到以下两个方面:医护场景——当一个人表示痛苦时,机器人就会对该个体释放的信息进行识别分析并产生一系列接近与理解的行为;硬件调控系统——通过生物指标将情绪体验所产生的体温变化转化为机器的电量水平及硬件运转温度。当机器人产生共情时,其电量水平会下降,硬件的运转温度会升高,为使机体恢复到正常状态而反馈适当行为。通过共情反馈不仅给予患者情绪支持,还支持了医疗人员诊断。在南加州大学的simsensei心理健康研究中,研究者创建了一个交互式环境,用户在放松的交谈中机器将自动检测和分析其行为。虚拟人采用了多义感框架结构,对用户微笑强度、三维头部位置、面部表情等非语言行为信号进行分析处理,以回馈用户适当的行为。通过该环境还能够让用户在与虚拟人交流过程中表露更多信息,提高诊断准确率[11]。

除医疗领域外,机器学习还有效地促进了用户的个性化检索。用户偏好检索是在给定查询条件的基础上,通过分析用户行为特征挖掘用户偏好从而为用户提供个性化检索结果,避免检索结果超载的技术[12]。当前高校图书馆用户偏好检索方法主要以问卷调查、动态统计、查询限制、半监督机器学习等方法为主,这样以“关键词匹配”为主要运算方式的计算机检索无法准确实时提取用户偏好特征,检索耗时长、多样化检索能力低、用户满意度不高。为了改善这样的检索缺陷,重庆大学试用了基于机器学习的用户检索系统——使用在线监督学习读者用户偏好的技术框架,提取用户检索的文献特征,监督机器学习用户偏好检索模型,实时在线更新偏好检索引擎,最终生成与用户偏好变化保持一致的检索结果排序[12]。这项改进为读者提供了快捷准确的检索方式,有利于高校图书资源的充分利用,除图书检索行为,人类的很多行为特征亦可用机器学习的方法进行研究和预测,进而促进个性化服务的发展。

2.3 异常心理观测

机器学习在心理咨询领域的应用提高了把握用户情绪倾向的准确率,对预测其相应行为提供了帮助。人们常用心理测量描述人的潜在心理特征,但心理测量所得数据通常是不完整的,结合计算智能在数据挖掘、目标预测等方面的功能,从测量数据中可挖掘出有关规则,得出更多信息[13]。近年使用机器学习进行心理健康测量的研究越来越多,一般方法大致归纳为三个步骤:获取数据——借助网络平台收集用户行为特征,借助问卷收集对应用户的状态;清洗数据以提取相关特征;进行情感分析,建立机器模型。为了预测与干预抑郁症的发生发展,研究者摆脱单一滞后的传统心理问卷方法,借助机器学习分析用户数据预测抑郁患者。国外在facebook和twitter上都做了相关的研究,运用LIWC 对摘取的文本进行自然语言处理,基于facebook发帖的内容、时间频率、长度建模,通过用户的情绪表达、人际关系和自我认知来诊断抑郁,发现抑郁患者多使用第一人称[14];运用支持向量机从twitter用户活动中获得的特征预测用户的抑郁,准确率为69%[15]。通常自杀者会经历三个阶段――自杀意念、自杀尝试与自杀死亡。为区别无自杀意念者与自杀死亡者的特征差异,爬取两者的微博活动数据并进行差异分析[16]。得出自杀死亡组的社交活跃度与工作词汇的使用显著低于无自杀意念组,而自我关注度与消极词汇的使用则高于无自杀意念组。这一研究为鉴别估测抑郁患者提供了有效的借鉴方法。此外区别于Twitter等外国社交平台,研究者借助新浪微博探究出在汉语自然语言中抑郁患者更趋近于使用第二人称、死亡相关词汇的使用与自杀可能性无关等本土化特点[17]。

当前研究者们已利用深度学习、机器学习等数据分析方法,进行自杀风险预测、抑郁症识别、压力感知等方面的研究。在自杀风险预测方面,可以通过人工神经网络对微博文本进行自动分类,展开基于深度学习的微博用户自杀风险预测。将采集的数据进行筛选,分类出有自杀意愿和无自杀意愿两类数据,并使用卡方检验对其进行特征值提取。除人工神经网络技术外,采用Python深度学习库Theano进行感知器的自组织自学习建模。最后用随机数据进行模型检驗并统计分析,得出模型的准确率达94%[18]。在抑郁预测方面,通过语言问答、文本朗读、图片描述的任务对被试进行正性、中性、负性三类情绪状态的测量,基于实验数据建立的语音抑郁识别模型精度可以达到82.9%[19];而基于机器学习的预测模型除辅助筛查抑郁患者外,还可有效分析抑郁症的发生及预后影响因素、指导治疗决策[20]。除预测异常心理和自杀等极端行为外,机器学习还可以预测正常人群的压力感知,通过微博数据对用户的压力特征建模得出各压力类别的平均检测F-measure 达到70%,辅以网购行为数据最终实现80%的二分类检测准确度,提升了测量准确性[21]。综上,越来越多的学者从不同的行为特征对不同的人群进行抑郁的研究,大大助力了抑郁模型的本土化构建。

2.4 情绪测量

网络的快捷数次催生舆论风暴,及时把握舆论风向探究民情,有助于相关部门做出正确的决策以稳定民心。网络舆情系统主要用于识别热点话题,通过机器学习自动确定作者在文本中的情绪倾向。例如国外的Goonie互联网舆情监测系统和Autonomy网络舆情聚成系统,国内的TRS网络舆情监测系统、“军犬舆情监控系统”等。

大学生是最活跃的社会群体,由于三观还为完全确立,常常被称为“愤青”。因此高校进行校园网络舆情分析是及时把握意见领袖与安抚学生偏激情绪的关键。以校园网络论坛(BBS)为例,首先通过转发评论的网络行为权量用户网络威信及影响力,筛选出校园意见领袖。再爬取其论坛文本进行人工情绪特征词汇的标注、完成文本建模,最后通过机器学习的分类器探测文本情感倾向性。在以南大为例的实验当中,成功通过网络影响力的指标筛选出意见领袖前50名,并分析比较出文本中正面情绪与负面情绪的差异[22]。但由于机器学习中分类器对反讽词汇的误判造成了负面情绪分类准确性高于正面情绪,而正面情绪分类召回率更高的数据结果。

文本模型构建是舆情分析的首要任务,当前大部分方法是先人工标注特征词,再借助“and”,“but”等连接词辨析词与词之间关系。但这会破坏文档的内部结构,此外词汇库中还缺少了文章相关的专业词汇,造成无法准确识别的结果。有研究者提出基于Wasserstein GAN的文档表示模型WADM,直接对文档进行嵌入表示[23]。在与多种方法的比较实验中,对18786条文本进行分析得出精确度为58.25%,有较好的词序表示性。将它运用在食品安全的网络舆情分析上,对新闻、微博文本进行抓取,分析出5类话题,采用情感分析出4类情绪类别,得出情感话题分布图,总结出网民对于几类食品安全的关注程度及情绪特征。得出更多的人对添加剂超标食品安全问题表现出“悲哀”态度,相比其他话题有更多的人关心食品添加剂超标问题的结论。

在社会舆情分析中机器学习辅助管理者捕捉舆论动向,同时在企业用户分析中,可以快速识别用户关注的问题,分析出用户情感状态助力于企业决策。在对访问用户进行情绪分析辅助开展微博运营工作中,借助深度学习与自然语言处理技术相较于传统设立运营专员的模式,极大程度上提升了工作效率、降低了人工成本。以Twitter文本为例,通过情感分析出三类数据集——消极的、积极的和介于两者之间的。对数据集中的有意义形容词做特征向量并进行机器学习,后进行语义分析确定同义词以给予决策者极性情感反馈,数据证明该方法使准确率由88.2%提升至89.9%[24]。在分析电信用户微博研究中处理文本数据时采用word2vec模型将每个词映射成向量,通过词与词之间的距离来判断它们之间的语义相似度。区别于传统的RNN这类深度神经网络,LSTM可以长期保存输入,有效解决了存储远距离上下文时对当前时刻输出的影响。结合词向量词嵌入与 LSTM 深度学习模型的文本分类方法,对于电信官微用户情绪分析效果十分有效[25]。在有高质量训练样本标注的前提下,该方法可以很容易地延伸到其他 NLP 文本分类应用场景中,如客服投诉文本分类、客服服务质量评价等。例如在股市风向的预测研究中,通过对抓取的股评数据进行语义标注分析出用户正面和负面情感倾向,借助卷积神经网络分类器构建CNN-Word2Vec 训练模型在情感倾向分类方面比传统朴素贝叶斯分析准确率更高,达到83.09% [26]。

3 总结与展望

无论是在人机交互的医疗场景中,还是在心理咨询或用户分析中,机器通过深度学习能对非语言行为进行反馈,对文本信息进行分类,并进行自学习自组织的分析处理。在医疗辅助与市场用户回馈方面机器学习极大程度地提高了工作效率和准确性;在心理咨询和舆情分析方面更是把握了用户的情绪倾向对预测其相应行为提供了帮助。但是不可否认,机器学习在心理测量上的应用存在不足之处,在对本土化的语法等自然语言处理中仍有待提高。综上,由此类文章发表数量的上升趋势可见,人工智能在心理学方向的研究将持续成为社会探究热点。

参考文献:

[1] 陈国鹏.心理测量的原理和应用[J].诊断学理论与实践,2005,4(3):261-265,276.

[2] 陈晶.现代心理学研究方法整合之路——质性与量化之整合[J].科技资讯,2007,5(17):184-185.

[3] 吴凡,顾全,施壮华,等.跳出传统假设检验方法的陷阱——贝叶斯因子在心理学研究领域的应用[J].应用心理学,2018,24(3):195-202.

[4] 李昊朋.基于机器学习方法的智能机器人探究[J].通讯世界,2019(4):241-242.

[5] 余嘉元.心理软计算的理论和应用[J].心理科学,2016,39(4):770-776.

[6] 余嘉元.粗糙集和神经网络在心理测量中的应用[J].心理学报,2008,40(8):939-946.

[7] 胡传鹏,王非,过继成思,等.心理学研究中的可重复性问题:从危机到契机[J].心理科学进展,2016,24(9):1504-1518.

[8] 周吉帆,徐昊骙,唐宁,等.“强认知”的心理学研究:来自AlphaGo的启示[J].应用心理学,2016,22(1):3-11.

[9] 陈冰梅,李雪荣,苏林雁,等.利用人工神经网络开发儿童心理障碍标准化诊断系统[J].电脑与信息技术,1995,3(6):8-10.

[10] 颜志强,苏金龙,苏彦捷.从人类共情走向智能体共情[J].心理科学,2019,42(2):299-306.

[11] Morency L, Stratou G, DeVault D, et al. SimSensei Demonstration: A Perceptive Virtual Human Interviewer for Healthcare Applications: AAAI Publications[C].Twenty-Ninth AAAI Conference on Artificial Intelligence, 2015

[12] 沈敏,杨新涯,王楷.基于机器学习的高校图书馆用户偏好检索系统研究[J].图书情报工作,2015,59(11):143-148.

[13] 余嘉元,田金亭,朱强忠.计算智能在心理学中的应用[J].山东大学学报(工学版),2009,39(1):1-5.

[14] Eichstaedt J C, Smith R J, Merchant R M, et al. Facebook language predicts depression in medical records[J]. Proc Natl Acad Sci U S A, 2018(44):11203-11208.

[15] Coppersmith G, Dredze M, Harman C. Quantifying Mental Health Signals in Twitter: Proceedings of the Workshop on Computational Linguistics and Clinical Psychology: From Linguistic Signal to Clinical Reality[C], 2014.

[16] 管理, 郝碧波, 程绮瑾, 等. 不同自杀可能性微博用户行为和语言特征差异解释性研究[J].中国公共卫生, 2015(3):349-352.

[17] Cheng Q, Li T M, Kwok C L, et al. Assessing Suicide Risk and Emotional Distress in Chinese Social Media: A Text Mining and Machine Learning Study[J]. J Med Internet Res, 2017(7):e243.

[18] 田瑋,朱廷劭.基于深度学习的微博用户自杀风险预测[J].中国科学院大学学报,2018,35(1):131-136.

[19] 潘玮,汪静莹,刘天俐,等.基于语音的抑郁症识别[J].科学通报,2018,63(20):2081-2092.

[20] 董健宇,韦文棋,吴珂,等.机器学习在抑郁症领域的应用[J].心理科学进展,2020,28(2):266-274.

[21] 赵靓. 基于微博和网购行为的用户心理压力感知[D]. 清华大学, 2016.

[22] 罗晶. 校园舆情分析中的意见挖掘技术研究[D]. 东南大学, 2015.

[23] 李亚军. 基于深度学习的食品安全网络舆情分析[D]. 天津科技大学, 2018.

[24] Gautam G, Yadav D. Sentiment analysis of twitter data using machine learning approaches and semantic analysis: 2014 Seventh International Conference on Contemporary Computing (IC3), 2014[C]. IEEE.

[25] 蔡鑫, 娄京生. 基于LSTM深度学习模型的中国电信官方微博用户情绪分析[J]. 电信科学, 2017(12):136-141.

[26] 张翰垠. 股市舆情数据的挖掘与分析研究[D]. 兰州理工大学, 2019.

【通联编辑:代影】

猜你喜欢

机器学习人工智能
我校新增“人工智能”本科专业
人工智能与就业
前缀字母为特征在维吾尔语文本情感分类中的研究
基于支持向量机的金融数据分析研究