HKU-AHMU成套量表在不同年龄健康人群中的应用
2021-04-13胡盼盼周珊珊吴兴启田仰华朱春燕汪凯
胡盼盼 周珊珊 吴兴启 田仰华 朱春燕 汪凯
认知功能是人脑接受外界信息,经过加工处理,转换为内在心理活动,从而获取知识或应用知识的过程,包括记忆力、注意力和执行功能、视空间能力、语言功能等方面[1]。认知功能障碍指上述一项或多项认知域损害,并影响日常生活或社会能力。严重的认知功能障碍迄今无有效治疗方法,给家庭和社会带来沉重经济负担[2]。正常人群随年龄的增长亦存在认知功能减退现象[3],早期识别十分必要。认知功能的评估通常需要在实验操作下进行各种人为设计的测验,称为神经心理学测验或神经心理学评估[4]。多种神经精神疾病如阿尔茨海默病(AD)[5]、血 管 性 痴 呆(VaD)、帕 金 森 病 痴 呆(PDD)[6]、精神分裂症和抑郁症[7-8]等均依赖神经心理学测验进行临床诊断与疗效评估。神经心理学测验具有显著的文化异质性,因此各个国家均应建立符合其文化习惯和常用语言的测验量表和常模数据[9-10]。既往研究多针对单项量表,较少关注成套量表[9,11]。2002年,香港大学与安徽医科大学成套神经心理学测验量表(BHANM)建立,简称为HKU-AHMU成套量表,香港地区的常模数据业已发表并显现出良好的信度和效度[9]。本研究展示内地健康人群中HKU-AHMU成套量表评估的认知功能数据,期望该套量表能够解决临床医师和神经心理学测验工作者的困惑,得以广泛应用。
对象与方法
一、研究对象
本研究于2018年4月至2020年12月,采用横断面研究方法,按照年龄分层抽样,招募来自安徽省合肥市及周边乡镇社区的健康受试者496例。纳入与排除标准:(1)抽样社区常住人口,居住时间≥6个月。(2)年龄20~80岁。(3)无记忆障碍以及其他认知功能障碍主诉。(4)无神经精神疾病病史,如脑血管病、偏头痛、精神分裂症等。(5)无严重颅脑创伤、酗酒或药物滥用史。(6)无严重躯体疾病病史。(7)视力、听力、语言理解表达能力和配合度良好。(8)本研究经安徽医科大学第一附属医院道德伦理委员会审批(审批号:20180360),符合赫尔辛基宣言要求。(9)所有受试者均自愿参加本研究并签署知情同意书。
二、研究方法
1.社会人口学资料采集与分组 由经过统一培训、从事神经心理学评估≥2年的测评员采用统一的病例报告手册记录受试者性别、年龄、受教育程度等社会人口学资料;并根据年龄分组,每10岁为一组。
2.HKU-AHMU成套量表测验 由经验丰富或高年级神经心理学研究生接受统一培训并按照标准化中文说明,在安静、光线充足的房间内进行HKU-AHMU成套量表测验,受试者完成全套量表评估约90 min。HKU-AHMU成套量表由12项单项神经心理学测验组成,涵盖注意与执行功能(6项测验)、记忆功能(2项测验)、视空间能力(2项测验)、额叶流畅性(2项测验)共4个维度。(1)注意与执行功能:包括数字广度测验(DST)、气球叉掉测验(BT)、数字警觉测验(DVT)、符号数字转换测验(SDMT)、数字颜色连线测验(CTT)和Stroop色词测验(SCWT)共6项。①DST测验,评估注意集中能力和工作记忆[12-13]。包括正序和倒序,要求受试者正序或倒序复述一串数字,数字逐渐增多,记录正确复述个数。②BT测验,评估注意扫描、跟踪和偏侧性[14]。根据测试难度分为A和B两部分,记录受试者叉掉所有气球的反应时间,若3 min内完成任务则记录反应时间;若3 min内未叉掉所有气球则记录为180 s。③DVT测验,评估注意持续性和精神加工速度[15]。要求受试者尽快划掉所有的数字“6”,记录其完成任务的反应时间和错误个数。④SDMT测验,评估非语言的注意集中、持续性、跟踪和加工速度[16]。包括书写(SDMT-W)及口述(SDMT-O)两部分,记录受试者90 s内写出或读出的正确个数。⑤CTT测验,是一种跨文化背景的量表[17],评估信息处理、视觉搜索和运动加工速度[18]。根据测试难度分为A和B两部分,要求受试者按照顺序将数字连接起来,记录完成任务的反应时间和错误个数。⑥SCWT中文版,基于维多利亚版本进行修订[19]并征得原作者同意[9],用于评估认知灵活性、注意转移能力和执行功能[20],具有良好的信度且耗时短[11]。要求受试者快速说出点、词汇、色词(红色标注的“蓝”字)的颜色,记录其完成任务的反应时间和错误个数。(2)记忆功能:采用中文Rey听觉-词汇学习测验(C-RAVLT)和Ruff路线学习测验(RULIT)评估语言和非语言记忆功能。①C-RAVLT测验,是用于评估语言词汇学习和记忆功能的经典量表,系由瑞士心理学家Rey Andre研发并被修订广泛用于英语母语受试者[1]。测试内容由目标词和干扰词两部分组成,记录受试者即刻回忆(C-RAVLT-I)、延迟回忆(C-RAVLT-D)和再认(C-RAVLT-R)的正确复述词汇个数。②RULIT测验,由Ruff等[21]研发,评估空间学习记忆功能[22]。要求受试者通过不停探索寻找出一条设定好的路线,记录其探索步骤数及即刻回忆和延迟回忆的正确和错误步骤数。(3)视空间能力:包括Hooper视觉组织测验(HVOT)和线段方向判定测验(JLOT)。①HVOT测验,由Hooper等[23]于1952年设计并修订,用于评估图形感知和组织命名能力,具有较好的信度[24-25]。要求受试者通过想象将碎片拼成完整的物体,20 s内无反应可追问受试者答案,记录其正确个数。②JLOT测验,由Benton等[26]于1978年研发,用于评估视空间能力,并认为该量表可以区分脑损伤侧别[27]。向受试者展示一条线段以及一组方向不同的线段,嘱其辨认出与目标线段方向一致的线段,20 s内无反应可追问受试者答案,记录正确个数。(4)额叶流畅性:属高级认知功能的一种,包括词语流畅性测验(VFT)和图形流畅性测验(FFT)。①VFT测验,是评估额叶流畅性的经典量表。本研究采用中文修订版,评估者之间信度达0.95[9]。要求受试者1 min内自发说出尽可能多的蔬菜、水果和动物词汇,并记录符合要求的词汇个数。②FFT测验,由Jones-Gotman和Milner[28]于1977年作为VFT测验的补充而设计,常作为与VFT测验相对应的非语言流畅性评估量表,评估抽象设计能力,该能力被认为与右侧额叶功能密切相关[29]。本研究采用其原版修行版(包括指导语和评分方法),评估者之间信度达0.92[9]。根据测试难度分为五部分,嘱受试者1 min内将方格内5个点中2个或以上点以直线连接起来,按照不同要求组成不同图形,记录符合要求的图形个数。
表1 各年龄组受试者社会人口学资料的比较Table 1. Comparison of sociodemographic information of subjects in various age groups
表2 各年龄组受试者受教育程度的两两比较Table 2. Pairwise comparison of education of subjects in various age groups
3.统计分析方法 采用SPSS 23.0统计软件进行数据处理与分析。计数资料以相对数构成比(%)或率(%)表示,采用χ2检验。数据的正态性采用Kolmogorov-Smirnov检验进行验证,呈正态分布的计量资料以均数±标准差(±s)表示,采用单因素方差分析,两两比较行LSD-t检验;呈非正态分布的计量资料以中位数和四分位数间距[M(P25,P75)]表示,采用Kruskal-Wallis检验(H检验),两两比较行Mann-WhitneyU检验。以P≤0.05为差异具有统计学意义。
结 果
本研究共招募496例社区健康受试者,最终有439例完成HKU-AHMU成套量表测验。其中,男性209例,女性230例;年龄20~79岁,平均(43.13±19.45)岁;受教育程度0~20年,平均为(10.65±4.65)年。根据年龄(每10岁为一组)分为20~29岁(166例)、30~39岁(58例)、40~49岁(30例)、50~59岁(63例)、60~69岁(64例)、70~79岁(58例)共6组,各年龄组性别分布差异无统计学意义(P=0.479),受教育程度差异有统计学意义(P=0.000),进一步行两两比较,40岁以上各组受教育程度低于20~29岁组和30~39岁组(均P<0.05),70~79岁组受教育程度高于50~59岁组(P=0.029),而20~29岁组与30~39岁组、其余40岁以上各组之间差异无统计学意义(均P>0.05;表1,2)。
注意与执行功能方面,各年龄组患者DST正序(P=0.000)和倒序(P=0.000)正确个数,BT-A(P=0.000)和BT-B(P=0.000)反应时间,DVT反应时间(P=0.000)和错误个数(P=0.000),SDMT书写(P=0.000)和口述(P=0.000)正确个数,CTT-A反应时间(P=0.000),CTT-B反应时间(P=0.000)和错误个数(P=0.001),SCWT点反应时间(P=0.000)、词汇反应时间(P=0.000)和词汇错误个数(P=0.000)、色词反应时间(P=0.000)和色词错误个数(P=0.000)差异均具有统计学意义(表3)。进一步行两两比较,40岁以上各组DST正序和倒序正确个数均少于20~29岁组和30~39岁组(均P<0.05),60岁以上各组DST正序正确个数均少于40~49岁组(均P<0.05),70~79岁组DST倒序正确个数少于40~49岁组(P<0.05),其余各年龄组DST正序和倒序正确个数差异无统计学意义(均P>0.05,表4)。40岁以上各组BT-A反应时间均长于20~29岁组和30~39岁组(均P<0.05),60~69岁组和70~79岁组均长于40~49岁组和50~59岁组(均P<0.05),70~79岁组长于60~69岁组(P<0.05);50岁以上各组BT-B反应时间均长于20~29岁组和30~39岁组(均P<0.05),60~69岁组均长于40~49岁组和50~59岁组(均P<0.05),70~79岁组长于60~69岁组(P<0.05),其余各年龄组BT-A和BT-B反应时间差异无统计学意义(均P>0.05,表4)。随着年龄的增长,DVT反应时间逐渐延长(均P<0.05),但20~29岁组和30~39岁组比较差异无统计学意义(P=0.817);40岁以上各组的DVT错误个数均多于20~29岁组和30~39岁组(均P<0.05),70~79岁组亦多于40~49岁组、50~59岁组和60~69岁组(均P<0.05),其余各年龄组DVT错误个数差异无统计学意义(均P>0.05,表4)。随着年龄增长,SDMT书写和口述正确个数逐渐减少(均P<0.05),但20~29岁组与30~39岁组、50~59岁组与60~69岁组、60~69岁组与70~79岁组差异无统计学意义(均P>0.05,表4)。随着年龄的增长,CTT-A反应时间逐渐延长(均P<0.05),但20~29岁组与30~39岁组差异无统计学意义(P=0.184);40岁以上各组CTT-B反应时间均长于20~29岁组和30~39岁组(均P<0.05)、60~69岁组和70~79岁组亦长于40~49岁组和50~59岁组(均P<0.05);50~59岁组和60~69岁组CTT-B错误个数均多于20~29岁组(均P<0.05)、40岁以上各组亦多于30~39岁组(均P<0.05),其余各年龄组CTT-B反应时间和错误个数差异无统计学意义(均P>0.05,表4)。50岁以上各组SCWT点反应时间均长于20~29岁组、30~39岁组和40~49岁组(均P<0.05),70~79岁组长于50~59岁组和60~69岁组(均P<0.05),其余各年龄组SCWT点反应时间组间差异无统计学意义(均P>0.05);随着年龄的增长,SCWT词汇反应时间逐渐延长(均P<0.05),但30~39岁组与40~49岁组、40~49岁组与50~59岁组、50~59岁组与60~69岁组差异无统计学意义(均P>0.05);仅70~79岁组SCWT词汇错误个数多于20~29岁组(P=0.05);随着年龄的增长,SCWT色词反应时间逐渐延长(均P<0.05),但30~39岁组与40~49岁组、40~49岁组与50~59岁组、60~69岁组与70~79岁组差异无统计学意义(均P>0.05);仅40~49岁组、50~59岁组和70~79岁组SCWT色词错误个数多于20~29岁组(均P<0.05,表4)。
表3 各年龄组受试者注意与执行功能的比较[M(P25,P75)]Table 3. Comparison of attention and executive functions in subjects of various age groups[M(P25,P75)]
表4 各年龄组受试者注意与执行功能的两两比较*Table 4. Pairwise comparison of attention and executive functions in subjects of each age group*
记忆功能方面,各年龄组C-RAVLT即刻回忆(P=0.000)、延迟回忆(P=0.000)和再认(P=0.000)正确个数,以及RULIT即刻回忆正确(P=0.000)和错误(P=0.000)个数、延迟回忆正确(P=0.000)和错误(P=0.000)个数差异均有统计学意义(表5)。进一步两两比较发现,40岁以上各组C-RAVLT即刻回忆和延迟回忆均低于20~29岁组和30~39岁组(均P<0.05),70~79岁组C-RAVLT即刻回忆均低于40~49岁组、50~59岁组和60~69岁组(均P<0.05)、60~69岁组低于40~49岁组(P<0.05),60岁以上各组C-RAVLT延迟回忆亦低于40~49岁组和50~59岁组(均P<0.05);50岁以上各组C-RAVLT再认均低于20~29岁组、30~39岁组和40~49岁组(均P<0.05),70~79岁组低于50~59岁组和60~69岁组(均P<0.05);余各年龄组C-RAVLT即刻回忆、延迟回忆和再认差异无统计学意义(均P>0.05,表6)。40岁以上各组RULIT即刻回忆和延迟回忆正确个数均少于20~29岁组和30~39岁组(均P<0.05),70~79岁组均少于40~49岁组、50~59岁组和60~69岁组(均P<0.05),50~59岁组RULIT即刻回忆正确个数少于40~49岁组(P=0.018);50岁以上各组RULIT即刻回忆和延迟回忆错误个数均多于20~29岁组和30~39岁组(均P<0.05),40~49岁组多于30~39岁组(均P<0.05),70~79岁组均多于40~49岁组、50~59岁组和60~69岁组(均P<0.05),60~69岁组多于40~49岁组(均P<0.05),40~49岁组的RULIT延迟回忆错误个数亦多于20~29岁组(P=0.003)、50~59岁组亦多于40~49岁组(P=0.024);其余各年龄组RULIT即刻回忆正确和错误个数、延迟回忆正确和错误个数差异均无统计学意义(均P>0.05,表6)。
表5 各年龄组受试者记忆功能的比较Table 5. Comparison of memory function in subjects of various age groups
表6 各年龄组受试者记忆功能的两两比较*Table 6. Pairwise comparison of memory function in subjects of each age group*
视空间能力方面,各年龄组HVOT(P=0.000)和JLOT(P=0.000)正确个数差异均有统计学意义(表7)。进一步行两两比较,40岁以上各组HVOT正确个数低于20~29岁组和30~39岁组(P=0.019);50岁以上各组的JLOT正确个数亦低于20~29岁组和30~39岁组(均P<0.05)、而30~39岁组高于20~29岁组和40~49岁组(均P<0.05)、70~79岁组低于50~59岁组(均P<0.05),70~79岁组JLOT正确个数低于40~49岁组和50~59岁组(P<0.05),其余各年龄组HVOT和JLOT正确个数差异无统计学意义(均P>0.05,表8)。
表7 各年龄组受试者视空间能力的比较(个)Table 7. Comparison of visuospatial ability in subjects of various age groups(number)
表8 各年龄组受试者视空间能力的两两比较*Table 8. Pairwise comparison of visuospatial ability in subjects of each age group*
表9 各年龄组受试者额叶流畅性的比较Table 9. Comparison of frontal fluency in subjects of various age groups
表10 各年龄组受试者额叶流畅性的两两比较*Table 10. Pairwise comparison of frontal fluency in subjects of each age group*
额叶流畅性方面,各年龄组患者VFT蔬菜水果词汇(P=0.000)和动物词汇(P=0.000)以及FFT评分(P=0.000)差异均具有统计学意义(表9)。进一步两两比较,60~69岁组和70~79岁组VFT蔬菜水果词汇少于20~29岁组和30~39岁组(均P<0.05),70~79岁组少于40~49岁组和50~59岁组(均P<0.05);40岁以上各组VFT动物词汇和FFT评分均低于20~29岁组和30~39岁组(P<0.05),60~69岁和70~79岁组FFT评分亦低于40~49岁组和50~59岁组(均P<0.05);其余各年龄组VFT蔬菜水果词汇、动物词汇和FFT评分差异无统计学意义(均P>0.05,表10)。
讨 论
本研究采用横断面研究方法在健康人群中按照年龄分层抽样,以探讨年龄相关认知功能变化并建立健康人群参考值,其研究结果与香港地区常模数据基本一致[9],表明HKU-AHMU成套量表包含的神经心理学测验同样适用于内地人群,且随着年龄的增长,认知功能均呈现年龄相关性下降。
注意功能主要包括注意集中、维持和转换。HKU-AHMU成套量表采用DST、BT、DVT和SDMT测验评估受试者注意功能,结果显示,各年龄组患者DST正序和倒序正确个数、BT-A和BT-B反应时间、DVT反应时间和错误个数、SDMT书写和口述正确个数差异均有统计学意义,且随着年龄的增长,DST正序和倒序正确个数减少,BT-A和BT-B反应时间延长,DVT反应时间延长、错误个数增加,SDMT书写和口述正确个数减少,尤以40岁以上人群显著、70岁以上人群更显著,与既往研究结果相一致[9],表明DST、BT、DVT和SDMT测验可以较好适应中国国情,体现出注意功能与年龄的关系。
执行功能评估是神经心理学测验的重要组成部分。一些神经精神疾病早期即出现执行功能障碍,尤其是反应抑制过程,如轻度认知损害(MCI)和阿尔茨海默病[30-31]。HKU-AHMU成套量表所采用的CTT和SCWT测验是最为常用的执行功能评估量表[32]。CTT测验与认知功能障碍严重程度密切相关。SCWT测验有多种译本,可以敏感地识别出额叶损伤,特别是轻度认知损害和痴呆的执行功能障碍[33],本研究采用的SCWT测验是一种较原始版本更简洁、更实用的修订版[19,34]。研究显示,执行功能可能与文化背景密切相关[34-36],符合当地文化背景的测验和常模更能准确识别出执行功能障碍[37]。因此,本研究HKU-AHMU成套量表采用CTT和SCWT测验评估执行功能,以建立适合中国国情的常模。结果显示,各年龄组患者CTT-A反应时间,CTT-B反应时间和错误个数,SCWT点反应时间、词汇反应时间和词汇错误个数、色词反应时间和色词错误个数差异均有统计学意义,且随着年龄的增长,CTT-A、CTT-B和SCWT点、词汇、色词反应时间均延长,CTT-B、SCWT词汇和色词错误个数均增加,尤以40岁以上人群显著(除外CTT-A错误个数和SCWT点错误个数),与既往研究结果相一致[38]。
记忆是编码、储存和提取信息的过程。记忆功能易受年龄和文化背景的影响[39]。研究显示,语言记忆与视空间学习记忆具有不同的作用机制[40-41],并且与不同脑区相关[22]。因此,本研究采用修订的C-RAVLT和RULIT测验全面评估语言和非语言记忆功能,并在HKU-AHMU成套量表中再次修订,评价指标分为即刻回忆、延迟回忆和再认,从而可以很好地反应出记忆加工过程。C-RAVLT测验是优质的语言记忆功能评估工具,RULIT测验可用于评估视空间学习记忆功能。本研究结果显示,各年龄组患者C-RAVLT即刻回忆、延迟回忆和再认以及RULIT即刻回忆正确和错误个数、延迟回忆正确和错误个数差异均有统计学意义,且随着年龄的增长,C-RAVLT即刻回忆、延迟回忆和再认降低,RULIT即刻回忆和延迟回忆正确个数减少、错误个数增加,尤以40岁以上人群显著,表明C-RAVLT量表可以较好地反映出语言记忆与年龄的关系,RULIT量表可以较好地反映出视空间学习记忆与年龄的关系,且本研究HKU-AHMU成套量表是首次采用RULIT测验评估非语言视空间学习记忆功能。
HVOT和JLOT测验主要通过线段和图形碎片评估视空间能力,其正确个数越多,代表视空间能力越好。既往研究证实二者均具有较好的信度和效度[23,26-27],但二者侧重点不同,前者主要用于评估图形感知和组织命名能力,后者侧重于视空间感知能力,因此,HVOT测验与JLOT测验相结合可以更好地评估视空间能力[24-25,27]。在本研究中,各年龄组患者HVOT和JLOT正确个数差异均有统计学意义,且随着年龄的增长,HVOT和JLOT正确个数逐渐减少,尤以40岁以上人群显著。
目前,VFT测验广泛用于认知功能障碍的诊断与鉴别诊断[42],包括依赖词语流畅性和语义流畅性的词汇举例以及依赖执行功能的语音流畅性测验,后者在汉语中并无确切的对应,目前所用测验量表并不一致,包括发字头/水字头等词语流畅性测验,因此,本研究HKU-AHMU成套量表中VFT测验仅采用蔬菜水果和动物词汇举例。FFT测验与右侧额叶功能密切相关[43]。FFT和VFT测验分别反应左侧和右侧额叶功能,因此推测,二者相结合可以准确评估额叶流畅性。本研究结果显示,各年龄组患者VFT蔬菜水果和动物词汇及FFT评分差异均有统计学意义,且随着年龄的增长,VFT蔬菜水果和动物词汇减少、FFT评分降低,尤以40岁以上人群显著。
本研究所用HKU-AHMU成套量表同时涵盖注意与执行功能、记忆功能、视空间能力、额叶流畅性共4个认知域,较为系统地对个体认知功能进行量化,且可以较好地反映出认知功能随年龄变化的趋势,与既往研究结果相一致[9]。此外,受教育程度亦是认知功能的影响因素,Pontón等[44]认为,学校教育主要影响纸笔实践能力,学校教育较低者可能缺少接受教育所需的认知和感知加工能力。然而,受教育程度影响神经心理学的机制尚待进一步研究,既往研究显示,基于受教育程度的神经心理学测验结果解读至关重要[44]。本研究中40岁以上人群受教育程度显著低于其他年龄段,可能是由于特定的历史背景而缺少正规的学校教育。未来应进一步扩大样本量,并根据受教育程度分层,以制定适合我国国情和社会背景的认知功能评估常模。
本研究报告中国内地成年人认知常模数据,为更好地应用该套量表提供依据。本研究亦存在不足之处,HKU-AHMU成套量表虽全面覆盖各年龄段人群,但青年人占比较高,中老年人比例偏低;该成套量表还缺少对语言功能的评估;该成套量表虽可全面评估认知功能,但用时较长;本研究仅报告不同年龄段人群的认知常模数据,尚待进一步针对性别、受教育程度等潜在影响认知功能因素的分析。
志谢感谢Tatia MC Lee在HKU-AHMU成套量表选择中的帮助,以及王琥、杜静、荆胜春、凤兆涌、程怀东、席春华、谢成娟、汪永光、陈新贵、魏强等在量表数据采集中的贡献
利益冲突无