认知功能评估量表研发与应用进展

2021-04-12李宗姗魏丽丽桂雅星陈炜

中国现代神经疾病杂志 2021年11期

李宗姗魏丽丽桂雅星陈炜

随着人类寿命的延长和人口老龄化的日益加剧，我国认知功能障碍的患病率逐年上升，给家庭及社会带来沉重经济和心理负担［1］。国际疾病分类法-11（ICD-11）将认知功能障碍分为轻度认知损害（MCI）、痴呆、谵妄和遗忘。临床上认知功能障碍主要包括轻度认知损害和痴呆［2］。轻度认知损害是正常衰老向痴呆的过渡阶段，轻度认知损害患者是痴呆的高危人群［3］。据统计，65岁及以上老年人群中轻度认知损害发病率可达10%~20%，且＞50%患者5年内进展为阿尔茨海默病［4］。尽管目前对痴呆尚无有效治疗方法，早期识别认知功能障碍，积极进行综合干预，对延缓痴呆进展、预测未来护理需求具有重要意义［5］。

认知功能评估是发现认知功能障碍的第一步，通常以神经心理学测验作为评估工具。神经心理学测验是痴呆早期诊断、病情严重程度判断、疗效评价的量化工具，可以定量分析神经功能现状及演变、指导康复训练和护理。理想的认知功能评估工具应同时具备简明、耗时短、易执行、对突出的认知损害领域有针对性以及不受年龄、受教育程度、文化背景、语言等混杂因素影响的特点［6］。目前临床应用的大多数认知功能评估工具为国外设计并验证，因受教育程度和文化背景的差异，其在国内的适用性受到一定限制，例如，画钟测验（CDT）需视空间结构、抽象思维、设计等多种高级认知域的参与，不适用于受教育程度过低的人群，国内应用该量表可因教育偏倚而高估痴呆患病率［7］；此外，国外量表的中文版和修订版并未考虑到我国老年人的文化背景多样性和低识字率。因此，迫切需要研发针对中国文化背景且符合国情的共识性认知功能评估量表。本文参考国内外发表的相关临床研究和系统综述，以循证医学为依据，对目前临床常用的认知功能评估量表进行对比分析，并介绍我国认知功能障碍筛查量表的研发进展。

一、国内外常用认知功能评估量表的比较

由于目前国内研发的认知功能障碍筛查量表在国外的应用较少，因此笔者仅综述下述量表的国内应用情况。表1［8-20］分别从测试时间、评估内容、优缺点、适用人群方面等对认知功能评估量表进行展示，以为测试者选择合适的量表提供参考。

表1 国内外认知功能障碍筛查量表比较Table 1. Comparison of domestic and foreign screening scales for cognitive impairment

1.简易智能状态检查量表简易智能状态检查量表（MMSE）是国内外应用最广泛的认知功能评估量表，也是研究最多的痴呆筛查量表之一［8］。操作简便、易推广、识别痴呆的敏感性和特异性均较高。对于已确诊的痴呆患者，MMSE量表可按其严重程度进行分级［9，21］，便于指导治疗和判断预后，但易发生“天花板效应”，即评分过高，无法很好地反映高受教育程度人群的认知功能，其筛查结果易受年龄和受教育程度的影响；其次，该量表的认知范畴不全面，缺乏对执行功能的评估，存在记忆名词数量少、学习次数多、延迟回忆时间短等认知域检测项目简单的缺陷［22-23］。一项国外Meta分析显示，MMSE量表对轻度认知损害的筛查不敏感，其鉴别认知功能正常与轻度认知损害的灵敏度和特异度仅为71%和74%［24］，可能与该量表更多针对计算力和语言功能，而对额叶执行功能和右侧大脑半球功能障碍不敏感有关。

2.蒙特利尔认知评价量表蒙特利尔认知评价量表（MoCA）增加视空间处理、高级语言运用和执行功能方面的评估，弥补MMSE量表的缺陷［25］。新增的评估项目符合认知功能障碍的早期表现，使得MoCA量表较MMSE量表更早筛查出轻度认知损害患者［26-27］。但MoCA量表的项目相对较难，如画立方体测验和交替连线测验与受教育程度密切相关；命名、延迟回忆的名词与我国老年人文化背景有较大差距，易导致“地板效应”，即评分过低，无法很好地反映低受教育程度人群的认知功能。基于此，研究者们对MoCA量表进行改良，即蒙特利尔认知评价基础量表（MoCA-B），用于文盲和低教育程度人群认知功能的评估［28］。然而目前国内关于MoCA-B的应用研究很少，是否较MoCA量表更适用于平均受教育程度较低的中国老年轻度认知损害患者的筛查值得进一步探究。

3.全科医生认知功能评估量表全科医生认知功能评估量表（GPCOG）系澳大利亚学者Henry Brodaty于2002年编制的适用于初级医疗机构的认知功能评估量表［29］。该量表的主要优势在于，操作简便且包含受试者检测和知情者调查两部分内容，排除知情者偏倚［30］，信度更高。2010年GPCOG量表引入中国，多项研究显示，GPCOG量表中文版筛查阿尔茨海默病的敏感性高于MMSE量表，且具有良好的信度和效度，且该量表还可筛查出早期轻度认知损害患者［10，31-32］。其局限性在于初级医疗机构就诊患者有时无知情者陪同，但该局限性可以通过电话联系知情者解决。

4.8条目痴呆筛查问卷与GPCOG量表相似，8条目痴呆筛查问卷（AD8）亦包含知情者调查，并弥补其他量表测试时间长、受教育程度要求高以及对认知功能障碍不敏感等不足［33-34］。研究者可以根据不同受试者选择相应的评估方法，如受教育程度较低者，采用结构式访谈；精神状态不适宜完成测试者，选择其知情者进行评估；然而对于受教育程度较高的受试者，该量表存在假阴性风险［22］。

5.简易认知量表画钟测验作为认知功能单项测试，筛查认知功能障碍敏感性、预测稳定性较差。2000年，Borson等［35］将画钟测验和针对3个名词的延迟记忆测验组合成简易认知量表（Mini-Cog），用于痴呆与非痴呆的区分。研究显示，与画钟测验、MMSE量表和AD8量表相比，Mini-Cog量表筛查痴呆的灵敏度（89.49%）和特异度（84.06%）更高（P＜0.05）［36］。此外，该量表在非英语语言人群中较MMSE量表更易实施，低受教育程度引起的教育偏倚更小。

6.记忆损害筛查量表记忆损害筛查量表（MIS）是一项简短的、针对4个名词的延迟记忆-回忆测验，包括自主回忆和线索回忆两部分内容，总评分为8，评分＜5提示认知功能障碍［37］。国外研究显示，将该量表的截断值设定为5时，其诊断痴呆的灵敏度为82%、特异度为81%［11］。GPCOG、Mini-Cog和MIS量表因测试时间仅2~5分钟，无需专业医师评估，且不易受受教育程度、文化背景和语言因素的影响，尤其适用于门诊及社区等大规模人群认知功能障碍的初筛［38］。

7.其他其他认知功能评估量表如认知能力筛查量表2.0（CASI2.0）和长谷川痴呆量表修订版（HDS-R），由于内容设置简单易行，贴近包括中国在内的东方国家文化背景，其作为痴呆筛查工具业已在我国获得认可。但目前尚缺乏公认的截断值［39］，且临床应用不如上述6项量表普及。

二、国内认知功能障碍筛查量表的研发进展

1.老年人快速认知筛查量表老年人快速认知筛查量表（QCSS-E）系吴越等［12］于2013年编制的适用于社区基层的认知功能评估量表。该量表的测试时间为8~10分钟，共包含47项条目，即即刻记忆（5项）、实物命名（5项）、视空间能力（3项）、言语流畅性（2项）、数字广度（2项）、抽象能力（5项）、听觉模仿（2项）、视觉模仿（2项）、动作指令（1项）、延迟记忆（5项）、简单计算力（4项）、时间和空间定向力（11项），每项条目按等级评分，先计算各维度评分、再得出总评分，总评分为83，评分越低、认知功能障碍程度越严重。QCSS-E量表是一项内容丰富、简便易行、可靠高效的痴呆筛查量表，对测试环境要求较低，尤其适用于初级医疗机构。国内已有研究显示，QCSS-E量表具有较好的信度和效度，可以较好区分神经功能改变或认知功能障碍程度。总评分反映总体认知功能障碍严重程度，各维度评分反映不同认知域损害。其中，视空间能力、言语流畅、抽象能力和延迟记忆对认知功能障碍的筛查较为敏感，提示QCSS-E量表对轻度认知损害同样具有较高的筛查能力。QCSS-E量表识别轻度认知损害和轻度痴呆的受试者工作特征（ROC）曲线下面积（AUC）分别为83.5%和98.0%，灵敏度和特异度均＞85%，均优于MMSE量表［2，13］。QCSS-E量表根据社区老年人受教育程度设定截断值：针对小学文化受试者，筛查轻度认知损害、轻度痴呆的截断值分别为72、67时，其联合灵敏度和特异度分别为88.10%、90%；针对初中及以上文化受试者，截断值分别为73、68时，其联合灵敏度和特异度分别为90.48%、90.48%［40］；但针对大学及以上文化受试者，该量表部分内容相对简单，易产生假阴性结果。

2.简易老年人认知筛查问卷老年痴呆和轻度认知损害患者早期均以记忆力减退为主要表现，但部分患者可能存在情绪和人格改变，生活或工作能力下降。吴越等［14］研发的简易老年人认知筛查问卷（BECSI）涵盖上述常见症状，评估4个认知域功能，包括13项条目，即记忆力（7项）、时间和空间定向力（2项）、做事效能（2项）、精神病理（2项），每项条目按等级评分，总评分为39，评分越高、认知功能障碍越严重。该问卷为自评问卷，主要评估受试者的主观认知功能。在其验证研究中，总评分的重测相关系数和Cronbach'α系数分别为0.998和0.908，分半信度为0.918，展示出良好的稳定性和内部一致性。ROC曲线显示，截断值为12.5区分正常衰老与轻度认知损害的灵敏度和特异度分别为100%和98.7%；截断值为19.5区分轻度认知损害与痴呆的灵敏度和特异度为95.2%和90.7%［41］。由此可见，BECSI问卷具有良好的鉴别效度，对不同程度认知功能障碍具有较好的区分能力。与MoCA量表相似，BECSI问卷是较可靠、有效的简易认知功能障碍筛查工具。

3.记忆与执行筛查量表由郭起浩教授团队编制的记忆与执行筛查量表（MES）具有简单有效、敏感性和特异性较高、测试时间短等优点［15］。MES量表包括记忆功能（MES-M）和执行功能（MES-E）两部分，MES-M部分主要对包含10个名词的句子分别进行5次回忆，前3次为学习后即刻回忆，第4次为间隔1分钟的短延迟回忆，第5次为间隔约5分钟的长延迟回忆；MES-E部分主要包括流畅性（如列举厨房内摆设）、双手连续性动作、指令与动作相互矛盾的定势转移、手指敲-不敲的优势抑制；两部分评分之和为总评分（MEST），总评分为100，评分越高、认知功能越好；MES-M评分/MES-E评分比值即为MES-R。MES量表的测试时间为7分钟，与定向力、注意力、语言功能、视空间能力相比，轻度认知损害的记忆力和执行功能障碍更明显。该量表可以避免因时间延迟回忆而产生的“地板效应”，较准确地评估记忆障碍程度，且无需阅读和书写，在一定程度上可以减少教育和文化偏倚。一项针对国内外轻度认知损害筛查量表的对比研究显示，MES量表因灵敏度和特异度均＞80%，成为轻度认知损害的首选筛查工具［42］。MES-R可以较好区分血管性痴呆（VaD）与阿尔茨海默病，灵敏度为76.7%、特异度83.3%［43］，为痴呆的鉴别诊断提供新的思路。

4.轻度认知损害筛查量表目前，轻度认知损害的筛查多依赖于专业神经心理学医师，无法满足大规模人群筛查的需要。国外已有越来越多基于计算机的轻度认知损害的筛查量表，信度和效度较好，操作简便，便于结果统计和管理。因此，研发中国基于计算机的轻度认知损害的筛查量表是未来发展的必然趋势。轻度认知损害筛查量表（sMCI）是浙江大学医学院附属邵逸夫医院陈炜教授于2010年研发的专门针对轻度认知损害的筛查量表。作为国内首个拥有自主知识产权的认知功能评估工具（发明专利号：20101050840.2），sMCI量表是一种计算机辅助筛查老年人轻度认知损害的装置量表［16］，该量表在内容上参考目前国际公认的MMSE和MoCA量表，并在此基础上根据轻度认知损害特点和中国老年人文化背景进行调整和优化。与MMSE量表相比，sMCI量表减少语言功能、定向力等方面的分值，增加执行功能、复杂视空间能力、注意力和情景记忆等项目，较全面且准确地评估认知功能；与MoCA量表相比，sMCI量表的名词、命名更加符合中国文化习俗和背景，更适用于受教育程度较低的老年人。sMCI量表的编制与测试经历2个阶段：2010年在浙江省杭州市某社区对1554例55~80岁老年人（包括认知功能正常人群和轻度认知损害患者）行MMSE和sMCI测试，得出sMCI量表的重测信度为0.933；Cronbach'α系数为0.768，优于MMSE量表（Cronbach'α系数为0.739，未发表）。为再次验证sMCI量表的有效性，陈炜教授团队于2016年从浙江省5所城市中随机选择1911例55~80岁老年人（包括认知功能正常人群和轻度认知损害患者），再次评定sMCI量表的信度和效度，并根据年龄、受教育程度设定截断值，结果显示，与既往研究相比，重测信度（0.952对0.933）和内部一致性系数（Cronbach'α系数，0.821对0.768）均十分稳定，针对小学及以下文化受试者，截断值≤23的灵敏度为91.6%、特异度为89.1%；针对中学及以上文化受试者，截断值≤24的灵敏度为92.1%、特异度为94.2%（未发表）。此外，sMCI量表不受年龄的影响，且敏感性和特异性均高于MMSE量表。钟素亚等［44］采用sMCI量表对浙江省舟山群岛的轻度认知损害患病率进行调查，经临床医师评估，AD8量表筛查轻度认知损害的准确率为47.29%（122/258），sMCI量表为79.22%（122/154），表明sMCI量表可以作为筛查轻度认知损害的有效工具。

三、结语与展望

完整的认知功能评估应包括病史、神经心理学测验、实验室检查、影像学检查、生物学标志物等多方面。作为认知功能障碍的初筛工具，神经心理学测验因操作简便、可量化和成本低等优点，深受国内外医师的推崇。临床应用时应根据目的选择不同量表或多项量表联合应用；应注意定期进行一致性检验，严格按照指导语进行测试，同一受试者多次测试的时间段尽量保持一致（如伴抑郁的受试者可能因为情绪节律变化而影响结果，痴呆患者可能因为日落综合征而影响认知功能）。应结合受试者受教育程度和生活背景综合判读测试结果，多项量表联合应用时尤其应注意各项量表之间的平衡，不能仅关注阳性结果。由于目前国内采用的认知功能评估量表多是对国外量表翻译、修订而来，鉴于受教育程度和文化背景的差异，需在国人中重新验证其信度和效度。国内很多研究者着手研发适合中国人的认知功能评估量表，其中多项量表在筛查轻度认知损害与阿尔茨海默病中展现出良好的信度和效度，但现有证据尚不足以推荐任何一项新量表。一方面是由于高质量研究较高，且样本量较小；另一方面是由于中国老年人受教育程度离散度较大，评估认知功能时需根据受教育程度设定不同的截断值，目前尚无统一标准。未来研究中尚待进一步扩大样本量，拓展筛查范围，统一截断值，以期为认知功能障碍的早期筛查和药物疗效监测提供最佳证据。

利益冲突无