基于电子病历的人工智能谵妄识别量表初步构建

2020-03-28赵艳莉谢冬梅高浪丽岳冀蓉

医学研究生学报 2020年2期

赵艳莉，陈龄，谢冬梅，李楠，高浪丽，岳冀蓉

0 引言

谵妄是住院老年人群中常见的一种可逆的、具有波动性的神经精神综合征，常在数小时至数天内发生，主要表现为急性发作的意识紊乱，通常伴注意力不集中，思维混乱、不连贯以及感觉、知觉功能的异常[1-3]。内科老年住院患者的谵妄发生率为20%～29%,术后老年患者的谵妄发生率为11%～51%[4]。谵妄可导致死亡率增加、住院时间延长、认知功能下降、再入院率及养老院入住率增加等[5-9]。由于谵妄具有急性波动性、夜间发病的特点，临床上易被忽视，故漏诊率较高。一项针对急诊老年患者的研究发现谵妄漏诊率高达54.5%[10]。因此早期识别谵妄并及时干预，对降低谵妄漏诊率、改善谵妄患者的预后具有重要临床意义。

美国精神障碍诊断统计手册第5版(DSM-V)的谵妄诊断标准为目前诊断谵妄的金标准，其包含以下5条标准：①:注意力障碍和感知力损害；②:在短时间内发生，表现为注意力和认知功能从基线状态开始的急性改变，且严重程度在1天内呈现波动性；③:可伴随认知功能出现损害；④:当①和②的发生不能被已有的或已确诊的神经精神疾病所解释，且不是在意识水平严重受损的患者中发生；⑤:根据病史、查体、实验室检查可以明确致病因素[11]。但此标准相对复杂，需要有经验的专科医师床旁详细的神经精神评估，且无法量化评分。因此临床中常用的谵妄评估工具大多是基于DSM的量化评估表,意识模糊评估法(confusion assessment method，CAM)和3分钟谵妄诊断评估(3-Minute Diagnostic Interview for CAM-defined Delirium, 3D-CAM)是目前国内外应用较为广泛的谵妄评估工具，具有较高的敏感性和特异性[12-13]。但此类量表需要专业人员现场进行问卷调查，对病情的波动难以有动态的掌握。Inouye等[14]于2005年研发识别谵妄的电子病历评估量表，该方法虽不受时间或空间的限制，可回顾性地、重复地通过电子病历对患者进行谵妄评估。但该量表需要人工浏览电子病历来评估谵妄，不仅费时费力，且受评估人员的素质和培训质量的影响，异质性较大。本研究旨在构建一套基于电子病历自动化提取关键词识别谵妄的量表，为医护人员能早期识别谵妄提供方便可靠的工具，同时为人工智能识别谵妄奠定基础。

1 资料与方法

1.1 研究对象本研究纳入2015年1月至2017年12月因呼吸疾病或心血管疾病于四川大学华西医院老年科住院且年龄≥65岁的患者为研究对象。纳入标准：①年龄≥65岁；②住院期间顺利完成谵妄评估且评估结果资料完整；③电子病历资料完整。排除标准：①全盲、重度听力障碍或重度痴呆不能完成谵妄评估；②有精神病史的患者；③终末期患者(预期寿命<6个月)；④急性神经内科疾病及神经外科疾病患者。根据量表的研发标准，样本量需达到条目数的5～10倍[15]。

1.2量表的构建过程和方法

1.2.1 构建关键词在试验前期，以DSM-V和ICD-10中谵妄的定义及诊断标准为基础构建理论框架，从谵妄评估方法中提取关键词构建初始量表条目池，最后采用德尔菲法结合层次分析法形成了初始量表，其中含106个条目和554个关键词。

本研究中信息学专业人员将满足标准的779份老年住院患者的电子病历资料形成待分析数据集。电子病历资料包含：患者基本信息、入院方式、入院及出院诊断、医师及护理病程记录。信息学专业人员利用R软件将待分析数据集进行自动化分词[16]。成员组将初始量表中的关键词形成关键词词库，信息学专业人员使用R软件中最优匹配度的混合型模型将分词后的结果与词库进行匹配，自动生成电子病历中关键词的频数结果。

1.2.2条目筛选采用临界比值法、相关系数法及差异性分析对条目进行分析和筛选，应用SPSS 23.0软件进行统计分析。①临界比值法：检验各个条目鉴别不同被调查者的性能即区分度。将所有患者的初始量表得分排序，得分在前27%的患者为高分组，得分在后27%的患者为低分组[17]。选择秩和检验检测每项条目的得分在两组之间有无差异，若P>0.05说明该条目区分度不佳，予以剔除。②相关系数法：采用Spearman相关系数分析每个条目得分与量表总分之间的相关性，目的是检测条目的代表性。若P>0.05说明条目与总分相关性不足，予以剔除。③差异性分析：上述两种分析方法可能出现删除与谵妄明显相关的条目，为避免此类问题，采用差异性分析检测条目的区分度与代表性。按照3D-CAM的评估结果将患者分为谵妄组与非谵妄组。使用秩和检验检测条目在两组之间是否有差异性(区分度)，P<0.05表示条目对谵妄的区分度良好，予以保留。采用相关系数分析条目与谵妄是否相关(代表性)，P<0.05表示条目对谵妄的代表性良好，予以保留。临界比值法或相关系数法与差异性分析结果不一致时，优先选择差异性分析的结果。

1.2.3德尔菲法结合层次分析法构建权重系数正式量表条目与初始量表条目之间差异较大。因此在形成正式量表条目后再次使用德尔菲法得到正式量表条目的权重赋值[18]，将条目权重赋值按照层次和维度分别建立判断矩阵图，采用层次分析权数法得到正式量表条目的权重系数[19]。同时使用一致性比率(consistent ratio, CR)检验权重判断矩阵图的内在一致性,CR<0.1说明矩阵图的权重赋值通过一致性检验。

1.2.4正式量表的建立及得分规则由正式量表条目及权重系数形成完整的正式量表。正式量表的得分规则为：关键词频数≥1的条目得分等于该条目的权重系数，所有条目得分之和为量表总分。

2 结果

2.1 一般资料本研究最终共纳入779例住院患者的电子病历资料，纳入的患者中男性占71.9%，平均年龄为(82.8±6)岁，平均住院时间为(21±6)d，见表1。

表 1 本组研究对象的基本特征

Table 1 Basic characteristics of the subjects

项目统计值[n(%)]性别男560(71.9) 女219(28.1)年龄(岁) 65～75129(16.6) 76～85346(44.4) 86～95291(37.4) 96～10013(1.7)住院时间(d) ≤15338(43.1) 16～30359(46.1) 31～4451(6.5) ≥4531(4)

2.2分词结果信息学专家通过R软件进行分词和关键词匹配，发现共有192个关键词出现在电子病历中，38个条目的关键词未出现在电子病历中，故予以删除。关键词在1份电子病历中出现则算1次，出现频率前5的关键词分别为：感染、跌倒、手术、精神尚可、精神差。

2.3条目筛选通过临界比值法得到得分≤2.3为低分组，得分≥5.5为高分组，结果显示共22个条目P>0.05，说明条目的区分度差，予以剔除。根据Spearman相关系数分析后，结果显示11个条目得分与量表总分无显著相关性(P>0.05)，即此类条目的代表性差，予以剔除。差异性分析中，通过秩和检验分析后，发现共38个条目在谵妄和非谵妄患者中有统计学差异(P<0.05)，说明有良好的区分度，予以保留；通过相关系数分析得出41个条目与谵妄有显著相关性(P<0.05)，说明对谵妄患者有良好的代表性，予以保留。综上将以下9个条目予以删除，分别为视力损伤、多药共用、自杀倾向、愤怒、躁动不安、精神不集中、言语少、无言语、计算能力下降。最终得到59个正式量表条目。

2.4建立权重系数，形成正式量表将筛选出来的59个条目组成正式量表，通过德尔菲法结合层次分析法重建权重系数。5位专家均返回意见，专家积极指数为100%。为便于统计分析，将条目总权重系数增大2个数量级(即乘100)，发现谵妄和反应迟钝的权重系数最高，分别为15及13.3。权重矩阵图的一致性检验结果显示CR值均<0.1，说明权重赋值的判断矩阵具有满意的内在一致性即可靠性。最后由正式量表条目及总权重系数形成正式量表，其中包含59个条目及11个维度。779位患者的正式量表得分在0～53.4分之间，平均值为6.64分，偏度为2.6，峰度为8.2，故正式量表得分为厚尾正偏态分布，图1为其分布直方图。

图 1 正式量表得分分布直方图

Figure1Histogramofscoredistributionofformalscale

3 讨论

目前国内外有多种用于谵妄的床旁评估工具，但临床工作中医务人员对此类工具的使用率较低，导致谵妄漏诊率居高不下。因此，我们迫切需要一种自动化谵妄识别工具来减少谵妄漏诊率。本研究研发的基于电子病历的人工智能谵妄识别量表，可从电子病历中自动化提取关键词，实时监测患者病情，以实现早期识别谵妄，及时采取干预措施，提高谵妄风险应对能力。

该量表的建立基于条目的分析，这在量表的构建过程中起着至关重要的作用，其中包括条目筛选、量化及权重赋值。本研究主要采用德尔菲法对条目进行权重赋值，即统一通过邮件咨询专家意见，实施过程严格遵守匿名性原则，专家之间不能相互联系和讨论，最终使量表识别谵妄的敏感度达到最大化。由于国内关于老年谵妄研究方向的专家较少，本研究只邀请到5名专家，今后的研究中应增加专家数量来进一步修订该量表。此外，该研究采用层次分析权数法得到正式量表条目的权重系数，保证了正式量表建立过程中的科学性及完整性。

本研究是首次尝试在电子病历的基础上研发出自动识别谵妄的量表，这是对现有人工谵妄评估工具的补充及创新。目前常用的谵妄评估工具需要有经验的专科医生对患者进行面对面评估，由于谵妄起病急、波动性大且夜间多见，医护人员很难及时实施床旁评估，因此可行性较低。本量表只需计算机自动化提取电子病历中的关键词来识别谵妄，具有较好的操作性和可重复性，节约人力和时间，使得应用前景广泛。

但此研究也有以下不足之处：首先，该研究为回顾性研究，电子病历质量可影响评估结果，后期将进一步对在院患者进行实时评估即前瞻性研究，同时需进一步规范电子病历书写以提高量表的灵敏性；另外，本研究中性别差异较大，男性占71.9%，但性别并非谵妄的危险因素，且量表中谵妄患者的临床症状及相关指标不存在性别差异，故暂未按照性别分层决定权重；最后，此量表是基于四川大学华西医院住院患者的电子病历构建而成，由于地域和文化的差异，条目中的关键词可能不完全适用于其他省市的医院，未来需进一步开展多中心研究以提高量表的适用性。

这项研究初步构建了一种基于电子病历的智能谵妄识别量表，将计算机信息技术应用于临床疾病的筛查。作为临床决策支持功能的一部分，将谵妄识别量表结合到电子病历中，通过提取电子病历中的关键词，智能、主动的提醒医务人员，实现早期识别谵妄的目的。随着医院信息化发展，在该研究基础上，今后有望利用信息技术研发出谵妄风险预警系统，使医务人员最大化识别谵妄，这对未来谵妄相关的临床研究具有重要意义。