重症肌无力共同数据元编制及其在表型研究中的意义
2020-03-04李海峰黄雨陈向军
李海峰 黄雨 陈向军
疾病的共同数据元(CDE)是描述疾病各种特征的标准化数据元素。其编制需要丰富的临床经验、临床研究实践及文献积累,以定量、分类和定性数据反映疾病多维度特征,以数字化思维刻画完整的疾病表型。重症肌无力(MG)是经典的自身免疫性疾病,其表型具有多样性和异质性。本文介绍共同数据元在重症肌无力表型刻画以及以表型为基础进行临床研究的意义。
一、疾病表型和共同数据元的概念
表型是疾病可查知的特征及特征组合,包括患者和医疗人员可查知的临床表型(如症状、体征和病情演变)、医疗人员借助辅助工具(如量表)或辅助检查特定标准(如基于MRI的分类标准)才能评估的内表型、医疗人员通过仪器直接测量(如血压和血糖)得到的中间表型[1]。表型可从多个维度反映疾病的特征,在疾病诊治决策和预后评估中具有重要意义。一些表型是潜在的决定因素,而另一些表型是结局的反映。
表型的多样性指疾病在临床受累范围、严重程度、病理学、生理学、生物化学、免疫学、影像学、疗效和预后等不同角度具有的特征,要归类分析。表型的异质性指上述不同特征在人群中分布及定量的差异。正是有了可归类的特征,才使临床研究从人群差异中找到规律,以指导个体化精准治疗。
数据元是以特征归类为基础形成的数据项,并不包含数据本身,而是数据的标签。每项特征均可形成数据元,不同特征间特定的组合(如重症肌无力亚组)亦可形成数据元。通常包括下列内容[2]:(1)名称,及其缩略语和代码。(2)定义,用以解释数据元的性质、范围或意义。(3)指导语,详细描述如何取得数据,如说明症状问卷的具体意义或明确实验室的测试方案。(4)来源,用以描述数据元的历史或起源及其科学性的证据,包括期刊、词汇表或数据标准、审查过程、验证过程和创建者。(5)值集(value set),可能存在的各种情况或数值的集合,如对于调查问卷值集应包括各种可能的回答,对于实验室测试值集应包括允许的范围及其单位。
对于选择哪些数据、如何反映疾病特征刻画表型,不同研究者的总体思路相近,但仍存有一定差异。共同数据元是跨不同研究的多个数据集中具有共性的数据项,可以在实践中总结形成共识,亦可前瞻性设计。其核心是数据的结构化和标准化,以减少对重要数据的遗漏及缩小数据获取过程中不同收集者之间的差异。编制共同数据元的目的是改进数据质量和促进数据共享[2]。共同数据元包括以下类型:(1)通用数据元(universal CDE),不局限于具体疾病或感兴趣的方面,适用于各种疾病的数据集,如人口学特征、伴发疾病等。(2)特定领域数据元(domain⁃specific CDE),适用于按照特定疾病、症状、状态、躯体系统或学科分类的研究,如帕金森病(PD)、眩晕、全身炎症反应综合征或眼部疾病的数据元。(3)特需数据元(required CDE),满足特定机构(如研究资助者或执行者)要求的数据元,需纳入符合要求的所有受试者,如国家慢性疾病管理的数据集。(4)核心数据元(core CDE),满足特定类型研究要求的数据元,如随机对照试验所需的数据元。以上数据元类型针对不同的应用,涉及不同的数据,存在交叉,但均为疾病研究数据标准化的基础。
应特别注意两个问题:(1)数据标准,采用商定的一套规则以标准化方式共享和处理信息,包括数据的表达方法(如文字、图像模式或数字)和格式(如连续性数据或分类/二分法数据、大数据存储格式)等。(2)词汇表,是收集各种概念的数据库,包含相应的定义和代码,并阐明概念之间的关系。
二、重症肌无力共同数据元的编制
编制重症肌无力共同数据元的最初目的是研究,最终还需优化后用于临床实践,因此不仅要考虑其在随机对照试验和真实研究中的科学价值,更要考虑其潜在的临床实用价值,具体内容应结合疾病自身的发生、发展和演变。本文介绍重症肌无力共同数据元编制中应特别考虑的问题,特别关注如何准确获得一些数据元的信息。
1.社会人口学 年龄是需特别关注的特征,包括发病年龄、采样年龄和眼肌型重症肌无力(OMG)转化为全身型重症肌无力(GMG)的转型年龄等。采样年龄较易获得,而发病年龄和转型年龄的确定则取决于对重症肌无力症状的判断。发病时间短的患者对症状回忆较好,随访好的患者客观记录较完整,均较易判断,但精确判断仍受一些因素的影响。重症肌无力的早期症状波动可自行缓解,患者常无法识别或忘记首发轻微症状,一些症状甚至令神经科医师也难以判断。我们课题组采用标准化重症肌无力症状问卷(表1)询问病史后,立即行标准化疲劳试验和新斯的明试验,与患者自身提供的病史相比,近半数患者对受累肌群的判断发生改变,标准化疲劳试验可发现患者未主诉的受累肌群,而新斯的明试验则可发现一些肌群受累并非重症肌无力所致[3]。标准化重症肌无力症状问卷可以尽可能帮助患者回忆最早出现的症状,尤其是波动性症状,有助于判断发病和转型的起始点。鉴别诊断有助于判断症状是否为重症肌无力所致:眼睑下垂需与Meige综合征和动眼神经麻痹相鉴别,眼外肌麻痹需与动眼神经麻痹、Graves眼病和Miller Fisher综合征(MFS)相鉴别,咽喉肌无力需与轻微脑干梗死和后组脑神经麻痹相鉴别,颈部和四肢肌无力需与颈腰椎病变、代谢性肌病和电解质紊乱相鉴别,呼吸困难需与呼吸道感染、支气管痉挛、心功能障碍、心包积液和肺栓塞等相鉴别,疲劳现象需与焦虑、抑郁和药物因素相鉴别。尽管通过问卷和病史仍可能遗漏部分受累肌群,但却是唯一获得发病年龄和转型年龄的方法。我们的做法是,选择患者和有经验的临床医师共同认定的症状起始时间作为上述两个年龄点,也有一些患者在随访中提供了较最初病史更早的症状起始时间,应予以及时修正。病程是与年龄相关的重要数据元,发病至研究截止点的时间差即为病程。Osserman分型特别关注6个月内进展至呼吸肌受累[4],眼肌型重症肌无力定义为发病2年后仍局限于眼外肌受累[5],因此计算病程时,对发病2年内的患者应尽可能精确到季度或月。
表1 标准化重症肌无力症状问卷Table 1. Standardized MG symptom questionnaire
2.合并症 重症肌无力可并发多种合并症,其中有些合并症与治疗中出现的不良反应有关,如高血压、糖尿病、冠心病(尤其是心绞痛)、骨质疏松和感染[肝炎、获得性免疫缺陷综合征(AIDS)、梅毒、结核病、真菌病等];有些则与重症肌无力表型有关。约15%的患者可伴发多种自身免疫性疾病,不伴胸腺瘤的早发型患者常伴发单一自身免疫性疾病,尤以自身免疫性甲状腺疾病、系统性红斑狼疮(SLE)、类风湿关节炎(RA)和干燥综合征常见[6],伴胸腺瘤的患者则可伴发多种自身免疫性疾病,包括Good综合征[白细胞或淋巴细胞减少和(或)免疫球蛋白缺乏]、单纯红细胞再生障碍性贫血、心肌炎、天胞疮、斑秃和膜性肾病等非神经科疾病,以及味觉改变、多发性肌炎、视神经脊髓炎谱系疾病(NMOSDs)、神经性肌强直和边缘性脑炎(LE)等神经科疾病[6⁃12]。值得注意的是,Graves眼病亦可导致眼外肌麻痹,应与重症肌无力导致的眼外肌麻痹相鉴别[8⁃9],视神经脊髓炎谱系疾病是神经系统免疫性疾病,胸腺切除术可能是其危险因素[10]。应详细记录已发病并确诊的自身免疫性疾病以及尚未发病但已检出自身抗体的情况,制定最低限度的自身免疫性疾病和自身抗体谱筛查清单。我们的建议是:至少应将上述自身免疫性疾病列入共同数据元中,以及检测甲状腺抗体[包括抗甲状腺过氧化物酶(TPO)、甲状腺球蛋白(TG)和促甲状腺激素受体(TSHR)抗体]、抗可提取性核抗原(ENA)抗体谱,存在胸腺瘤的患者还应筛查抗水通道蛋白4(AQP4)抗体、自身免疫性脑炎抗体、肌炎抗体、血清免疫球蛋白和淋巴细胞亚群,考虑到免疫抑制剂可能导致肝功能损害,还应加入自身免疫性肝病相关抗体以资鉴别。重症肌无力亦可合并胸腺外恶性肿瘤,多见于合并胸腺瘤患者[13⁃14],且胸腺瘤无论是否合并重症肌无力,胸腺外恶性肿瘤的发生率均升高[14]。免疫治疗可能增加恶性肿瘤的发生率,尤其是淋巴瘤[6],因此,应按照肿瘤分类设置数据元。上述数据元须记录发现合并症证据的时间。
3.重症肌无力特征 首发受累肌群和长期随访过程中病情最严重时的肌群受累范围是重要表型。不同的首发受累肌群与不同的致病性抗体有关;最严重肌群受累范围虽受治疗的影响,但往往与遗传因素(多基因)有关,尤其是未治疗患者的最严重受累范围更有意义[6,15]。肌群受累范围的判定是Osserman分型[4]和美国重症肌无力基金会(MGFA)分型[16]的重要基础。为了容易分类将首发受累肌群分为眼外肌、球部肌和四肢肌[6]。乙酰胆碱酯酶抑制剂(AChEI)反应在不同类型重症肌无力患者中存在差异,抗肌肉特异性受体酪氨酸激酶(MuSK)抗体阳性患者对AChEI的反应较差且易出现不良反应[17]。滕喜龙试验由于药物在体内维持时间较短并不适用于受累肌群范围较广患者的评估;新斯的明试验的诊断灵敏度和特异度均达95%以上,且多次检查可见不同肌群症状改善的时间不同,适用于对症状改善程度的反复评估[18]。溴吡斯的明替代新斯的明试验在全身型尤其是球部肌受累的患者中有一定价值,但眼外肌受累对AChEI的反应较差,假阴性率较高。肌肉注射新斯的明的标准剂量为0.02~0.03 mg/kg,若剂量不足可导致假阴性结果。注射10分钟后开始观察直至60分钟,每间隔15~20分钟检查1次,记录受累肌群改善程度,切忌注射前患者一出现疲劳即终止检查又在注射后反复鼓励患者配合,以减少假阳性结果的发生。为避免饥饿或过度劳累出现的假阴性结果,应在注射 前 嘱 患 者 进 食 并 适 当 休 息[16]。Osserman 分型[4]和MGFA分型[16]是基于受累肌群范围和严重程度的临床分型,主要用于临床研究中对基线期患者特征的描述,前者还涉及病程和是否伴发胸腺瘤。我们课题组的研究显示,Osserman分型和MGFA分型观察者间的重复性良好,Osserman分型略优于MGFA分型,与Osserman分型分类项目较少和定义清晰有关[3]。虽然这两种分型方法均涉及疾病严重程度,但评价严重程度并非主要目的,MGFA临床研究指南指出,即使是两个重症肌无力领域专家也可能对疾病严重程度有不同的判断,故不推荐将临床分型作为严重程度的评价方法[16]。严重程度是重症肌无力的重要表型,尤其是长期随访但未接受治疗的患者,疾病严重程度更有意义。Oosterhuis评分是最早应用于临床的疾病严重程度评分[19],根据患者主诉的日常生活活动能力进行评估,设计思路与Osserman分型相近,是一项粗略的评分。尽管有些研究将Osserman分型或MGFA分型的型别直接转化为评分用于表示疾病严重程度,但是与抗体或电生理学指标严重程度相关性研究的差异表明,这些简单分型无法作为严重程度的评价标准[20⁃22],建议使用专门的疾病严重程度评价量表。
4.合并胸腺瘤 伴与不伴胸腺瘤的重症肌无力的发病机制不同,因此无论是仅有眼外肌受累还是全身受累,伴胸腺瘤的患者是一种独立类型[6]。未行胸腺切除术的患者在不同研究中的比例不同可造成选择偏倚,因此需要敏感性和特异性均较高的无创性检查方法。CT筛查胸腺瘤的敏感性和特异性均较高,但仅根据CT检查结果易将胸腺增生误诊为胸腺正常,也可能漏诊CT无法发现的小胸腺瘤;MRI平扫并不增加胸腺瘤的敏感性[23⁃24]。最初 CT检查未发现胸腺瘤的患者数年后复查仍可检出胸腺瘤[25]。化学位移 MRI(chemical⁃shift MRI)和 DWI序列可以更好地鉴别胸腺瘤与胸腺增生,并评价胸腺瘤的治疗效果[26⁃27]。示踪剂99mTc⁃MIBI用于前纵隔SPECT显影有助于鉴别胸腺瘤与胸腺增生,且摄取率与胸腺瘤WHO分类和Masaoka分期相关[28],该方法鉴别胸腺瘤与胸腺增生的敏感性或特异性已在国内研究中得到证实[29]。99mTc⁃MIBI SPECT 显影可作为筛查胸腺瘤的另一手段,尤其是影像学难以发现的异位胸腺瘤和胸腺瘤转移。抗连接素(titin)和Ryanodine受体(RyR)抗体在筛查胸腺瘤方面有相似的敏感性,60岁以下患者这两种抗体检测阳性即高度提示胸腺瘤,任意年龄的患者,这两种抗体检测阴性即可排除胸腺瘤[30]。抗连接素和RyR抗体阳性的年轻患者如果最初未发现胸腺瘤,建议每6个月复查1次胸腺影像学。
5.自身抗体 伴不同抗体的重症肌无力临床特征有所不同,有助于进行重症肌无力亚组分类和个体化分层治疗[6]。抗乙酰胆碱受体(AChR)抗体是致病性抗体,针对其主要免疫源区的抗体与疾病严重程度相关性较高,该抗体在儿童患者中虽阳性率较低,但其阳性有助于与先天性肌无力综合征相鉴别;抗MuSK抗体也是致病性抗体,抗MuSK抗体阳性重症肌无力表型相对独特;抗低密度脂蛋白受体相关蛋白4(LRP4)抗体的致病性已有初步研究,但抗LRP4抗体阳性重症肌无力表型与抗AChR抗体阳性不易区分[6]。抗连接素和RyR抗体属于抗胸腺瘤抗体,在早发患者中有提示胸腺瘤的意义,但在晚发患者中这两个抗体阳性的提示意义较低[30]。抗连接素和RyR抗体阳性重症肌无力患者病情相对严重,且易伴发肌炎[31]。欧洲神经科学协会联盟(EFNS)指南建议,尽早添加免疫抑制剂治疗可使患者获得更好缓解[32]。抗体阳性受诸多因素的影响,例如,酶联免疫吸附试验(ELISA)或放射免疫法(RIA)的抗原提取过程略有三维结构的改变,而细胞免疫荧光法(CBA)应用保持天然三维构象的抗原,故二者检出的抗体不尽相同,关键是抗体针对的主要免疫源区是否保持完好和易结合[33]。其中,CBA法的敏感性较高,尤其是对眼肌型重症肌无力患者[34];而ELISA法和RIA法定量检测阳性与否取决于界值(cutoff value)的设定,而定性检测阳性受检测体系能够检出的阈值影响[33]。改进检测体系可以提高检测的敏感性[35]。我们课题组对ELISA法和RIA法的界值研究发现与标准曲线或经验公式计算得到的转化值形成的界值相比,检测原始值的敏感性和特异性并不低于转化值,且健康对照组原始值的变异系数更小,提示以原始值检测可以避免转化过程中因计算带来的变异放大;以界值确定的抗体阳性与患者特征的相关性弱于采用定量数据与患者特征的相关性(待发表)。因此,临床实践中应登记检测方法(定量或定性,包括参考文献)以及定量检测的参考值和检测值。定量检测结果接近界值时,将CBA法中的荧光强度与阳性和阴性进行质控参比,如果荧光强度明确则判定为阳性;定量检测结果明显高于界值但CBA法阴性,可能是抗体结合表位不同或纯化过程改变抗原构象,亦可考虑为阳性。值得注意的是,对于CBA法结果不明确、定量检测结果接近界值的患者应该追踪复查。免疫系统疾病患者尤其是病程较短和症状较轻微的患者,最初检测抗体呈阴性,经治疗数月后复查可呈阳性[36⁃37]。这是由于一旦自身抗体产生,虽然在强力免疫抑制剂或胸腺切除术后抗体水平下降,但通常持续保持阳性[38⁃41]。我们课题组的研究亦证实,病程和是否接受治疗对重症肌无力相关抗体阳性检出率几乎无影响[42],仅少数患者抗体水平波动于检测界值相邻区域的患者阳性率稍有改变。
6.电生理学 重复神经电刺激(RNS)和单纤维肌电图(SFEMG)是反映神经肌肉传导的指标,如颤抖(jitter)异常可作为诊断证据且被视为潜在的疗效评价指标。美国电生理诊断医学协会(AAEM)对完整的诊断流程、受检神经和肌肉、是否易化后再检查均有明确的指导,特别强调将至少1根神经重复引出递减现象(>10%)作为重复神经电刺激的阳性标准[43]。主要有两种判断方法:(1)对递减 >10%的神经间隔30秒以上再行重复神经电刺激,若获得相同结果,即使仅1个频率引出递减现象,亦判定为阳性。(2)1根神经上有2个以上刺激频率引出递减现象(>10%)。上述两种判断方法均为了证实阳性结果并非技术性因素(如误差或刺激后肌肉运动电极移位)所致。参考临床受累肌群,选取与受累肌群最为接近的神经,可使获得阳性结果的可能性增加。此外,检测支配近端肌肉的神经、增加受检神经的数目亦可提高诊断敏感性。近年研究显示,重复神经电刺激的界值从递减10%降至7%~8%,可提高敏感性但不降低特异性[44],且递减趋势有助于与 Lambert⁃Eaton 肌无力综合征(LEMS)相鉴别[45]。重症肌无力患者完整的电生理学检查还包括高频重复刺激以排除突触前膜病变,以及嵌压部位的神经传导检测和肌肉针电极肌电图筛查以排除嵌压性神经病和肌肉病的影响[46]。电生理学异常程度与临床严重程度的相关性和差异具有潜在应用价值,前者有助于客观判断严重程度,后者则提示特殊表型。重复神经电刺激波幅递减程度与重症肌无力定量评分(QMGS)呈微弱相关,而颤抖与QMGS评分的相关性较好[21,47]。抗MuSK抗体阳性患者面肌重复神经电刺激异常比例高于抗AChR抗体阳性患者,但四肢肌重复神经电刺激异常比例显著低于抗 AChR 抗体阳性患者,波幅递减程度也较小[48⁃49];抗LRP4抗体阳性患者电生理学检查罕见异常,波幅递减和颤抖异常程度也轻微[50]。还应注意的是,重复神经电刺激对急性发病的重症肌无力不敏感,有研究显示,虽然急性发病患者血清抗AChR抗体水平与慢性发病患者相近且MGFA分型更为严重,但其重复神经电刺激异常比例远低于慢性发病的患者[51]。
7.胸腺切除术 术前评估和麻醉评估应该系统化[52⁃53]。尽管 2000 年的 MGFA 临床研究指南包括一些胸腺信息[18],但系统化的胸腺资料包括影像学检查(尤其用于临床分期的资料)、手术操作、胸腺瘤分类和分期、样本取材、病理学检查、预后指标、药物治疗和放射治疗等规范尚不完备。近年来,胸腺在重症肌无力发病机制中的作用和二次胸腺切除术治疗重症肌无力的价值越来越受到关注[54],国际胸腺恶性肿瘤兴趣组(ITMIG)已制定出详细的规范[55⁃60]。不同医疗中心选择重症肌无力患者行胸腺切除术的适应证有所不同,尤其是术前状态,病情较重者术后发生危象的风险较高,因此应详细记录术前病程、受累肌群、严重程度、肺功能、溴吡斯的明剂量、激素和免疫抑制剂应用情况、静脉注射免疫球蛋白或血浆置换应用情况、合并感染等;术中麻醉方式、手术方式、手术时间、出血、是否切断膈神经、清理范围和是否胸腔热灌注等;以及术后拔管时间、拔管后肺功能、开始放化疗时间和方案、不良反应等。
8.疗效和预后 由于神经肌肉接头(NMJ)代偿和自我修复能力较好,重症肌无力症状可在有效的免疫治疗后改善,其疗效由基线期临床特征、药效强度、患者依从性和并发症所决定。2012年,重症肌无力临床试验指南明确提出,重症肌无力治疗研究应以激素治疗为基础进行试验设计,激素减量是重要的预后指标,可采用剂量⁃时间曲线下面积(AUDTC)评价[61]。2016年,国际专家共识指南提出日常工作的治疗目标,即达最小临床表现(MM)或更好[62]。基于此,治疗研究要在一定框架内进行,在激素治疗基础上联合免疫抑制剂或其他方法,以最小临床表现为治疗目标,达稳定改善后开始激素减量[63],且在治疗期间保持不变[64]。疗效评价应考虑药物或治疗方法的药效学预期起效时间,过短的观察期无法评价疗效[65],因此应记录治疗后不同时点的疗效参数。对于长期疗效,MGFA临床研究指南提出了“干预后状态(PIS)”概念,定义了完全稳定缓解、药物缓解和轻微表现等反映良好预后状态,以及改善、无改变和加重等状态[18]。但对干预后状态的判断经验仍局限于少数重症肌无力诊疗中心,缺乏严重程度评分和生活质量评分等临床熟悉的测评[66]。目前仅一项研究给出符合“最小临床表现”定义的生活质量评分范围[67]。我们课题组对最小临床表现定义的研究初步确定了相应严重程度和生活质量评分范围(待发表),与该项研究相近。短期疗效可采用治疗前后严重程度评分改变的平均值进行评价[63]。相对评分方法[(治疗前评分-治疗后评分)/治疗前评分]可个体化反映每例患者严重程度的改变[68]。这种思路也体现在其他自身免疫性疾病的治疗研究中[69]。我们课题组的初步研究显示,对于基线期严重程度在一定范围的患者,相对评分改变的组间比较与评分绝对值改变的成组比较可较为一致地反映疗效;而对于严重程度较轻和过重的患者,相对评分改变与评分绝对值改变对疗效的判断不同(待发表)。此外,激素减量也是重要的疗效评价指标,可采用激素平均值[65]或AUDTC评价[70]。参考多中心随机对照试验所采用的疗效评价方法,由基本共同数据元经过逻辑运算得到衍生数据元,可以对依从性较差和随访信息不完整的病例判断是否适合进行疗效分析。
9.疾病严重程度量表 疾病严重程度是重要的内表型,是评价疗效和预后的基础。2012年重症肌无力临床试验指南明确提出,疗效评价应采用包含更多功能评价条目的量表[61]。这些量表绝大多数是单向有序复合量表,分为他评量表、自评量表和混合量表。最经典的他评量表是QMGS量表[71],已通过临床验证并确定了具有临床意义的组间差异最小值[21,72],目前作为大多数随机对照试验的预后评价指标。其他他评量表包括肌无力肌肉量表(MMS)[73]、徒手肌力测定(MMT)[74]、重症肌无力加权评分[75]和我国学者制定的重症肌无力绝对和相对评分[68],上述量表用于评价重症肌无力6个肌群的严重程度,通过不同条目计分和加权计分获得总评分,与QMGS评分具有较好的相关性,也适用于随机对照临床试验。他评量表以医护人员测评为主,观察患者肌无力体征和疲劳试验,受其劳累程度和AChEI的影响,故观察的是特定时点的严重程度,测评前嘱患者保持平时活动强度并在末次服用溴吡斯的明6小时后较为可靠[76]。自评量表最经典的是重症肌无力日常生活活动能力量表(MG⁃ADL)[77]和重症肌无力生活质量量表(MG⁃QoL)[78],此外还包括重症肌无力残疾量表(Disability Scale for Myasthenia Gravis)[79]、重症肌无力自评问卷(Self⁃Administered Questionnaire)[80]、重症肌无力功能障碍指数(MGII)[81]和单一问题自评方法[82]。大多数自评量表与他评量表QMGS具有较好的相关性。重症肌无力复合量表(MGC)集取QMGS、MG⁃MMT和MG⁃ADL量表中在临床测评中表现最佳的条目形成,兼有自评量表和他评量表的优势,经验证与QMGS、MG⁃ADL和MG⁃QoL量表有较好的相关性,是目前推荐的随机对照临床试验首选量表[83]。但上述量表均非线性量表(5分并非1分的5倍),目前有研究者正在编制基于Rasch模型的线性量表[84]。
10.亚组分类 亚组分类的目的是分层治疗,目前针对免疫系统疾病的治疗尚无法达到与肿瘤靶向治疗一样的精准,分层治疗则是根据基线期和治疗中的评估预先选择不同强度的免疫治疗方案。目前的亚组分类均来自研究者的临床经验和观察性研究。我们课题组发现,发病年龄、抗体、胸腺瘤和受累肌群这些特征之间存在高度相关性[85],提示依据单一临床特征分类并不可行。迄今国际上共有3个根据重症肌无力主要临床表现和免疫学特征进行的特定组合亚组分类方案,但不同方案的具体定义存在差异,无法实现不同方案之间的比较或Meta分析;即使采用同一亚组分类方案,也有部分患者同时符合2个不同亚组的定义[86⁃88]。鉴于此,我们课题组基于相互独立完全穷尽(MECE)原则,提出了新的亚组分类建议(图1)[89],并采用类似分类方案在以中等剂量激素为基础治疗的队列研究中初步发现亚组分类与疾病严重程度和预后存在相关性[42],该亚组分类还有待前瞻性研究验证。有学者采用聚类分析法进行亚组分类,分为眼肌型、伴胸腺增生型、抗AChR抗体阴性型、伴胸腺瘤型和不伴胸腺异常的抗AChR抗体阳性型,但并未完全证实前述亚组分类中的其他特定组合,且亚组之间仍存在重叠[90]。我们课题组也采用聚类分析法获得类似结果(未发表)。
图1 重症肌无力亚组分类建议和流程[89]Figure 1 MG subgroup classification recommendations and procedures[89].
11.危象 重症肌无力相关危象最初分为3种类型,即肌无力危象、胆碱能危象和反拗危象,后续分类逐渐摒弃“反拗危象”概念,但的确存在原来AChEI有效者突然失效的现象,多见于严重感染和酸中毒[91]。危象的诱因中感染应该细化,尤其不能忽略病毒感染[C⁃反应蛋白(CRP)和白细胞介素⁃6(IL⁃6)最敏感],以及胆道和泌尿系统感染。情绪、手术、外伤、妊娠和药物等均可成为诱因,但判断因果关系需慎重[92],可以分为确定关联、很可能关联、可能关联和明确无关联。需统一“危象”的定义[91],目前定义为因呼吸肌无力发生呼吸衰竭需通气支持,但随着无创通气的应用,需进一步规范“需通气支持”的定义。国际专家共识指南还提出“危象前期”的概念[62],为迅速加重经治疗医师判断数天或数周内将发生危象的患者。在危象前期能够识别潜在危象是非常重要的,制作共同数据元时设立相关项目有助于指导临床医师标准化评估患者和总结危象诊治中的规律,并探索更好的干预措施。早期症状应关注二氧化碳轻微潴留引起的兴奋状态和严重潴留引起的抑制状态,应记录床旁肺活量;合并低氧血症者应评估肺弥散功能、炎症和大呼吸道堵塞;有条件者应记录最大吸气压(MIP)和最大呼气压(MEP)[93],如采用无创通气应记录呼吸机参数;详细记录危象前期的重症肌无力症状十分重要,包括球部肌和呼吸肌症状、吞咽功能、疾病严重程度、溴吡斯的明剂量、免疫治疗等。“术后危象”的定义也应统一,包括气管插管者延迟拔管持续时间和重新插管时间[94⁃95]。还应测定伴胸腺瘤患者的淋巴细胞亚群和血清免疫球蛋白水平,此类患者有5%~6%可发生Good综合征[96],使感染难以控制。危象前期和危象发生后行气管插管者应记录重症肌无力症状和伴随症状,尤其是胆碱能受体刺激症状,如瞳孔、心率、唾液腺分泌和肌束震颤等。还应记录对重症肌无力症状和合并症的治疗、开始尝试脱机时间、脱机时最初溴吡斯的明剂量及使用时间与脱机开始和结束的间隔、脱机尝试结束时患者的状态等。危象改善后应对呼吸和吞咽功能、肺部感染、肺功能进行系列评估。
12.妊娠 女性重症肌无力患者处于妊娠不同阶段出现的病情加重情况不同,现有指南对妊娠和分娩相关问题作出推荐[62,97]。应详细记录妊娠并发症、妊娠期药物剂量和治疗时间、胎儿发育、分娩过程、胎儿关节弯曲症、新生儿肌无力及婴幼儿期异常等[97⁃98]。
13.难治性重症肌无力 难治性重症肌无力的诊断应考虑遵嘱性,在患者依从性良好的情况下经规范激素和免疫抑制剂治疗后未能在预期起效时间内达到足够疗效、需反复静脉注射免疫球蛋白或血浆置换、反复发生危象、出现严重不良反应需停药、治疗有效但减量后多次复发者,均可判定为难治性重症肌无力[62,99⁃100]。目前,不同医疗中心对难治性重症肌无力的判断标准尚有差异,应标准化判断流程[99⁃100]。
14.药物不良反应和安全性清单 长期免疫治疗可以导致多种不良反应,治疗前可采用不良反应风险清单评估不良反应风险[101],治疗后发生不良反应时按照通行的不良反应报告规范及时登记。应特别注意伴胸腺瘤的患者可出现免疫缺陷,并非均由免疫治疗所致[97]。
三、编制重症肌无力共同数据元过程中的问题及解决方法
1.兼容既往数据 不同年代的研究进展不同,一些年代产生的数据来自病历记录,无法查找到当年的医师核证,因此应回顾重症肌无力、自身免疫性疾病和胸腺疾病的临床研究及各种诊断和分类标准的历史纳入共同数据元中,例如,我们课题组检索到了各年代胸腺瘤14种分期的系统文献[60]。
图2 重症肌无力干预后状态的判断流程图[102]Figure 2 Flow chart for determination of post⁃intervention status in MG[102].
2.衍生数据元 一些重症肌无力表型特征是在基本数据元基础上通过有定义的数据筛选和逻辑运算形成的衍生数据,如短期疗效应基于QMGS或MGC评分绝对值或相对改变,干预后状态则要对重症肌无力症状对生活的影响、体征、药物应用情况和持续时间等因素进行流程化评估(图2)[102],可以通过数据库软件进行检索和逻辑运算获得。
3.数据元修订 数据元修订基于认识的进步,数据元的定义、数据格式等可能的改变,但要在既往数据元的基础上进行修订。因此,编制共同数据元时应考虑如何尽可能保留原始信息,能够定量的数据则不采用分类或定性数据设置数据元格式,方能在数据元修订时根据原始记录进行重新分类。
4.数据元及时获取和质控 专病管理软件与医院电子病历系统的连接和数据提取可形成即时数据,最为可靠,尽管临床医师接诊时也可能出现录入错误,但避免了整理录入中的进一步错误。如果无法做到多医疗中心均可从电子病历系统中提取数据,则应双人录入并核查。数据质控不能仅核查最小数据集是否完整,更要核查具体集值的录入是否准确。人工智能有助于通过逻辑运算核查集值可能出现的错误,提请核查人员特别注意。基于共同数据元的数据库运行一段时间后应组织系统的核查和纠错,以保证前期资料的可靠性并发现问题,改进共同数据元的编制和数据库的管理[103⁃104]。
5.重复测量 多次随访必然产生重复测量数据,为保证数据的可靠性,应对测评者进行培训,采用Kappa检验对不同测评者对同一患者特定时点测量的一致性进行质控,但应注意重症肌无力的疲劳性使患者难以接受多次检查,录制视频后分发给不同测评者独立判读是一种解决方法[79]。
6.可视化 可视化手段可将不同重症肌无力表型特征直观联系起来,选择多个共同数据元形成折线图叠加清晰显示各共同数据元在时间轴上的趋势和相互关系,饼图则有助于直观显示不同类别所占比例。生物信息学技术中的可视化方法应引入基于共同数据元的数据库。
四、国内外重症肌无力共同数据元现状
20世纪80年代,我国的一些重症肌无力诊治中心即已建立了相应的数据库系统,建立时间与西方国家的差距并不大。基于重症肌无力领域医师和研究者的经验和兴趣,通常以印刷的表格形式填写(图3),一些最初未考虑的内容需手写添加,由于印刷成本,难以及时修订数据元。20世纪90年代后期,国内开始采用Excel等软件登记,通常由纸版记录表手工输入,可满足数据元的增加,使基于原始资料形成衍生数据以确立新的数据元成为可能。进入21世纪后,西方国家较早开始创建人机对话的结构化专病数据库,在神经系统疾病中主要涉及脑卒中、癫和多发性硬化等常见病,最初为单机版本,2005年后陆续改为在线版本,为能够多中心合作,专病共同数据元的需求应运而生。至2010年,国内采用Excel软件登记已成为基本配置,也开始进行专病计算机软件的研发,但截至目前大多数重症肌无力诊疗中心仍应用Excel数据库,思路相似但数据元的具体定义、数据规范、词汇表和工作手册各不相同,仅少数中心研发了人机对话数据库和手机APP。在进行多中心研究前,不同重症肌无力诊疗中心应核对数据元及其具体定义,讨论确定共同标准甚至重新整理原始资料。值得注意的是,有些研究者使用数据库时并未经过专业培训,数据库管理者也应不断加强交流和培训才能更好地管理其中的数据。
图3 青岛大学附属医院丛志强教授使用过的重症肌无力登记单Figure 3 MG registration forms used by Professor Cong Zhi⁃qiang,Affilliated Hospital of Qingdao University.
2012年,笔者在翻译美国国立卫生研究院(NIH)编制的脑卒中共同数据元[105]时查阅其官网,发现在已有肌肉病共同数据元中,重症肌无力已纳入其中[106]。该共同数据元包含许多肌肉病共用的电生理学和合并症等数据元,以及重症肌无力不常用但肌肉病常用的遗传学和病理学等数据元,然而缺乏重症肌无力相关胸腺影像学和病理学数据元。国际最大的两个注册登记研究队列——MGFA重症肌无力注册[107]和欧洲重症肌无力注册[108]均有其数据元系统,但尚未达成一致。迄今国内尚无取得共识的重症肌无力共同数据元。
五、共同数据元在重症肌无力表型研究中的意义
单个数据元和基于单个数据元形成的衍生数据元均为疾病表型,如受累部位和干预后状态是临床表型,抗AChR抗体水平是中间表型,疾病严重程度是内表型。一些数据元可能是基线因素,如首发受累部位;另一些数据元则是结局因素,如疾病严重程度和干预后状态。个体化精准治疗应在病程中根据基线数据和随访数据特征进行分类和预测,以指导临床决策。瑞典多发性硬化登记系统可以通过筛查相似特征患者中某一治疗策略或药物应用的实时大数据,给临床医师和患者在治疗选择中提供借鉴[103]。但其治疗方法受不同时代临床医师诊治理念和社会经济因素(如医保)的影响,更为精准的决策还应基于疾病表型进行临床研究。
1.基于队列的流行病学研究队列研究分为回顾性和前瞻性研究,回顾性研究用于比较不同时代和诊治条件下的自然史,发现各种潜在影响因素,尤其是治疗手段缺乏时的自然史更是宝贵的资料;前瞻性研究则从一个时代的普遍诊治框架开始,通过长期随访获得发病机制、疗效和预后影响因素、诊治改进方法等。因此,共同数据元向前兼容各时代的数据元并建立与当前数据元的联系非常重要。
2.以队列为基础的干预研究 随机对照试验和采用倾向匹配法进行真实世界队列研究是级别最高、能尽可能体现因果关系的循证医学证据,随机对照试验亚组分析可以提供获得良好或不良结局的患者信息,形成进一步研究的假说,因素校正法和倾向匹配法可使用真实世界的数据对这些假说进行验证。随机对照试验的不足是时间偏短且基线资料预测能力有限,尤其是自身免疫性疾病这种病程波动有自我缓解趋势的疾病。倾向匹配法可以模拟随机对照试验并纳入更多真实世界因素变量,需从研究起始点前数据、研究起始基线数据、研究过程中数据这三方面考虑,忽视研究起始点前数据和研究过程中数据可能导致无法达到预期,我们课题组针对国外1项重症肌无力患者胸腺切除术后重症肌无力预后研究提出了这一问题[109⁃110]。贝叶森法有助于解决具有复发缓解特点疾病的病程预测问题[111]。共同数据元的编制和更新要考虑研究方法学的进步,有临床诊治经验的医师应与临床流行病学和统计学专家合作,明确数据元及其相互关系,并确定至少应该包括哪些数据元才能应对前瞻性研究的挑战。
3.数据元的改进研究 精确获取一些数据元的数据不仅要有明确的数据规范和工作手册以及测评者的培训,而且要对现有方法在不同文化背景下进行评价并优化。我们课题组对重症肌无力标准化分型的研究结果显示,系统完成病史、标准化疲劳试验和新斯的明试验是临床分型的基础,即使不是重症肌无力领域的专家,只要按照标准化流程也能获得可靠的分型结果[3]。我们随后对国内外常用的4个疾病严重程度量表进行多中心评价,发现均具有良好的信度和效度,适于多中心临床研究[112];进一步收集国内15个省市32位重症肌无力领域专家意见,采用Delphi法筛选条目形成初始量表[113],在此基础上编制了适合我国临床研究的完整量表和简化版自评量表[114],新的完整量表与常用量表相比具有良好的校标信度,简化版自评量表与完整量表具有较高的相关性,且无需特殊检查设备,耗时少,以保证多中心研究测评的准确性和一致性。在完成对抗AChR抗体定量检测一致性的研究[115]后,我们课题组在数据库中按照自然史队列中检测抗AChR抗体时的人群特征选择患者形成一个具有临床表型代表性的队列,对ELISA法和RIA法定量检测的界值进行优化(待发表),这是国际上首次采用有完整信息的样本对商品化AChR试剂盒的验证研究,有望进一步改进抗体检测数据元的工作手册。这些研究的基础是数据元的设置充分且尽可能定量收集数据,研究目标是数据元和集值的进一步优化和标准化,以期为表型研究提供更好的工具。
六、总结与展望
疾病表型由一个个特征构成,具有时间、空间和严重程度的多样性,每个特征及特征间组合均可形成数据元。共同数据元是约定的也是不断随着认识的更新而改进的数据元,标准化获取和共享将对疾病表型的认识,以及因果关系的确认发挥重要作用。在共享平台上,尤其是随着大数据时代人工智能技术的发展,每位研究者均有机会成为解决一个科学问题或一个实用问题的主研,共同数据元的价值以及编制者的贡献已经越来越受到认可[119]。本文对重症肌无力共同数据元的编制提出相关概念和问题,希望推动重症肌无力共享平台的建设,通过表型研究更好地改进重症肌无力的诊断、标准化评估和个体化治疗。
利益冲突无