小儿积滞病中医证候疗效评价量表的编制和北方地区检验*

2022-07-30李瑞本马延宁胡思源吴力群张葆青薛征闫永彬郭素香刘虹胡淑萍魏小维成天萌陆艳泓吴钰仪张依

天津中医药 2022年7期

李瑞本，马延宁，胡思源，吴力群，张葆青，薛征，闫永彬，郭素香，刘虹，胡淑萍，魏小维，成天萌，陆艳泓，吴钰仪，张依

（1.天津中医药大学第一附属医院儿科，天津 300381；2.国家中医针灸临床医学研究中心，天津 300381；3.北京中医药大学东方医院儿科，北京 100078；4.山东中医药大学附属医院儿科，济南 250011；5.上海市中医医院儿科，上海 200071；6.河南中医药大学第一附属医院儿科，郑州 451100；7.天津中医药大学第二附属医院儿科，天津 300250）

小儿积滞病是一种具有明显中医特色的儿科常见脾系疾病，临床以不思乳食，食而不化，腹部胀满，大便不调为特征[1]。本病中医内涵比较清晰，中医诊疗过程以证候表现等软指标作为主要证据，故中医证候量表是评价疗效最为恰当的手段。本课题组拟编制《小儿积滞病中医证候疗效评价量表》并主要在北方地区进行信度、效度及反应度检验，以期更好的为本病的临床研究工作提供量表基础。

1 资料及方法

1.1 量表编制

1.1.1 构建条目池成立课题小组和专家工作组，包括3名中医儿科专家、1名中西医消化内科专家，2名方法学专家、2名临床主治医师和3名中医儿科研究生。前者负责实施方案，后者负责指导决策。

以“积滞”“食积”“乳积”“伤食”等为检索词在中文数据库、中医儿科学教材/专著、行业标准和团体标准和中医古籍中检索关于小儿积滞病临床症状和体征的描述。并由2名工作人员独立进行数据提取。

由课题组专家对所提取条目进行审核，删除与现代小儿积滞疾病认识不同、不适宜疗效评价等条目，对“一词多义”“一义多词”的条目进行拆分与合并，参照《中医临床诊疗术语（疾病部分）》[2]《中医临床诊疗术语（证候部分）》[3]和《中医诊断学》[4]等术语要求对条目进行规范化命名，最终形成条目池。

1.1.2 条目筛选采用德尔菲问卷的方法，计划在全国范围内遴选40名长期从事中医儿科临床及科研专家，通过2～3轮专家问卷，对各条目的重要性达成共识。第一轮问卷中的条目信息根据条目池编制，后续问卷中条目信息根据上一轮问卷分析结果进行删补。条目的重要程度评分设置为1～9分，分数越高则表示该条目对中医证候疗效评价的影响很大。

统计各条目的重要程度评分均数和变异系数（CV）。剔除条目重要程度评分≤4分和/或CV≥0.4的条目，剩余条目将纳入第2～3轮调查问卷再次确认。

1.1.3 条目优化将筛选后的条目分级量化，各条目按无（0分）、轻度（1分）、中度（2分）、重（3分）进行赋分，制定包括患儿基本信息和中医症状评价量表两部分的小儿积滞病初级临床调查表。

在天津中医药大学第一附属医院儿科门诊随机选取积滞患儿，填写初级临床调查表，评价问卷填写人对条目的理解程度，通过反馈结果对初级评价量表条目进行删减、补充或修改。

1.2 信度、效度和反应度评价

1.2.1 伦理本研究经天津中医药大学第一附属医院伦理委员会审查通过（批件号：SPHFJPK2019020-02）。

1.2.2 研究对象

1.2.2.1 诊断标准参照《中医病证诊断疗效标准》[5]制定。

1.2.2.2 纳入标准 1）符合小儿积滞病诊断标准。2）年龄1～14岁。3）法定监护人或与受试儿童（≥8岁）共同签署知情同意书。

1.2.2.3 排除标准 1）诊断为其他疾病，伴有积滞症状者。2）合并心、脑、呼吸、肝、肾等系统疾病及精神疾病者。

1.2.2.4 病例来源所有病例由天津中医药大学第一附属医院、天津中医药大学第二附属医院、上海市中医医院、山东中医药大学附属医院、北京中医药大学东方医院、河南中医药大学第一附属医院6家单位共同承担，均来源于门诊。

1.2.2.5 样本量样本量=量表条目数×（5～10）[6]。

1.2.3 调查方法临床调查采用门诊医生主导、经专业培训的调查人员辅助医生和患儿及其家属的形式进行。纳入的积滞患儿需首先填写知情同意书，然后由调查员根据患儿具体情况填写临床调查表。临床调查表包括基本信息和中医症状量表两部分，在填写积滞中医症状量表时，调查员需逐条目询问积滞患儿的症状，并选定与其描述相符合的级别，填写到指定位置。条目赋分：症状条目按无症状计0分、轻度计1分、中度计2分、重度计3分赋分；舌脉条目按照无计0分、有计1分赋分。

7～10d后随访，调查员需对积滞患儿进行中医症状量表信息的二次采集。此外，调查员还需在门诊采集30例非积滞患儿的量表信息，作为量表反应度测评的数据。

1.2.4 干预措施可选择中药汤剂、颗粒剂，或联合针刺四缝等疗法辨证施治。

1.2.5 统计方法采用Excel 2016建立数据库，指定专人双次录入数据并核对保存；采用SPSS 26.0软件进行分析。计量资料采用均数、标准差进行描述。结构效度采用探索性因子分析，内容效度、重测信度和分半信度采用相关系数分析，内部一致性采用克朗巴赫系数；反应度采用t检验或非参数检验。

2 结果

2.1 量表编制

2.1.1 条目池形成通过文献检索，共提取136个症状/体征条目、17个舌象条目、15个脉象条目、7个指纹条目。课题组专家对条目讨论审核，删除如“壅盛涎鸣、热毒发疮、四肢不举、目肿、囟肿喉塞、毛发稀疏、咳喘、气短”等与现代小儿积滞疾病认识不同的条目；“喜按、喜俯/伏卧、拒按、喜饮热汤、体重不增”等更适合作为诊断条目，也予剔除；拆分和合并“一词多义”和“一义多词”的条目。舌象、脉象以及指纹条目仅保留“苔腻”。将剩余条目进行规范化，形成具有46个症状条目的评价量表条目池。

2.1.2 德尔菲法问卷

2.1.2.1 专家信息两轮问卷调查分别发放40、40份问卷，回收38、33份有效问卷，回收率分别为95.0%和82.5%，专家积极程度较高。调查专家分别来自东北地区、华北地区、华东地区、中南地区、西南地区、西北地区中16个省市的29家三甲医院，具有广泛的地域代表性。专家均为高级职称，平均年龄（52.0±7.0）岁，工作年限（28.0±9.2）年。见表1。

表1 专家基本信息Tab.1 Basic information of experts

2.1.2.2 第一轮专家问卷第一轮专家问卷条目均数为2.66～8.37，CV为0～0.51。按照条目筛选标准，经专家工作组讨论决定删除“大便青绿、小便短黄、小便如米泔、口干渴、低热、肚腹热甚、时寒时热、胸胁苦闷、口苦、流涎、梦呓、磨牙、面色潮红、形体消瘦、神疲肢倦、精神萎靡、足冷、唇淡白”共18个条目。见表2。

表2 第一轮专家调查各条目的统计结果Tab.2 Statistical results of items in the first round of expert survey

2.1.2.3 第二轮专家问卷第二轮专家问卷，条目均数为 4.06～8.27，CV 为0.10～0.45，专家集中程度明显提高。按照条目筛选标准，经专家工作组讨论决定删除“大便黏稠、口中气热、自汗、盗汗”共4个条面目，最终保留24个条目。见表3。

表3 第二轮专家调查各条目的统计结果Tab.3 Statistical results of items in the second round of expert survey

2.1.3 条目优化共选取了25名积滞患儿进行临床调查问卷的小范围测试[7]。归纳出两点问题：1）条目“嘈杂”，患儿及其家长均难以理解。2）条目“大便时干时稀”，7位家长反映孩子的大便是“先干后稀”。经课题组专家讨论并决定：1）因条目“嘈杂”难以描述和理解，予以其删除。2）因行业标准和中医儿科教材中所描述的积滞证候分型与大便形态并无明确的对应关系，故将描述大便形态的条目“大便时干时稀、大便干、大便溏”合并为“大便不调”。经测试后量表条目初步优化为21个。

2.2 信度、效度和反应度检验

2.2.1 一般情况共对213名儿童进行调查研究，剔除信息不全病例18例，最终纳入195例，包括积滞患儿165例，非积滞患儿30例。165例小儿积滞患儿中男 93例（56.36%），女 72例（43.64%）；年龄（5.36±2.60）岁。30例非积滞儿童中男18例，女12例；年龄（5.12±2.70）岁。两组儿童一般信息比较差异均无统计学意义（P＞0.05），具有可比性。见表4。

表4 一般信息Tab.4 General information

2.2.2 效度分析

2.2.2.1 结构效度对量表的21个条目，利用主成分的方法进行因子分析，结果Kaiser-Meyer-Olkin（KMO）检验值为0.723，Bartlett’s球形检验近似卡方值为 1 317.537（P＜0.05），提示适合做因子分析。并进行方差正交旋转后，结果条目“嗳气”小于0.4，条目“大便不调、夜寐不安”在2个因子上相近。课题小组及专家组参考既往研究集体讨论决定以上3 个条目[8-10]。

对剩余18个条目再次进行因子分析，结果KMO值0.728，Bartlett’s球形检验近似卡方值为1 227.720（P＜0.05）。按照特征根大于1的标准提取出7个公因子，累积方差贡献率为75.152%，各条目经方差正交旋转后各因子载荷结果见表5，碎石图见图1。7个公因子所包含的条目存在课题组所预想的连带关系/逻辑关系。课题组专家建议，将因子3、因子4、因子7合并，最终确定为5个因子，即5个维度：维度1—共性症状[食欲不振、食量减少]，维度2—气滞[脘腹胀满、脘腹疼痛]，维度3—食积[口气臭秽、苔腻、呕吐、恶心、大便酸臭、大便夹有食物残渣/乳片、矢气恶臭]，维度4—化热[手足心热、大便臭秽、烦躁、唇红]，维度5—脾虚[食则饱胀、稍食即饱（早饱）、面色萎黄]。

图1 18条目碎石图Fig.1 18 item gravel diagram

表5 18个条目经方差正交旋转后各因子载荷结果Tab.5 Load results of each factor after variance orthogonal rotation of 18 items

2.2.2.2 内容效度量表中各条目与其所属维度的相关性结果见表6，除“苔腻、呕吐”较低外，其余各条目与其所属维度的相关系数均＞0.4（P＜0.05）。

表6 量表各条目与其所属维度的相关性Tab.6 The correlation between each item of the scale and its dimension

2.2.3 信度分析

2.2.3.1 重测信度邀请间隔在7～10 d来复诊的30例积滞患儿再次填写临床调查表，计算两次量表总分和各维度得分的相关系数。结果显示，两次测量总分和各维度关系数均＞0.7（P＜0.05）。见表7。

表7 量表重测信度各维度相关系数Tab.7 Correlation coefficients of test-retest reliability of the scale

2.2.3.2 分半信度将量表条目按奇数、偶数分为两组，计算165例积滞患儿两组得分的相关性。奇、偶数条目的 Cronbach’s α 系数分别为 0.368、0.376，两者相关系数为 0.66（P＜0.05），Spearman-Brown 和Guttman Split-Half系数均为0.798。见表8。

表8 量表分半信度结果Tab.8 Split half reliability results of the scale

2.2.3.3 内部一致性总量表及各维度的Cronbach’s α系数，均＞0.4。提示该量表及其各维度内部一致性良好。见表9。

表9 量表总表以及各维度的Cronbach’s α系数Tab.9 Total scale and Cronbach’s of each dimension’s α coefficient

2.2.4 反应度

2.2.4.1 与非积滞儿童的比较比较30例非积滞儿童和165例积滞患儿5个维度得分和量表总分。通过Mann-Whitney U检验，均有统计学差异（P＜0.05）。见表10。

表10 积滞患儿与非积滞儿童中医证候疗效评价量表反应度分析Tab.10 Response score of traditional Chinese medicine syndrome efficacy evaluation scale for children with accumulation and stagnation and healthy children

2.2.4.2 积滞患儿治疗前后的比较对30例积滞患儿治疗前后的中医证候总分和各维度得分进行比较，通过Wilcoxon秩和检验，均有统计学差异（P＜0.05）。见表11。

表11 积滞患儿治疗前后中医证候疗效评价量表反应度分析Tab.11 Response analysis of traditional Chinese medicine syndrome efficacy evaluation scale children with accumulation and stagnation

3 讨论

3.1 量表编制方法保证量表内容的全面和完整是编制一个合格量表的前提[11]，条目池构建采用文献研究法，保证了评价量表条目的全面性和完整性。在两轮德尔菲问卷中，采用均值＞4和CV＜0.4的双重标准进行筛选，其中重要性评分的均值大小反映了专家意见的集中程度，均值大则意见越集中；CV数的大小反映了专家意见的协调性，CV小则专家意见的协调程度高[12-13]。最终形成筛选出21条目，均具有较高的集中程度和协调度。德尔菲法最大限度保证了信息的真实性和广泛性，同时在保证评价条目全面性的基础上，融合了现代中医儿科专家们的宝贵经验，使得评价量表条目更符合时代性和适宜性。最后进行了小范围测试，保证了评价量表中的每个条目都能够成功被表达和理解。

3.2 舌脉和指纹类条目处理因舌象、脉象等体征具有较为强烈的主观评价特征，所以一直被认为是中医证侯量表研制中的瓶颈[14]。有研究表明，由于医生对患者舌脉的判断主要依靠个人经验和感觉，同时受到视觉、空间、光线等因素的影响，极易出现判断结果的不一致性，而且舌象、脉象的分类越多，越降低判断结果的一致性[15]。近些年，医疗领域应用新技术建立了包括舌诊、脉诊在内的临床客观疗效评价体系，但其中舌象、脉象的客观参数作为中医临床疗效评价指标仍不成熟[16]。本研究最初构建评价量表条目池中舌象、脉象以及指纹条目分类过多，考虑评价不一致性对将最终结果造成影响，拟全部删除。因“苔腻”为行业标准和团体标准中均提及的积滞病各证型均可具备的舌象，故在评价量表条目池中对其保留。

3.3 效度分析效度即用于反映测量结果与“真值”的接近程度[17]。结构效度研究中因子分析法可根据各条目在公因子上载荷系数的大小对条目进行取舍，一般情况下，删除载荷系数小于<0.4的条目以及在2个或2个以上因子载荷系数相近而无特异性的条目。本研究中删除“嗳气”“大便不调”和“夜寐不安”3个条目，对量表条目一步优化。对再优化后的量表进行因子分析，结果显示，最终形成的5个公因子所包含的条目存在课题组所预想的连带关系/逻辑关系，且每个因子各自代表一个维度，不同维度的组合能体现小儿积滞的不同证型，符合临床实际。

内容效度通常用专家评议来评价。本次量表的编制，先后经历了2轮德尔菲法专家问卷调查，可以保证本量表具有较好的内容效度。此外，内容效度与结构效度具有相关性，对结构效度的量化指标做出评价也能间接反映内容效度[18-19]。本次研究结果显示，除“苔腻、呕吐”较低外，其余各条目与其所属维度的相关系数均＞0.4，所有条目的P均＜0.05，说明相关性较好[9]。

3.4 信度分析重测信度用来考评量表跨时间的稳定程度，多数学者认为时间跨度一般应为1～4周，用2次测评结果的相关系数来反映稳定程度，一般认为重测信度系数＞0.7时较理想[8-9，20]。本次研究结果显示，本量表两次测量的总分和各维度得分的重测信度系数均＞0.7，说明本量表具有较好的稳定性。分半信度又称折半信度，常用来考察量表的跨条目一致性，一般采用Spearman-Brown系数和Guttman Split-Half系数表示分半信度系数，要求R＞0.7[21]。本次研究结果显示，Spearman-Brown系数和Guttman Split-Half系数均为0.798，说明本量表的跨条目一致性较好。内部一致性信度又称同质性信度，是信度测评时常用的指标，是指围绕某一个特定方面展开的条目之间的相似程度。本次研究结果显示，总量表及各维度的 Cronbach’s α系数处于0.488～0.924，说明此量表的内部一致性较好[22]。

3.5 反应度分析反应度又被称为敏感性、区分效度[23]，是指一个量表具有检测被调查者细微特性变化的能力。目前对量表反应度的测评多从以下两个方面：1）量表是否具备能够区分不同人群生存质量的能力。2）量表是否能够区分一个体/群体的生存质量随时间变化情况。研究结果显示，非积滞儿童与积滞患儿、积滞患儿自身治疗前后，在中医证候总分及各个维度得分方面的差异均具有显著性意义。表明本量表具有较好的反应度。

3.6 不足与展望本项目信效度评价研究的受试者来自北京、天津、河南、山东、上海5个省市，以北方地区居多，一定程度上可能影响了本量表的辐射能力。量表的研制工作需要不断探索、不断完善，在今后的研究中应增加南方地区的儿童样本量，验证量表在南方地区的适用性，进一步对本量表进行优化。