APP下载

更年期症状全面评估量表的信度与效度评价

2021-07-31张凌燕阮祥燕李星明崔亚美谷牧青刘玉兰

首都医科大学学报 2021年4期
关键词:效度信度条目

张凌燕 阮祥燕* 李星明 崔亚美 谷牧青 刘玉兰 甄 洁

(1.首都医科大学附属北京妇产医院内分泌科,北京 100026;2.首都医科大学公共卫生学院卫生管理与政策学系,北京 100069)

根据我国第七次人口普查最新统计数据[1]显示,绝经后女性人数为1.28亿人;随着人类寿命的延长,预计到2025年,全世界绝经后妇女的数量将达到11亿[2]。卵巢卵泡功能的逐渐或突然停止可出现一系列的心理、生理症状,表现为血管舒缩症状、阴道干燥、性欲减退、失眠、疲劳和关节疼痛等更年期症状。更年期症状是更年期研究中一个重要的领域[3]。这些症状可能严重影响许多妇女的生活质量,甚至需要寻求治疗以减缓症状[4]。一般来说,更年期症状出现在48岁至55岁之间,绝经过渡期通常持续4至8年[5]。地理环境、种族、民族、教育和生活方式等诸多因素会影响更年期症状[6]。在西方国家高达85%的绝经女性经历潮热[7],而我国女性潮热患病率<50%[8]。目前,改良Kupperman评分是临床上应用最广的更年期症状评估量表,但是只包括13个生理和心理项目,部分项目太过笼统,且只对更年期部分症状进行评价,无法准确反映患者真实情况。国外也有超过70个项目的量表测量身体、心理和心身症状,但也并非量表项目越多越好[9]。此外,不同量表在不同种族人群中效果也不同。有研究[10]表明,应用更年期症状评估(Menopausal Symptom Scale,MSS)量表对澳大利亚和中国台湾省妇女进行评估,结果显示在中国台湾省女性中,MSS量表表现出低信度系数(Cronbach’s alpha=0.63),而在澳大利亚女性(Cronbach’s alpha=0.85)中信度较高。早在1999年首都医科大学附属北京妇产医院北京妇幼保健院建立了中国首个更年期综合指导中心,有必要对本院更年期症状全面评估量表进行评估,从而为我国更年期女性的个体化治疗提供理论依据。

1 对象与方法

1.1 研究对象

选取于2018年1月至2020年5月期间,因更年期症状就诊于首都医科大学附属北京妇产医院的女性患者共2 487人为调查对象(Reg No.In ChiCTR 2000035047)。所有患者均已签署知情同意书,且已经医院伦理委员会批准(伦理批准文号:2020-KY-008-01)。

纳入标准:根据2011年生殖衰老分期(STRAW+10)[11],围绝经期:月经周期不规律,伴/不伴围绝经期症状;绝经后:≥连续12个月无自发月经,或双侧卵巢切除术≥入组前6周(有无子宫切除术),卵泡刺激素(follicle-stimulating hormone,FSH)>40 IU/L。未怀孕或未哺乳,能读懂中文、能正常交流与沟通、自愿参与本次研究的中国女性。

排除标准:卵巢早衰;精神科医生诊断的抑郁、焦虑、睡眠或昼夜节律紊乱(失眠除外)、阿尔茨海默病和其他精神疾病;梅尼埃病;全身性红斑狼疮、风湿病或类风湿性关节炎引起的关节痛。

1.2 调查内容及方法

采用电子调查问卷方式,内容包括年龄、民族、教育水平、居住地、婚姻状况、孕次、产次、食用豆制品情况、吸烟、饮酒、激素替代治疗(menopausal hormone therapy, MHT),绝经原因及本量表,同时还应用Kupperman评分量表便于通过校标效度评价本研究量表的效度;测量其身高及体质量。问卷由受试者本人填写完成后,经调查员核查无误、确认无漏填后再收回。

1.3 中文版更年期症状量表

根据国际学者的相关研究[12-14]、在对绝经妇女的访谈、专家意见以及Kupperman评分量表、Zung抑郁量表、Green量表、简易智力测验(Mini-Mental State Examination,MMES)等量表及本中心的临床实践制定本量表,初步形成包括负面情绪(10个条目)、认知症状(2个条目)、睡眠障碍(1个条目)、血管舒缩症状(2个条目)、泌尿生殖系症状(13个条目)、自主神经系统症状(9个条目)及肢体疼痛/感觉异常(17个条目)7个维度、54个条目的中文版更年期症状量表。此量表采用4级评分标准,选项分别为“无、偶尔、经常、总是,影响到工作和生活”,分别赋值为 0~3分。

1.4 质量控制

采用统一的调查表和判定标准,选择资深护士作为调查员并进行培训,指导患者完成调查后,由课题组专人对获得的资料逐项进行检查和核对,确保资料的准确性和完整性。

1.5 统计学方法

2 结果

2.1 调查对象的基本特征

调查对象的平均年龄为(50.35±6.82)岁,已婚者占99.2%,本科及以上学历者占34.14%,平均体质量指数(body mass index,BMI)为(24.19±3.78) kg/m2;绝经后女性占50.34%。

2.2 条目筛选

采用两独立样本秩和检验比较高分组(671人)和低分组(671人)各条目得分,结果显示54个条目得分的差别均有统计学意义(P<0.001)。

2.3 信度评价

2.3.1 信度

内部一致性信度旨在评价量表所有条目的同质性,即所有的条目是否测量了同样的问题或现象,通常用 Cronbach’s α系数来表示。Cronbach’sα系数范围为0.778~0.914,均值为0.873±0.047,详见表1。

表1 信度评价结果

2.3.2 折半信度

将量表54个条目按照序号奇偶分成两半,通过两部分条目得分的相关系数评价其是否测量了同样的问题或现象,结果显示,总的Spearman-Brown相关系数为0.866,Guttman Split-half为0.852,相关系数为0.763,两个半量表的折半信度分别为0.943和0.918,信度可靠,详见表2。

表2 折半信度评价结果Tab.2 Split-half reliability results

2.3.3 重测信度

选取164人,用同样的问卷对同一组被调查者间隔一年重复施测,计算两次施测结果的相关系数,本量表两次测量的总分Pearson相关系数为0.711(P<0.001)。

2.4 效度评价

2.4.1 探索性因子分析

当不设定因子数,即根据特征值eigenvalue>1来挑选因子数(图1),保留了10个因子,旋转成分矩阵中的因子载荷设为≥0.45,10因子的旋转因子矩阵解释了数据中61.28%的方差(累计贡献率达到61.28%,表3)。10个因子可以简单总结为1:负面情绪和认知症状,2:肢体活动障碍,3:性相关症状,4:生殖系统症状,5:自主神经紊乱症状,6:关节肿痛,7:肢体感觉异常,8:精力减退症状,9:泌尿系统症状,10:血管舒缩症状。因子矩阵表明每个项目因子负荷都高于0.40的可接受标准。总体上,92.6%的条目都有效(50/54),表明该量表结构效度可以接受。通过因子分析和概念框架的结合,确定了更年期症状量表的结构模型。虽然睡眠因条目所限无法分析,经专家一致认为,睡眠是更年期常见表现之一,不予剔除,故将条目重新编号,形成了量表终稿,包含11个维度(包括睡眠障碍),54个条目。

图1 更年期症状全面评估量表探索性因子分析碎石图Fig.1 The exploratory factor analysis of Comprehensive Assessment of Menopausal Symptoms Scale

表3 更年期症状全面评估量表经主轴因子法提取的因子解释总方差Tab.3 Total variance of factors explained by the main axis factor method of the Comprehensive Assessment of Menopausal Symptomatic Scale

续表3

2.4.2 用AMOS软件实现结构效度,验证性因子分析

在进行旋转因子分析(exploratory factor analysis,EFA)之前,评估了EFA数据的适用性。Kaiser-Meyer-Oklin值为0.961,超过了0.60的推荐值,Bartlett’s检验具有统计学意义(P<0.01)。

进行验证性因子分析,以确定数据是否与EFA提出的演绎指定模型一致。这是对样本的后半部分进行的(图2)。8个条目(共53个条目)的标准化因子载荷小于0.5,表明结构效度可接受,每个项目都对各自的因子有充分的贡献。没有出现负误差方差。各因子相关系数均小于1.00(0.329

图2 更年期症状全面评估量表验证性因子分析图Fig.2 Confirmatory factor analysis of the Comprehensive Assessment of Menopausal Symptoms ScaleA: limb pain/paraesthesia; B: negative mood; C: vasomotor symptoms; D: cognitive symptoms; F: autonomic nervous disorder; G: urogenital symptoms.

2.4.3 校标效度

相关系数的取值范围在 0.4~0.8之间。本研究选择Kupperman评分量表为对照,是因为其特异性和概念性与本量表相似,计算本量表的症状总得分和Kupperman评分之间的Pearson相关性为0.679(P<0.05)。

2.5 更年期症状全面评估量表

经过信度及效度检验,最终形成了包括11个维度、54个条目的更年期症状全面评估量表(表4)。

表4 更年期症状全面评估量表Tab.4 Evaluation of reliability and validity of the Comprehensive Assessment of Menopausal Symptoms Scale If you have had any of the following symptoms in the past 6 months, please complete the following questionnaire based on if and to what extent your symptoms are.

续表4

续表4

3 讨论

因子矩阵表明每个项目因子负荷都高于可接受标准[15];效度检验验证了EFA数据的充分性[16];此外,量表的效标效度也较好[17]。

3.1 量表编制及其条目的科学性

在编制量表条目前,首先应明确欲测内容或现象的概念,以指导量表的编制[18]。更年期症状体验具有文化和社会背景差异,影响人们对更年期的态度和意义[19]。研究[20]表明,亚洲妇女与西方妇女相比,躯体症状最严重(如腰背疼痛等),血管舒缩症状最轻。为了制定适合我国更年期女性的症状评估量表,本研究主要根据相关更年期研究、对绝经妇女的访谈、参考专家意见、利用课题组已开展更年期研究的资料和结果以及现有的量表,确定了更年期症状在本研究中的定义及维度:包括8个维度,54个条目来指导后续量表条目的编制。

条目是量表的主体,量表是否合格在很大程度上取决于条目的质量,因此条目的筛选是开发量表的核心环节之一。现有的改良Kupperman量表应用焦躁和忧郁的词汇或短语来测量心理症状,而本研究中更年期症状量表除上述症状外,还包括测量其他心理症状的项目,如好哭可以测量无用感和遗憾感,包括对女性一生中做过或没做过的事情的悲伤或失望[21]。而在传统文化中,这种感觉或情绪在女性中更为普遍,因此本量表具有全面测量心理症状的能力[22]。

本研究第一次利用临床大样本调查的数据进行统计分析,采用临界比值法对条目进行筛选,与此同时,本研究在条目筛选的过程中,没有单独依赖统计学结果,而是将其与实际或理论相结合进行分析,最终决定条目是否删除,保证了条目的合理性和科学性。

3.2 量表的信度

信度是指量表的一致性和稳定性。信度越高,表示量表越稳定[23]。本研究测量了更年期症状量表的内在信度。内在信度旨在评价乳腺癌患者配偶支持本量表条目的内部一致性[23]。本研究第一次应用大样本调查的数据对经条目筛选后形成的更年期症状全面评估量表终稿的信度进行了初步评价,用内部一致性信度和分半信度来表示。结果显示 Cronbach’s α系数大于 0.7,分半信度大于0.8,证实了量表终稿的内在信度较好,条目具有较好的内部一致性。

3.3 量表的效度

效度是指量表是否为某特定变量的量度[18]。本研究采用结构效度对更年期症状全面评估量表的效度进行评价。结构效度指量表的内在结构与其所依据的理论或概念框架的一致程度[18]。本研究通过EFA确定了更年期症状量表的结构模型。在EFA 阶段,本研究采用主轴因子法提取特征值大于1的公因子,用直接斜交法进行因子旋转,产生10个公因子。睡眠障碍是围绝经期及绝经后女性面临的重大问题之一,占绝经后女性的40%~60%[24],因本量表中只有1个条目,无法进行效度及信度检验,但经专家综合考虑后,仍予以纳入量表。研究[25]表明,抑郁症状的增加与经历的更年期症状的严重程度或数量有关。这可能是因为抑郁症状可能与绝经后内源性雌激素水平降低及睾酮水平的提高有关[26]。正如假设的那样,本量表负面情绪得分较高的女性对绝经的消极态度也更多,这为量表的有效性提供了证据。

3.4 量表的实用性

应用本量表的一项临床研究结果[27]显示:绝经后妇女的更年期症状评分高于围绝经期妇女。这与先前的研究结果[3]一致,即绝经后是症状最严重的时期。因此,如果常规评估妇女的更年期症状评分,它将有助于确定在绝经过渡期的症状变化。因此,本量表能够识别出有严重更年期症状的女性,以使她们能够得到适当的临床关注和支持。

更年期症状全面评估量表包括11个维度,54个条目,长短适宜,容易被患者接受。此外,量表的绝大多数条目均来自更年期患者的真实经历或体验,这使患者在填写问卷时容易产生代入感,在一定程度上可以促使患者认真填写。此外,量表的计分方式也比较简单,所有条目均采用4级评分标准,没有给患者带来额外的负担,也有利于临床工作者或研究者更方便、快速地应用此量表。

3.5 量表的应用价值与推广

本研究开发的针对我国更年期患者,尤其是激素治疗患者,具有良好的信度和效度,能较好地反映更年期患者的症状。与此同时,该量表也具有较好的实用性。该量表在以下领域具有潜在的推广应用前景:评价处于治疗期的各年龄段患者的更年期症状,为对更年期患者进行针对性的干预或指导提供依据,同时也可以利用该量表评价干预措施的有效性。与其他更年期症状量表(如改良Kupperman评分)相比,本量表具有以下优势:各症状条目的适度细化;更年期特异性条目的增加等,但本研究的局限性在于所有样本均为方便抽样,在一定程度上影响了样本的代表性。建议采取随机抽样的方式开展多中心大样本调查,进一步验证更年期患者配偶支持量表的信、效度。

总之,本研究结合国内外更年期患者相关文献、量表以及课题组已开展研究的结果,构建了条目池;通过临界比值法、Cronbach’sα系数法、重测信度、校标效度和因子分析法对条目进行了修改、调整和筛选,最终形成了包括11个维度、54个条目在内的更年期症状全面评估量表。与此同时,本研究结果表明该量表具有良好的信度和效度,适于在临床上推广。

猜你喜欢

效度信度条目
以患者为主的炎症性肠病患者PRO量表特异模块条目筛选
效度验证模式系统整合与效度研究发展策略
作为数学教育研究质量分析的信度
来华留学生对全英文授课教学服务满意度量表的信度和效度分析——以昆明医科大学为例
问卷是否可信
——基于体育核心期刊论文(2010—2018年)的系统分析
作为数学教育研究质量分析的效度
《词诠》互见条目述略
谈高效课堂下效度的提升策略
语言测试效度研究的另一视角:考试的因子结构研究
体育科学定量研究中测验的信度与效度分析