多准则护理决策评价量表的汉化及信效度检验

2021-06-21刘云访喻姣花李素云柯卉晏蓉赵诗雨

护理学报 2021年10期

刘云访，喻姣花，李素云，柯卉，晏蓉，赵诗雨

（华中科技大学同济医学院附属协和医院a.胸外科；b.护理部；c.外科；d.肝胆外科；e.骨科；f.手术室，湖北武汉430022）

护理决策是指护士通过搜集和评估患者信息，在临床实践中做出的决策，其目的是选择最佳方案以实现患者利益的最大化[1-2]，患者的护理结局受护理决策的直接影响[3]。然而由于缺乏对具体概念和过程的理解，大部分护理工作者常常陷入决策困境[4]，以至于在临床情境中，临时、随意、非透明化的选择决策时常发生[5]。因此，引入护理决策评价工具指导临床护理决策工作的开展极其重要。2006年，美国非营利组织为促进合理决策文化的发展而发掘了一套通用决策标准—EVIDEM（Evidence and Values：Impact of Decision Making）结构框架，该框架以多准则决策评价矩阵为核心，适用于任何类型的医疗保健干预措施与决策，例如疾病诊断和治疗方法的选择、药物选择、干预措施优先级设定等[6]。自2011年起，加拿大[7]、南非[8]、意大利[9]、哥伦比亚等[10]先后将EVIDEM决策框架应用于测试曲马多缓解非癌性疼痛的决策、宫颈癌筛查测试的决策、卫生技术评估框架构建、4种竞争性医疗技术的选择决策等各类现实决策环境中，各国的专家委员会一致肯定了该框架对支持系统评估医疗保健干预措施的重要意义。EVIDEM结构框架综合考虑了证据质量、社会价值及伦理问题，同时能保持决策原理和决策过程的透明化、一致性，与个人经验决策或小组讨论决策相比，该框架具有非冗余性、独立性和完整性的特点，对临床护理决策可操作性、合理性和科学性的实现意义重大[6，11-12]。目前，尚未见国内使用该决策框架的相关报道。本研究旨在基于EVIDEM结构框架形成多准则护理决策评价量表，并对其进行翻译、跨文化调适及信效度检验，以期形成适用于中国文化的护理决策工具，为我国护理领域开展科学合理的决策提供一定的参考。

1 对象与方法

1.1 研究对象采用方便抽样，于2019年9月选取武汉市某三级甲等综合性医院具有护理决策经验的护理工作者作为研究对象。纳入标准:（1）本科及以上学历；（2）中级及以上职称；（3）从事临床护理管理工作≥5年或从事临床护理工作≥10年；（4）知情同意并自愿参与本研究。排除标准：调查时由于出差、休假等原因无法参与本研究者。

1.2 研究工具

1.2.1 一般资料调查问卷自行编制，包括年龄、性别、从事临床工作年限、从事管理工作年限、最终学历、职称、职务。

1.2.2 EVIDEM结构框架 EVIDEM结构框架是EVIDEM组织为促进合理决策文化发展而发掘的一套通用决策标准[13]。该结构框架由2部分共20条标准组成，一部分包含13条核心标准，分为干预的背景、干预的结局比较、干预的益处、干预的经济成本、干预相关的知识5个维度；另一部分包含7条背景标准，分为医疗环境标准下的规范性、医疗环境标准下的可行性和机会成本3个维度。研究者可依据框架应用背景，从7条背景标准中挑选必要的标准与13条核心标准组合形成决策量表条目，并可将标准条目进一步具体化，以反映治疗领域或干预类型的特殊性。使用该框架时，每位决策者对每个标准进行重要性赋值，从非常不重要～非常重要依次赋予1～5分，同时评价干预措施符合各标准的程度，从完全不符合～完全符合依次赋予1～10分。干预措施在某一标准上的得分与该标准权重的乘积为该干预措施在该标准上的标准化得分，将该干预措施在各标准上的标准化得分求和，即为该干预措施的综合价值[6，14]。

1.3 量表形成、翻译及跨文化调适

1.3.1 量表形成采用小组讨论法，请小组成员就选择符合我国基本国情和医疗环境的背景标准展开讨论。讨论小组由2名在读护理硕士研究生和4位护理领域专家组成，4位专家的学位：学士1名，硕士2名，博士1名；职务：外科总护士长1名，护理部副主任3名；职称：副高级职称2名，正高级职称2名。考虑到各标准在我国社会医疗环境中的适用性、可行性和使用意义，讨论小组最终选取3条背景标准（“医疗保健系统的任务和范围”，“适当的干预措施与系统能力”和“政治/历史/文化背景”）与13条核心标准组成量表条目，形成EVIDEM多准则护理决策评价量表。

1.3.2 量表翻译 EVIDEM组织于2017年宣布，EVIDEM框架第10版可在全球范围内经调适后免费使用[6]。本研究采用Brislin翻译模式对量表进行翻译[15]：（1）正译，由母语是中文的2名翻译者（1名具有博士学位的医学院英语老师和1名曾去美国学习的英语专业研究生）独立将英文量表翻译为中文，得到2个翻译版本V1和V2；（2）对比综合，由翻译者和研究者逐条对比版本V1和V2的内容，对条目、量表说明、回答方式中存在的差异及模棱两可的单词、句子进行讨论，直至所有研究者和翻译者对该量表的翻译版本达成一致意见为止，以此形成综合版本V12；（3）回译，由2名完全不了解EVIDEM的翻译者（1名为具有赴美攻读医学博士学位经历的临床医生，1名为研究生学历的高中英语教师）独立将V12回译为英文量表，得到回译版本B-V1和B-V2；（4）由2名未参与前期翻译的双语专家对回译版本B-V1和B-V2进行整合调适形成中文版本量表V3[16]。

1.3.3 跨文化调适组织专家委员会（由2名双语专家与选取背景标准的4名护理领域专家组成）考察中文版本量表V3在内容、语义、概念、经验表达上与量表主题及国内医疗背景相符的程度，综合专家意见对不符合的内容进行调适，形成预调查版本V4。经专家委员会商议，考虑到表达的准确性，将维度“实施护理干预措施的结局比较”修改为“实施护理干预措施得到的改善比较”，将维度“护理干预措施的相关知识”修改为“护理干预措施的理论基础”。考虑到条目的易理解性，将条目“患者感知健康/患者报告结果的比较”改为“患者自我感知结果的比较”。其余条目不做修改。

1.4 预调查和正式调查采用方便抽样法，选择本院20名符合本研究纳入标准的护士长作为研究对象进行预调查，就量表条目的可读性、可理解性及流畅性等向其征求建议，研究者根据反馈信息对预调查版量表中模糊不清、难以理解的表达再次进行微调修订，形成正式调查版本量表V5。在征得研究对象的知情同意后，发放纸质问卷至武汉市某三级甲等综合性医院具有护理决策经验的护理工作者手中，告知其回收问卷时间，问卷中详细注明问卷填写说明、注意事项及研究者联系方式，以方便及时解决护理工作者对问卷的疑问。同时向其强调在整个研究过程中，会对参与者的隐私严格保密。收回问卷时现场进行核验，及时发现问卷中的漏项、空项处，并请受试者现场补充，以保证问卷的有效回收率与质量。共发放问卷200份，回收有效问卷177份，有效回收率为88.5%。

1.5 统计学方法采用Excel 2016双人双录入数据，采用SPSS 23.0分析数据。计数资料采用频数、构成比描述；符合正态分布的计量资料采用均数±标准差描述；偏态分布的计量资料采用中位数和四分位间距描述。量表的项目分析采用临界比决断值（critical ration,CR）法和相关系数法；量表的结构效度采用探索性因子分析，量表的内容效度使用条目水平的内容效度指数（item-content validity index,ICVI）和量表水平的内容效度指数（scale-content validity index,S-CVI）评价；量表的内部一致性信度通过总量表和各维度的Cronbachα系数评价[17]。检验水准α=0.05。

2 结果

2.1 一般资料 177名具有护理决策经验的护理工作者中，女性172名（97.6%），男性5名（2.4%）；年龄33～53（41.07±5.32）岁；从事临床工作时间10～35（20.44±6.85）年，护理管理者从事管理工作时间为5～22（8.89±4.60）年；最终学历：本科147名（83.1%），硕士研究生30名（16.9%）；职称：中级143名（80.8%），副高27名（15.3%），正高7名（3.9%）；职务：护士68名（38.4%），护士长97名（54.8%），总护士长12名（6.8%）。

2.2 中文版多准则护理决策评价量表的项目分析

2.2.1 临界比决断值通过临界比决断值法，将量表总分按降序排列，前27%代表高分组，后27%代表低分组，以独立样本t检验比较高、低2组在每个条目得分的差异。结果显示，高、低2组各条目得分比较，差异均有统计学意义（t=4.665～9.920，均P＜0.001），表明各条目间鉴别度较高[12]。

2.2.2 相关系数分析各条目得分与量表总分的相关性。Pearson相关性分析结果显示，条目1与量表总分的相关系数为0.385，条目2～16与量表总分的相关系数为0.419～0.736（均P＜0.001）。表明条目2～16与量表构念同质性高，而条目1“疾病的严重程度”与量表构念同质性低[12]，经专家讨论后决定删除条目1。

2.3 中文版多准则护理决策评价量表的效度

2.3.1 结构效度本研究使用探索性因子分析法检验量表（15个条目）的结构效度，KMO检验值为0.765，Bartlett检验卡方值为865.04（P＜0.05），提示各变量间有共同因素存在，可进行因子分析。通过主成分分析法及最大方差正交旋转法提取出特征值＞1的公因子共6个，其特征值分别为4.268、1.938、1.626、

1.496、1.143、1.038，累积贡献率为71.929%。需删除在2个及2个以上的因子上载荷＞0.40和在每个因子上载荷＜0.40的条目[12]，结果显示，各条目在对应公因子上的载荷介于0.462～0.875，均＞0.4，且各公因子无双载荷。提取的6个公因子及各因子对应的条目与源量表维度及各维度内条目基本一致，6个维度分别为：实施护理干预措施的结局比较、实施护理干预措施的经济成本、医疗环境标准下的可行性、实施护理干预措施的益处、实施护理干预措施的必要、护理干预措施的理论基础。旋转后的因子成分矩阵见表1。

表1 中文版多准则护理决策评价量表旋转后因子成分矩阵

续表1

2.3.2 内容效度本研究邀请了6名专家采用4分制评分法对量表6个维度和15个条目与量表主题的相关性进行评价，4分表示非常相关，3分表示相关，2分表示不相关，1分表示完全不相关。专家纳入标准：参与过量表汉化及信效度检验主题的课题或发表过相关论文；本科及以上学历；副主任护师及以上职称。最终参与评价的6名专家的年龄为44～53（48.00±3.74）岁，工作年限为26～36（30.00±4.42）年；包括ICU护士长1名，外科总护士长1名，护理部副主任2名和护理部主任2名；6名专家中2名为副高级职称，另4名为正高级职称；3名具有学士学位，2名具有硕士学位，1名具有博士学位。经计算，本量表条目水平的内容效度（I-CVI）为0.833～1.000，平均内容效度（S-CVI/Ave）为0.978，内容效度较好。

2.4 中文版多准则护理决策评价量表的信度本研究中文版多准则护理决策评价量表（15个条目）的Cronbachα系数为0.808，各维度Cronbachα系数分别为0.787、0.803、0.758、0.776、0.685、0.690。

3 讨论

3.1 中文版多准则护理决策评价量表同质性及鉴别度高项目分析是探究高低分受试者在每个条目上的差异或检验条目间的同质性,以实现测验个别条目可靠性的目的。临界比决断值（CR）法一般以条目高低分组的t值作为判断标准，若t＜3.0，则表明题项的鉴别度较差，可以考虑将之删除[17]。本研究各条目t=4.665～9.920，均＞3.0，表明各条目鉴别度较好。相关系数分析时，一般认为，若量表的所有条目是在测量同一种潜在特质，则各条目与此特质间能达到中高度相关。用相关系数表示相关程度，若相关系数＜0.4或条目得分与总分相关未达到显著水平，则表明该条目与构念间呈低度相关，可予以删除[17]。本研究条目1与量表相关系数为0.385，与量表同质性低，最终予以删除。

3.2 中文版多准则护理决策评价量表效度良好效度反映该测量工具能够准确测量到欲测特质的程度。其中，内容效度反映量表测验的内容是否能够达到实际测量目的，通常情况下若量表的I-CVI＞0.78，且S-CVI/Ave＞0.9时，表明内容效度理想[18]。本研究结果显示，中文版量表的I-CVI和S-CVI/Ave分别为0.833～1.000和0.978，因此本量表具有良好的内容效度，能有效测量干预措施的整体价值。结构效度是指量表能测量到的理论上的构念或特质的程度，本研究在通过因子分析探索量表结构效度过程中，共萃取出6个共同因素，可解释71.929%的变异量，各因素负荷量＞0.4。一般认为，所萃取的共同因素累积解释变异量能达到60%以上表明共同因素是可靠的，因素负荷量＞0.4表明条目变量与共同因素间关联密切[17]，且本研究提取的共同因素及各因素中包含的条目与源量表一致，说明从实施护理干预措施的结局比较、实施护理干预措施的经济成本、医疗环境标准下的可行性、实施护理干预措施的益处、实施护理干预措施的必要、护理干预措施的理论基础6个方面评价干预措施的价值符合我国临床环境，本量表具有较好的结构效度。

3.3 中文版多准则护理决策评价量表信度良好信度反映量表测量结果的稳定性以及一致性，量表信度越大，那么其测量的误差越小。Cronbachα系数代表量表的内部一致性信度，一般认为，总量表Cronbachα系数＞0.7，各维度或分量表Cronbachα系数＞0.6时量表可信度较高[12]。本研究中文版多准则护理决策评价量表总Cronbachα系数为0.803，各维度Cronbachα系数均＞0.6，表明总量表与量表各维度内部一致性好。其中实施护理干预措施的必要维度和护理干预措施的理论基础维度的Cronbachα系数稍低（0.685、0.690），可能与这2个维度中条目数较少有关。

3.4 中文版多准则护理决策评价量表的实用意义重大中文版多准则护理决策评价量表从背景、获得改善的比较、益处、经济成本、理论基础和可行性6个维度对护理干预措施进行评价、赋值，与个人经验决策或小组讨论决策相比，可保证护理决策过程的全面性、一致性、系统性与透明化。此外，该量表核心为多准则决策评价矩阵，基于相关运算法则可实现决策者意见的明确和标准化，使干预措施的价值得以量化，更直观、简便地实现不同干预措施的比较与选择[19]。综上，该量表的使用对临床护理决策可操作性、合理性和科学性的实现意义重大。