Likert式计分法应用于卫生健康标准实施效果评估的可行性研究

2022-10-15刘拓朱秋鸿

中国卫生标准管理 2022年16期

刘拓朱秋鸿

卫生健康标准实施效果评估是卫生健康标准全生命周期管理工作的重要组成部分，其结果对于修订完善卫生健康标准体系具有重要意义[1]。既往卫生标准实施评估多以标准使用者为研究对象，以调查问卷为手段，量化研究其对标准实施过程中若干问题的意见。Likert 式计分法是最常用的定量调查方法之一，作为一种等距计分法，Likert 式计分法常设3～7 个等级，用于测量受试者对某一事物的态度观念，其具有编制简单、形式明了、应用广泛的优点[2-3]。既往卫生标准实施评估研究中，多采用简单的描述性统计学方法处理Likert 式计分法的调查结果，且缺少Likert 式调查问卷编制的相关研究。本研究拟结合卫生健康标准特点，梳理归纳Likert 式调查问卷编制过程中的注意事项，并探讨Likert 式计分法数据的分析策略，为进一步完善卫生健康标准实施效果评估方法体系提供参考。

1 资料与方法

1.1 一般资料

选择万方、知网、维普和PubMed 数据库进行系统检索，以“Likert”OR“李克特”为检索词，检索字段为“题名或关键词”，检索时间不限，导出所有检索结果并进行去重。万方、知网和维普分别命中383、288 和190 篇文献，去重后剩余561 篇文献；PubMed 命中163 篇文献。

1.2 方法

人工阅读并梳理上述文献，结合卫生健康标准的特点和既往调查实践经验，运用归纳法总结调查问卷编制过程中的注意事项，提炼Likert 式计分法数据的分析策略。

2 结果

2.1 编制Likert 式调查问卷

2.1.1 编制原则卫生健康标准实施效果评估是一项目的性较强的社会调查活动，旨在获得标准使用者对于标准实施过程中的真实意见。其在编制过程中应该遵循如下原则。

（1）目的明确原则：卫生健康标准实施效果评估调查问卷的设计应紧扣研究目的，可能是针对一项或几项标准的调查，也可能是针对某领域的标准体系的调查；可能是针对普通人群的，也可能是针对特定群体的，如医生、护士、疾控人员。调查问卷要针对不同的调查目的设置问题，对于与调查目的关系不大的问题均应删除。

（2）框架合理原则：卫生健康标准实施效果评估问卷应以相关理论为基础设计框架，一般需涵盖合法性、科学性、可行性3 个维度，每个维度下根据调查目的设置若干小问题。合法性即标准与现行有关法律法规和政策方针不产生冲突；科学性即标准符合现有科学证据；可行性即标准使用者在实际工作中可以方便地使用标准，不存在阻碍标准使用的技术障碍。此外，根据调查目的还可以增加“标准可及性”和“配套技术文件完整性”2 个维度，标准可及性指的是调查对象是否容易从官方途径获取准确权威的标准文本，配套技术文件完整性指的是针对该项标准是否发布配套的标准编制说明、技术指南、培训教材、课件及其视频。

（3）简洁灵活原则：问卷编制需在项目研究需要与调查对象实际情况之间寻求平衡，问题表述简洁准确、易于理解，内容紧扣主题，不宜过多过泛，且要符合调查对象的理解能力和回答意愿。同时，应控制好问卷总长度，使调查对象可以在合适时间内完成，这样既可以减少调查对象填答问卷所需要的时间和精力，也可以降低开展调查的难度。

此外，相对于需在不同调查对象中反复使用的心理学调查量表，卫生健康标准实施效果评估调查问卷重复利用的可能性较小，故其在信度和效度方面的要求偏低。

2.1.2 编制过程中的常见问题及解决方法

（1）问题定位偏失：Likert 计分法并非通用的问卷形式，其主要用于测量调查对象对某事物的态度，不能用于专业水平、知识能力等方面的测量。在卫生健康标准实施评估调查过程中，常常会设置调查对象专业能力相关题项，例如设置为“我的××领域的专业能力在业界广受认可”，提供选项：“非常符合”“通常符合”“说不准”“通常不符合”“非常不符合”，则无论选择哪个选项，该问题都只能说明调查对象对自身专业能力的态度和自我评价，而并非体现其真实的专业能力。建议可将类似问题进行转化，如调查对象专业能力相关题项，可以转为询问调查对象的从业年限、技术职称、使用标准的频率等。

（2）问题界限不清：使用Likert 计分法的调查问题应有清晰边界，调查对象易于理解的调查问题的内涵，切忌一个问题包含多个内容。如同时涉及时间、程度、频率等方面，问题应用数字化的确切范围。如设置题项“近年，我经常使用××标准，认为其科学性、可行性较好”，此种表述会使调查对象感觉无所适从、难以回答，一方面“近年”“经常”“较好”的定义不明确，另一方面“科学性”“可行性”在标准调查中往往属不同的调查范畴，即便调查对象勉强做出选择，调查结果也是不准确的。建议上述问题可以拆分成若干子问题，如“最近一年，我使用××标准的频率为平均每月××次”“我认为××标准在实际工作中使用方便”等。

（3）问题表述不切：调查问卷的题项表述不够简单明了、偏向使用冗长复杂的句子或双重否定句、针对普通人群的调查中过度使用专业术语、同一调查问卷的选项方向不一致等，均会导致调查对象理解困难，甚至产生厌烦情绪而拒绝调查。如“我并不认为××标准不具有科学性”，这样的表述会使调查对象难以理解、不明所以，很可能乱答一气。再如一部分问题的选项从左到右分别是“非常符合”“通常符合”“说不准”“通常不符合”“非常不符合”，另一部分问题的选项从左到右分别是“非常不同意”“不同意”“不清楚”“同意”“非常同意”，两者方向相反，会增加调查对象错填的可能性。

2.2 Likert 式计分数据的分析策略

Likert 式计分法本质上是等级变量，属于计数资料的一种，但在实际分析中往往习惯于对其赋值后再进行统计描述和分析。根据分析时对Likert 式计分数据的处理方式，可以粗略分为以下两种分析方法。

2.2.1 将Likert 式计分视为等级变量等级变量分析方法相对基础，一般采用频数和频率描述数据的分布情况，不同题目（变量）之间的相关性用Spearman 相关性分析，不同组之间的差别用秩和检验进行分析。相对于将Likert 式计分赋值后转化为计量资料进行统计描述，将Likert 式计分视为等级变量的统计描述要相对“啰嗦”一点，多数情况下其需要分别描述不同等级的频数和频率，特别是在不同选项频率相差不大的情况下更是如此。此外，还可以采用关联规则（association rules，AR）、社会网络分析（social network analysis，SNA）等分析不同选项之间的关联关系，并通过网络拓扑图等可视化方法呈现数据分析结果。

2.2.2 将Likert 式计分赋值后转化为计量资料

（1）直接赋值法：按照Likert 式直接赋分，如“非常不同意”“不同意”“不清楚”“同意”“非常同意”分别赋分1～5分，如有三个等级则赋分1～3 分，以此类推。赋分之后可以计算均数和标准差，并进行比较。既往研究表明，Likert 式直接赋分后绝大多数情况下评分不符合正态分布，不能直接使用t检验、方差分析、Pearson 相关性分析，而应该采用秩和检验、Spearman 相关性分析和Kappa 检验[4]。综合评价方面，可以采用雷达图定量分析法。该方法是一种典型的图形综合评价方法，通过将已经归一化的评价对象各维度评价指标绘制于二维平面，并利用图形周长和面积进行定量综合评价，具有直观清晰、易于判断的优势，已经在多个领域广泛应用。如雷达图的各个维度均为归一化的正优指标，则其面积与总体优势成正比，面积一定时，周长与各维度均衡性成反比；即评价对象的雷达图面积越大，总体优势越大大，面积一定时，周长越短，雷达图越接近圆形，其各指标之间越均衡。相关评价函数的计算方法可以参考相关文献[5-7]。

如在针对某卫生健康标准评价过程中，设置了5 个评价维度，分别是合法性、科学性、可行性、可及性、配套技术文件完整性，每个维度下设置若干Likert 式计分法的问题，相关数据详见表1，雷达图见图1。从雷达图中可以明显看出，A 组和B 组调查对象对某卫生健康标准的合法性维度评价最高，对配套技术文件完整性维度评价最低；在可行性和可及性2 个维度，A 组和B 组调查对象得分差别较大。

图1 某卫生健康标准实施情况雷达图

表1 某卫生健康标准实施情况调查表

（2）等级赋分模型：针对某卫生健康标准的调查问卷有3个维度，分别是合法性、科学性、可行性，合法性维度中某问题A 得分普遍为4～5 分，而可行性维度某问题B 得分普遍为2～3 分。两者之间“难易程度”不同，其结果具有一定的不可加性，如果将其直接相加，结果很可能是“程序公正却事实不公正”，与科学评价卫生健康标准实施情况的调查宗旨不契合。等级赋分模型可以解决此类问题，将原始分（如Likert 5 级得分）转化为标准分，以实现不同题目/科目得分之间的可加、可比。

在开始分析之前，首先需要将调查结果进行同向归一化处理，即将调查问卷中的所有问题都转化为高优指标，以5 级计分为例（下同），即以得5 分为最优，得1 分为最劣。设针对某卫生健康标准的调查问卷有n 个问题，分别用i（i=1，2，3……n）表示；有m 个调查对象填写了问卷，用j（j=1，2，3……m）表示；每个问题的评分采用Likert 式计分法，用x（x=1，2，3，4，5）表示。则每个问题的评分对应的调查者数量用Njx（j=1，2……m；x=1，2，3，4，5）表示，其占比用Pjx（j=1，2……m；x=1，2，3，4，5）表示。第i 个问题Likert 5 级评分的平均百分位数和转化后对应的标准化分值分别用Qix和Zix（i=1，2，…n；x=1，2，3，4，5）表示，计算公式详见表2。转化后的标准化分值可以在不同维度之间进行相加减，也可以绘制条形图、折线图、矩阵热力图、气泡图等统计图形进行数据可视化处理。

表2 Likert 5 级评分的平均百分位数和转化后标准化分值计算公式表

（3）多面Rasch 模型（many facet Rasch model，MFRM）：MFRM 是对单参数Rasch 模型的扩展和升级，两者均基于项目反应理论（item response theory，IRT），即考生在某一测试题目上的反应与其某一特质水平之间存在正相关关系，即考生在该测试的正确反应概率（response probability，RP）越高，其某一特质水平越高，同时受到测试题目难易程度、评分者宽严程度、评分等级等方面的影响。

根据项目反应理论，可以构建针对某一卫生健康标准的MFRM，设针对某卫生健康标准的调查问卷有n 个问题，分别用i（i=1，2，3……n）表示；有m 个调查对象填写了问卷，用j（j=1，2，3……m）表示；每个问题的评分采用Likert 式计分法，以5 级计分法为例，用x（x=1，2，3，4，5）表示。

Log[Pijx/Pij（x-1）]=B-Di-Cj-Fj

该程序的模型函数表达式如下：Pijx 是该卫生健康标准在调查问题i 上被调查对象j 评定为x 等（x=1，2，3，4，5）的概率，Pij（x-1）则是被评定为x-1 等的概率；B 是该卫生健康标准的实施情况参数；Di 是调查问题i 的难度参数；Cj 是调查对象j 的宽严程度参数；Fx 是分步计分模型（partial credit model，PCM）中该卫生健康标准得分从x-1 等到x 等的等级难度（step difficulty，StD）参数。

通过MFRM 专用的分析程序Facets 可以对上述模型进行求解和分析。Facets 是一个收费软件，如待分析的数据量较少，可以使用其免费的缩减版分析软件MINIFAC（Min Facets）。MINIFAC 具有FACETS 的全部功能，但是最大只能处理2000个数据点（响应值）。

3 讨论

3.1 卫生健康标准实施效果评估领域对Likert 式调查问卷编制过程研究较少

Likert 式调查问卷由美国社会心理学家Likert 于1932 年在原有的总加量表基础上改进而成[8]，其具有简单、形式明了、易于理解的优点，常用于对某一调查内容的态度、观点的调查，是卫生健康标准实施效果调查评估中最常用的调查方式之一。既往有研究表明，Likert 式调查问卷的编制过程对于调查是否成功具有重要影响，问题定位偏失、界限不清、表述不切、问卷长度过长等问题均会增加调查结果的不确定性[9]。如问卷调查过程中，问卷的设计者和调查对象对于某一问题的不同等级选项的理解存在一定的差异（即语义差异），而Likert 式调查问卷需要调查对象必须明确地从不同等级选项选择其一，很容易造成调查结果的偏差[10]。此外，不同选项的等级数量也会影响调查结果，如分级过少，则分辨率过低，无法有效区分不同调查对象的态度观点，导致调查失败；如分级太多，则量表冗长，调查对象应答依从性下降，也会导致调查失败，多数情况下以5～7 级为宜[9-11]。然而卫生健康标准实施效果评估领域对Likert 式调查问卷编制过程研究较少，特别是对于不同专业卫生健康标准实施效果评估的共性框架、问题表述方式、选项的等级设置等缺少一定的研究探索，不利于系统地开展卫生健康标准实施效果评估，也不利于不同专业领域之间的交流和比较。

3.2 卫生健康标准实施效果评估领域对Likert 式调查问卷数据分析更关注综合评价结果

总体来说，相较于心理学和社会学调查，卫生健康标准实施效果评估调查旨在发现标准实施过程中的“痛点”“难点”“堵点”等薄弱环节，调查过程中更关心提炼概括调查对象及其亚组使用标准情况。因此，卫生健康标准实施效果评估调查数据在分析方法上更加偏重对调查结果的综合评价，而对探索性因子分析和验证性因子分析应用较少。因Likert 式计分理论上具有等距特性，故可以采用原始等级直接赋分累加的方式进行调查结果统计[12]。既往医学领域的文献中，Likert 式调查问卷数据分析以直接赋值法更为常见，其具有简便、直观的特点[13-16]。

3.3 卫生健康标准实施效果评估领域应借鉴其他领域的成熟方法，进一步优化Likert 式调查问卷数据分析

虽然Likert 式计分理论上具有等距特性，但是在实际调查中由于测验依赖（test dependent，TD）、样本依赖（sample dependent，SaD）、语义差异（semantic difference，SeD）的客观存在，Likert 式计分的等距特性有可能难以满足。故教育测量学、心理测量学等方面针对此问题进行了大量的研究和探索，已经形成一些较为成熟的方法。如等级赋分模型脱胎于教育测量学，已经广泛用于高考、中考等选拔性考试中不同选考科目赋分，可以用于解决不同调查问题之间“难易程度”不等的问题，其通过将Likert 式计分转化为标准得分，实现不同调查问题之间的可加、可比[17-18]。MFRM 基于项目反应理论（item response theory，IRT），具有共同的Logit 标尺、分析结果为线性、测试难度与测试对象水平等参数之间相互独立三大特征，该模型经过多年发展，已经用于公务员面试主观评分、英语水平测试等教育与心理测量学领域[19-22]。卫生健康标准实施效果评估领域应借鉴其他领域的成熟方法，进一步优化Likert 式调查问卷数据分析挖掘能力，尽力提取调查数据背后的价值，为完善卫生健康标准管理提供技术依据。