系统性红斑狼疮网络健康信息的可读性评估
2020-12-21汪秋伊许良梅谢伦芳
王 蕾,汪秋伊,李 星,许良梅,谢伦芳
(安徽医科大学护理学院,安徽230601)
系统性红斑狼疮(systemic lupus erythematosus,SLE)是一种复杂的、累及多器官和多系统的自身免疫性疾病[1-2],其病程长、病情反复,严重影响病人的生活质量。课题组前期研究发现,健康素养水平较低的SLE 病人疾病活动度较高,健康结局较差[3]。因此,提高SLE 病人的健康素养水平十分必要。有效的健康教育是提高健康素养的基础[4],而健康教育的有效性在于其传播的健康信息能被公众真正理解并运用。可读性则是衡量健康教育信息是否易于理解的重要指标[5]。可读性又称易读性、易懂性,是指健康信息相对于读者易于阅读和理解的程度[6]。影响可读性的因素有很多,主要分为文本因素(词汇难易度、文本信息的准确性等)与非文本因素(图片、色彩、版面布局及文本情感等)两大类[7]。网络由于其便捷、迅速等特点,目前已成为慢性病病人获取健康信息的重要来源[8],越来越多的SLE 病人通过网络获取健康信息[9]。可读性高的健康信息有助于病人理解并产生更好的健康结局[10]。国外学者研究发现,SLE 网络健康信息的可读性不佳,病人不易理解[11-13],但国内尚未见相关报道。临床护士作为健康教育服务的主要提供者,需要为病人选择或编写可读性强的网络健康信息。鉴于此,本研究从文本因素与非文本因素两方面评估国内SLE网络健康信息的可读性,旨在了解目前SLE 网络健康信息的可读性水平,一方面为改进国内SLE 网络健康信息可读性提供依据;另一方面为临床护理工作者提升网络健康教育效果提供参考。
1 材料和方法
1.1 网页筛选 2015 年、2016 年中国网民搜索行为调查报告显示,百度、“360”和搜狗是公众使用排名前3 位的搜索引擎,且用户平均浏览页数为2.93 页[14-15],故本研究选择这3 个搜索引擎作为检索平台并纳入每个搜索引擎前3 页的搜索结果。网页纳入标准:①内容为SLE 相关的疾病简介、用药、检查、护理等健康教育信息;②供病人阅读。排除标准:①无法访问(如无效链接、有密码限制或需购买等);②内容仅为医患问答、个人经验分享;③内容仅为视频或图片;④内容为新闻报道或供专业人士阅读的学术文章等。以“系统性红斑狼疮”“SLE”“红斑狼疮”作为检索词,在三大搜索引擎中进行检索,共检索到270 个网页。经过剔除重复网页,根据纳入及排除标准进行筛选后,共纳入60 个网页,网页筛选的详细步骤见图1。
图1 网页筛选过程
1.2 研究工具
1.2.1 NLPIR 大数据语义智能分析平台及SQL Server数据库管理系统 采用NLPIR 大数据语义智能分析平台(以下简称NLPIR)及SQL Server 数据库管理系统(以下简称SQL Server)对SLE 网络健康信息进行可读性的文本因素评估。NLPIR 是目前公认的最好的汉语词法分析系统[16],具有批量分词、语言统计、文本聚类、情感分析等功能。本研究使用该工具的批量分词功能,包括对原始语料进行分词,自动识别人名、地名、机构名,标注新词及词性等。SQL Server 是一个全面的数据库平台,可对数据进行结构化处理,本研究主要应用其结构化查询和统计功能,得出SLE 网络健康信息的文本特征。
1.2.2 健康教育材料适用性量表(Suitability Assessment of Materials,SAM) 采用SAM 对SLE 网络健康信息进行可读性的非文本因素评估。SAM 于1996 年由Doak 等[17]开发,用来评估健康教育材料的可读性,后经李现文[18]汉化,形成中文版量表。包括22 个条目,由材料内容、素养需求、图表、布局设计、学习激励和动机以及文化适宜性6 个维度组成,每个条目均采用3 级评分(适用很好计2 分,适用计1 分,不适用计0 分),若出现无法根据条目标准进行评估的内容,则计为不合适(N/A),并在计总分时减去2 分。量表各维度得分和总分以得分率(材料得分/总分×100%)的形式呈现,分为优(70%~100%)、适合(40%~69%)、不适合(0~39%)3 个等级。SAM 量表最初设计时用于评估纸质版健康教育材料,之后国外研究者将其应用于网络健康信息的评估,故课题组在评估SLE 网络健康信息时借鉴其他学者[19]的研究方法,对相关条目进行调整,删去SAM 原量表中的“封面图片”条目。此外,由于SAM 原量表中对阅读级别的评估采用Flesch-Kincaid可读性公式进行计算,而国内尚无合适的中文可读性公式,故研究者删去原量表中的“阅读级别”条目,采用张宁志[20]建立的算法测量文本难易度。本研究使用的SAM 量表最终包括20 个条目。同时,原量表的“图表”维度中,若没有出现图片,则直接计为“N/A”,计总分时减2 分。但Dowen 等[21]的研究指出视觉辅助工具(如照片、漫画等)有利于读者理解材料内容,而可读性强的材料应包含与文字内容相关的图片,故在“插图类型”“插图的相关性”“插图标题”3 个条目中,若没有图片,则计为0 而不计为N/A,保证计分时分母不会降低。
1.2.3 “5C”图片评估清单 图片的使用有利于读者对文本的理解及记忆[22],故本研究除使用SAM 评估SLE 网页中的图片外,还使用“5C”图片评估清单进行辅助评估。该清单由Morony 等[23]于2017 年开发,条目参照美国疾病控制和预防中心建立的易理解材料开发指南Simply Put[24]进行设置。包括清晰、贡献、矛盾、标题及文化5 个条目,分别为“图片容易被看出是什么”(如使用生活场景中的图片)、“图片有助于加强文档的含义”(如图片能加深读者对文字的记忆与理解)、“图片与文字传达的信息矛盾”(如文字表达为提供低钾食物,但图片却提供高钾食物,且没有标注及提示)、“图片有标题”(如使用简短的标题概括图片信息)和“图片是文化适宜的”(如图片中出现的人物与读者群体来自同一种族/民族)。
1.3 评估过程
1.3.1 文本因素评估 主要按照建库、分词、校对、统计、计算5 步进行。参照吴浩[7]的研究,使用SQL Server建立词库,建库时以《汉字等级大纲》作为词汇基础,根据词汇的难易程度分为甲级、乙级、丙级和丁级词;使用NLPIR 对SLE 各个网页的健康信息进行自适应分词;校对时使用《信息处理用现代汉语分词规范》标准[25]对分词结果进行人工校对;统计时,使用SQL Server 对每个网页包含的各级词汇出现的频次进行统计,根据句号、分号、感叹号、问号、省略号的出现频次统计总句数,并使用Microsoft Word 统计每个网页的总字数;计算时,使用张宁志[20]建立的算法计算文本难易度,分别计算平均句长(总字数/总句数)、平均每百字句数(总句数×100/总字数)、平均每百字非常用词数(非常用词数×100/总字数)及难度系数(平均句长+平均每百字非常用词数),平均句长>16.7 字、平均每百字句数<6 句或难度系数>30 都表示材料为高级材料,较难阅读[7]。
1.3.2 非文本因素评估 由2 名经过培训的研究者使用SAM 量表和“5C”图片评估清单对SLE 网页进行独立评估。采用Cohen′s Kappa 系数测量SAM 量表的评定者间信度[26],≥0.41 表示一致性程度为中等水平[27],再由两名研究者对不一致的评分点进行讨论得出最终结果。此外,两名研究者若对“5C”图片评估清单的评估结果存在分歧,则通过讨论达成一致。
1.4 统计学方法 运用Epidata 3.1 软件进行数据录入,IBM SPSS 24.0 统计软件进行数据分析,Stata 15.0软件进行评定者间一致性测量。本研究中的计量资料符合正态分布者,使用均数和标准差描述,非正态分布者使用中位数和四分位数描述;计数资料使用频数、构成比和率进行统计描述。
2 结果
2.1 SLE 网络健康信息的文本难易度评估 平均句长>16.7 字、平均每百字句数<6 句或难度系数>30表示材料为高级材料。各网页的平均句长为(37.02±9.46)字,所有网页的平均句长均大于16.7 字;每百字句数为(2.85±0.61)句,所有网页均小于6 句;每百字非常用词数为(25.69±3.44)词,每百字中有1/4 是非常用词,大多数是医学专业词汇;难度系数为(62.71±8.71),所有网页均大于30。以上结果提示,各网页均属于高级材料,较难阅读。具体分词及难度测定结果见表1。
表1 SLE 网络健康信息文本难易度测定结果
2.2 SLE 网络健康信息的非文本因素评估 SAM 量表整体评定者间信度为0.715,各条目为0.497~1.000,一致性程度较好。60 个网页的整体得分率为(40.73±14.84)%,其中31 个网页被评为“不适合”(10.00%~37.50%),27 个网页达到“适合”的等级(40.00%~67.50%),2 个网页被评为“优”(70.00%,72.50%),详见图2。量表各维度得分情况亦有差异,其中,得分率最高的为文化适宜性维度(49.58%),最低的为图表维度(17.92%),其他维度得分率依次为布局设计(47.22%)、材料内容(46.67%)、素养需求(46.25%)、学习激励与动机(43.33%)。在图表维度中,“插图类型”“插图的相关性”“图表解释”“插图标题”条目得分率均较低;其他维度的得分率虽达到“适合”的等级,但大多数维度均有得分率较低的条目。如材料内容维度中的“内容主题”“总结回顾”条目,素养需求维度中的“词语”“句子构造”条目,布局设计维度的“列举与标题”条目,学习激励与动机维度的“材料中的互动”“动机”条目等。
图2 各网页SAM 得分情况
2.3 SLE 网络健康信息的图片评估 60 个网页中仅33 个(55.00%)网页包含图片,图片总数为139 张。其中,清晰的图片有101 张(72.67%),能加强文档含义的有56 张(40.29%),54 张(38.85%)图片有标题,105 张(75.54%)图片符合我国大众的文化。在所有图片中,76 张(54.68%)图片与文字描述内容相矛盾,如在介绍禁忌饮食时,配图为该禁忌食物,但图片上没有禁止食用的符号,或者图片与文字毫无关联。
3 讨论
3.1 SLE 网络健康信息文本阅读难度高 对SLE 网络健康信息进行文本因素评估后发现其属于高级阅读材料,处于较难阅读的水平。造成文本难度高的原因可能与下列因素有关:首先,SLE 网络健康信息中出现过多的医学专业知识,如SLE 的发病机制、病理改变、中医学相关知识等,这是导致非常用词比例增高、文本难度系数增大的主要原因,直接影响其可读性水平。简单常见的词语可促进读者对信息的理解[28]。因此,未来在编写或改进网络健康信息时,应减少医学术语的使用,多使用常用词汇,如汉字等级大纲中的甲级词、乙级词等。必须使用医学术语时也要对其进行简短的解释,帮助读者理解。其次,SLE 网络健康信息大多应用长句,经常出现一段内容仅使用逗号的情况,这会导致句子变长且逻辑混乱[29],影响读者对信息的理解。故今后在句长方面,要注意标点符号的使用,及时断句,避免由于句子过长增加文本阅读难度。
3.2 SLE 网络健康信息非文本因素可读性欠佳 对SLE 网络健康信息进行非文本因素评估后发现,SAM整体得分达到“合适”的等级[(40.73±14.84)%],但处于“合适”等级中的低水平,且较多SAM 条目的得分较低,这与国外学者的研究结果[13,30]一致。在所评估网页中,SLE 网络健康信息的主题较少涉及对病人有益的行为技能的介绍,如病人的皮肤护理、饮食指导等,较多篇幅为复杂医学知识,且在阐述相关内容后缺少对关键信息的总结回顾,增加了阅读难度,影响读者的阅读兴趣。同时,网页内容大多以长段落的形式出现,对复杂的内容缺少细化,缺少小标题的引导,缺少视觉提示(如阴影、箭头)等,读者很难快速获取重要信息。大多数网页的字号偏小,这会在一定程度上降低可读性。学习激励及动机与健康教育信息的可读性关联密切[31],而SLE 网络健康信息中缺少案例或问题等与读者互动的设计,这可能会导致读者失去阅读兴趣及动力。创建或改进健康教育网页时,目的要明确,关注读者能获益的健康行为信息,关键信息要有总结,这样有利于读者增强对信息的记忆[32],提高材料的可实施性。在布局设计方面,要使用小标题且对内容进行细化,可适当使用方框、颜色、箭头等视觉提示信息进行标注,突出重点。同时应增大字号,至少使用12 号字。在学习激励与动机方面,可提供真实案例或提供让读者进行思考并回答的问题等,让读者能与材料互动,提高其阅读兴趣。
3.3 SLE 网络健康信息图片使用情况不佳 图表是SAM 评估中得分最低的维度,属于“不适合”的等级,且在使用“5C”图片评估清单进行统计分析时,也显示网页图片存在较多问题。本研究纳入的60 个网页中,仅33 个网页使用了图片且图片质量参差不齐。图片的使用有助于读者的记忆、决策及行为改变,与较高的可读性密切相关[33],但不适当的图片会导致读者对文本信息注意力的分散[24]。本研究的139 张图片中,大多数图片清晰且符合我国文化,但也存在图片模糊、过小及使用局部解剖图等问题。仅56 张(40.29%)图片能加强文档的含义,这些图片的位置多与文本相邻,展示的内容与文字紧密相关。但是,大多数图片与文字毫无关联,且有超过半数的图片与文字内容相矛盾,这可能会造成读者的困惑甚至误导读者。因此,网络健康信息应图文并茂,图片应与文字紧密联系,避免使用解剖图、病理图等,图片要清晰、有标题,且应适应读者的文化。
4 小结
本研究结果显示,SLE 网络健康信息整体可读性水平较低,在文本难度、布局设计、图片使用等方面仍存在诸多问题,可从词语使用、句子构造、内容、布局设计以及图片等多方面着手,提高其可读性水平。护理工作者应知晓影响网络健康信息可读性的主要因素,向病人推荐可读性高的健康教育网页,或是在参与网络健康信息编写时注意避免降低可读性的因素,促进病人对信息的理解,进而提高病人的健康素养水平。本研究中,由于网络的动态更新,以及仅选取搜索引擎前3 页的结果,可能会遗漏相关有效网页,未来可改善检索策略,进一步扩大纳入的网页数量。此外,也可从SLE 病人角度出发,评估其对网络健康信息可读性的看法。