APP下载

国外在线医疗健康信息易读性研究

2019-04-25侯胜超

医学信息学杂志 2019年3期
关键词:主观因素公式单词

黄 燕 侯胜超

(华中科技大学同济医学院 医药卫生管理学院 (华中科技大学同济医学院同济医院图书馆武汉 430030) 武汉430000)

1 前言

随着互联网技术的迅速发展,中国网民数量逐渐上升,据报告显示截至2018年6月我国网络用户人数达8.02亿,互联网普及率达57.7%[2]。在互联网使用过程中,信息搜索是用户最普遍的行为之一。近年来医疗健康信息的搜索比例逐年上升,互联网已经发展成为公众获取医疗健康信息的重要渠道,公众逐渐利用互联网获取医疗健康信息来进行健康管理和疾病预防。2017年度《中国网民科普需求搜索行为报告》调研数据显示中国网民搜索的科普主题中健康与医疗的搜索指数排名高居第1,在8个主题的搜索中占比为63.16%[3]。此外美国Pew研究中心发布的报告显示在互联网上搜索有关健康和医疗信息的美国患者比例高达75%[4]。

尽管当前我国在线医疗健康信息普及率逐渐提高,用户能够快速、便捷、低成本地获取在线医疗健康信息,但如何促使公众充分理解这些信息并产生健康行为成为亟需解决的关键问题之一。在线医疗健康信息泛指所有在移动互联网产生的与医疗和生命健康相关的医疗健康信息,其中最引人关注的是与患者紧密相关、围绕患者个人疾病状况和医生诊疗活动形成、有关患者生理、心理、个人基本情况、医生针对特定患者临床疾病工作总结的识别化信息[5]。易读性指文本阅读和理解的容易程度,用于文本的理解程度评估。国外相关在线医疗健康信息易读性的研究较为成熟,但国内较为匮乏,本文系统综述国外在线医疗健康信息易读性相关研究,为国内相关学者和实践者提供参考。

2 数据获取与研究方法

2.1 数据来源和检索策略

根据在线医疗健康信息的学科特点,本文主要选择Web of Science和PubMed两大数据库进行文献检索。其中Web of Science检索式为:TS=(readability AND (online OR web OR Internet OR website) AND (" Medical information" OR " Health information "));PubMed中检索式为:(((" Medical information" OR " Health information ") AND (online OR web OR Internet OR website) AND readability)。文献时间范围为2010-2019年,采用NoteExpress分析软件去除重复文献。

2.2 纳入和排除标准

本研究的纳入标准为:围绕医疗健康信息;研究内容涉及易读性,对此进行深入研究;以英文发表。排除标准为:除易读性还涉及其他研究范围;篇幅只有一两页,内容不完整;涉及非医疗健康信息的易读性,以及仅提及概念而不深入研究的论文。

2.3 检索结果和文献选择

文献筛选流程,见图1。

图1 文献筛选流程(篇)

2.4 数据提取和分析

提取66篇文献[6-71]基本信息,包括作者、年份、国家、信息主题、易读性公式、影响因素、搜索引擎与研究数量等。作者大多通过Google、Bing等常用搜索引擎采用相关关键词搜索来选取相关网站,少数直接利用相关健康主题比较权威网站的在线医疗健康信息进行易读性分析。

3 结果分析

3.1 时间与地区

根据纳入文献的年度发文量统计数据绘制出历年相关论文时间分布,见图2。可以看出在2017年(n=15)达到峰值,2018年之前整体大致呈现上升趋势,2018年有所下降(2019年数据不完整,并非表示2019年呈下降趋势)。由于截止2019年2月已有3篇文献,预计2019年会有所上升。就地区而言,刊登在线医疗健康信息相关研究的文献主要集中在美国,49篇(74.24%),位居首位,其次英国6篇(9.09%)、西班牙3篇(4.55%)以及日本2篇(3.03%),其他包括瑞典、中国等国家均只有1篇。某种程度上说明美国在线医疗健康信息易读性研究居世界领先地位。

图2 时间分布

3.2 信息主题

在线医疗健康信息易读性研究主题较为分散,范围广泛,主题分布,见图3。可以看出综合患者教育类研究最多,有8篇文献,其次为乳腺和皮肤相关主题,分别是7篇和4篇。由于现代社会的生活压力和不良生活习惯,患病几率逐渐增大,患者通过网络获取医疗健康信息已成为主要途径。

图3 信息主题分布 注:仅统计≥2篇的信息主题

3.3 易读性影响因素

易读性研究内容主要包括影响因素和测量,在线医疗健康信息的易读性影响因素受到该领域研究者们的重视,主要归为主观和客观两类。主观因素指个人因素,即公众自身的健康素养、文化水平、教育背景、语言能力、内容熟悉度、兴趣爱好以及阅读动机等。主观因素对于不同读者的理解程度影响大小不同,即使同一个文本,对于不同读者其易读性存在差异。研究者表明[72]读者因素个体差异性大、变量多、各变量之间关系复杂,难以测量,故大多易读性公式不考虑主观因素。客观因素是指脱离具体对象、不因人的主观意志为转移、一切实际存在的影响文本易读性的因素的总和[72]。根据文献分析客观因素又包括文本和非文本因素。其中文本因素包括词长、句长、音节、简单单词、复杂单词、不熟悉单词(医学术语)、句子结构等,易读性公式主要考虑文本因素的影响。非文本因素包括大小标题、空白区域预留、符号、字体和颜色、图表、视听材料等布局设计因素。大部分研究者对在线医疗健康信息易读性的研究停留在文本因素层面,仅提及个人因素和客观的非文本因素,没有进行深入研究。

3.4 易读性公式

易读性公式是用代数方程量化文本因素与易读性之间的关系[72]。相比其他易读性评估方法,易读性公式能够较为准确地量化文本的易读性。所选文献中采用的易读性测量公式,见表1。可以看出Simple Measure of Gobbledygook(SMOG)和Flesch-Kincaid Grade Level formula(FKGL)是应用较多的公式,此外还有Flesch Reading Ease formula(FRE)、Gunning Fog Index(GFI)以及Coleman-Liau Index(CLI)等。FKGL是经过验证的常用公式,也是Microsoft Office Word的内置易读性测量公式。其考虑每个句子的平均单词数和每个单词的平均音节数,以评估给定文本的易读性,得分体现为年级水平。SMOG较受欢迎,能够准确评定完整文本理解所需的年级水平。SMOG公式包括计算3个10句样本中3音节以上单词的计数,计算计数的平方根并加3以获得年级水平。FRE使用平均句子长度和每个单词的平均音节数计算,得分体现为0~100,分数分类:90~100=非常容易;80~89=容易;70~79=相当容易; 60~69=标准;50~59=相当困难;30~49=很难;0~29=非常难。GFI和CLI均考虑句子和单词长度,得分也都体现为年级水平。这些易读性公式在医疗保健信息领域广泛使用,如Dobbs T等[8]采用FRE、Coleman-Liao Index和SMOG测量在线皮肤癌相关信息的易读性;Weiss K D等[9]采用10几种易读性公式对在线肺癌相关信息易读性进行测量。目前所流行的这些英文相关易读性公式仅针对主观文本因素进行分析,未考虑文本之外的因素,如读者的个人因素。因此易读性公式比较适用于除文本因素外的其他因素相似人群。由于汉语与英语存在差别,国外易读性公式并不能直接用于测量国内医疗健康信息,但仍可借鉴其所考虑的因素,开发出汉语易读性测量公式或测量方法。

表1 国外常见易读性公式

注:不熟悉单词数:基于平均四年级学生水平的3 000个常用单词列表;复杂单词数:超过3个音节

4 讨论

4.1 在线医疗健康信息易读性研究特征

国外研究结果几乎都显示出在线医疗健康信息易读性高于权威机构所推荐的阅读水平,公众对医疗健康信息的理解存在困难,主要受大量复杂的医学术语、句子长度等文本因素及大小标题、空白区域预留等非文本因素以及个人健康素养能力等主观因素的影响。就文献研究而言,国外在线医疗健康信息易读性研究在2017年达到峰值,主要集中在美国,研究主题较为分散。研究者们大多采用易读性公式进行评估,主要考虑简单词数、复杂词数、音节数以及句子数等文本因素的影响。国内方面吴浩等[73-75]对在线医疗健康信息易读性进行评估,主要采用公式考虑单词或句子数量、难词以及结合中文笔画等特点进行易读性量化测量,研究结果显示信息易读性较低。

4.2 提高在线医疗健康信息易读性的建议

一是尽量使用简单常用词语、短句。医疗健康信息相对于其他信息而言,存在大量的医学术语,超出公众的理解范围。另外存在部分文章格式不合理的情况,有些文章从头到尾只有一段话、一个句号。现代社会学习、工作压力大,生活节奏快,时间安排紧凑,文字密集以及含有大量非常用词(医学术语)的文章将花费过多的阅读时间和精力,大大削减公众的阅读欲望。二是对专业术语进行解释。鉴于医疗健康信息难免使用医学术语,可以对其采用指导性语言来进行解释说明。采用图片、图表与通俗易懂的文字相结合,或者插入讲解视频对其进行解释,将大大增加读者的阅读理解和兴趣。三是考虑大小标题和空白预留。使用大小标题便于梳理文本信息,分类突出概括长文的主要内容,行文条理清晰,读者一目了然。大小标题的使用能够使段落之间留有足够的空白区域,减少文字密集感,使读者处于一种轻松的阅读状态。四是提高公众健康素养能力。健康素养是指个人获取和理解基本健康信息和服务并运用这些信息和服务做出正确决策以维护和促进自身健康的能力[76]。相关调查结果显示2017年我国居民健康素养水平为14.18%[76],虽然相比2016年有所提高,但仍然处于较低水平。因此医疗机构和相关部门应定期组织针对公众健康教育活动以提高公众健康素养能力。部门间的合作宣传有利于公众健康素养的提高,如在地铁上发布健康教育知识海报能够在无意间促进公众健康知识的积累。

4.3 研究发展

国外在线医疗健康信息易读性研究主要采用公式进行测量,但这并不能完全代表医疗健康信息的难易程度,其他客观因素如图表、页面布局、字体和颜色等以及主观因素包括读者的教育水平、健康素养能力等也对在线医疗健康信息的易读性存在一定影响。目前对于客观的非文本因素的测量缺乏有效工具,主观因素受个人影响较大,学者们整体上对医疗健康信息易读性的评估仍然不够全面。在线医疗健康信息易读性的评估除采用公式考虑文本因素外,其他对客观非文本因素和主观因素进行测量的研究寥寥无几。国内对于在线医疗健康信息易读性评估的研究相对较少,基本借鉴国外易读性公式,国内易读性公式尚不成熟且存在差异,同样对非文本因素和主观因素的影响考虑欠缺,缺乏有效的测量方法和工具。因此可以从开发测量方法和工具对非文本因素和主观因素两个方面开展研究。

5 结语

目前该领域研究呈逐年上升趋势,大部分研究结果表明在线医疗健康信息不易理解,还有待提高。评估方法主要以客观的公式为主,缺乏对于主观因素的影响研究,如何有效地量化和测定各种影响易读性的非文本因素和读者因素依然存在挑战。今后可从客观的非文本因素和主观因素等方面开展研究。

猜你喜欢

主观因素公式单词
组合数与组合数公式
排列数与排列数公式
等差数列前2n-1及2n项和公式与应用
单词连一连
例说:二倍角公式的巧用
看图填单词
看完这些单词的翻译,整个人都不好了
国家投资项目投资超概算的主观因素分析及对策建议
单词拾趣