APP下载

基于共词聚类的消费者健康信息研究热点分析

2015-03-13杜志银贺向前

医学信息学杂志 2015年1期
关键词:共词主题词医疗

杜志银 贺向前

(重庆医科大学医学信息学院 重庆 400016)



•医学信息研究•

基于共词聚类的消费者健康信息研究热点分析

杜志银 贺向前

(重庆医科大学医学信息学院 重庆 400016)

应用共词聚类方法对从PubMed数据库中下载的相关文献主题词进行聚类,提取高频主题词并生成共现矩阵,依据黏合力计算公式确定各类的中心词,探索消费者健康信息研究热点,包括不同年龄段信息素养调查、消费者网络健康信息、健康促进等方面。

消费者健康信息;共词聚类分析;热点

1 引言

为了应对不断增长的医疗开支,自我治疗、自我护理逐渐流行起来,大多数人愿意尽量自己负责自己的身体健康。在强调群体健康和预防疾病的同时,医生越来越认识到患者及家人在医疗活动中的潜力,于是鼓励患者积极参与到医疗活动过程中来,医患关系由传统的医生家长模式(医务人员是医疗服务和医疗知识的唯一提供者,患者只是被动接受者)转变为患者参与模式。患者监控自己的健康状态、参与医疗决策、协作治疗等,因此作为购买医疗服务的患者(医疗消费者)对健康信息的需求也随之急剧增长[1]。自20世纪90年代以来,迅速发展的计算机和通讯技术拓宽了人们获取健康信息的途径,患者通过互联网、移动设备等均可以方便获取相关信息,甚至可以与医生进行在线或离线交流,为患者了解自己健康状态、参与医疗决策和治疗等提供了便利。由此可见,信息技术和消费理念促进了当代医疗环境的发展以及医疗模式的转变,也促进了消费者健康信息学的产生与发展。

消费者健康信息(Consumer Health Information)是指潜在的有可能被用于医疗和卫生保健服务等的信息,能帮助患者参与复杂的医疗决策、实现患者与医生的交流、获得临床记录和必要的健康科学知识、理解自己的健康状态,尤其是强调自我治疗和预防疾病的方法和健康相关信息的传播与利用[2]。近些年来,网络健康信息已经成为影响人们对自身健康认识与评估、影响就医行为等方面一个重要信息渠道,受到了世界各国研究者的重视[3-15]。为了对该领域的研究热点有一个清晰的认识,本文拟采用共词聚类方法来进行研究。共词聚类分析方法是根据词语在同一篇文献中出现的频次来反映词语之间的密切程度,用以代表文献的主题内容结构。本文选择PubMed数据库作为数据源,对从数据库中下载的相关文献的主题词和副主题词进行共词聚类,依据黏合力计算公式确定各类的中心词,来探索消费者健康信息研究的热点。

2 研究对象与方法

2.1 研究对象

选择PubMed数据库作为数据来源,用检索词“Consumer Health Information”在PubMed中进行主题检索(检索时间:2014-06-05),对检索到的文献以XML格式导出,以备用于分析。

2.2 高频词语选取与生成共现矩阵

2.3 系统聚类分析

3 结果与分析

3.1 年度分布

按年度文献数量制作柱状图,见图1,可以看出2006年及以前,消费者健康信息相关研究较少,从2007年开始得到快速发展。

图1 消费者健康信息发文量年度分布

3.2 高频词、低频词界分计算

表1 高频、低频词界分计算结果

注:Vn表示不同的词语个数,n表示选取的词的个数。

3.3 系统聚类分析

根据表1,最低频数为81.75,取整,提取频数大于或等于82的高频主题词生成词篇共现矩阵,进行系统聚类,选取合适距离将聚类结果分为14类,计算各类中词语的黏合力,见图2,对各类进行命名。

图2 消费者健康信息高频词系统聚类及黏合力

3.3.1 不同年龄阶段的信息素养调查 该类包含2、3、5、6、8、1、4、9、12、13、14、 17、61号主题词。健康素养是指个人获取基本的健康信息和服务,运用这些信息和服务做出正确判断和决定,以维护并促进自身健康的能力,对政府了解居民健康素养水平、制定健康促进计划具有重要指导意义。例如在我国,原卫生部(现国家卫计委)早在2008年就发布了《中国公民健康素养——基本知识和技能》,各省也展开了各年龄阶段居民的健康素养调查研究工作。国外对此也非常重视,例如Cunningham等[19]调查了加拿大不同种族人群对高血压的认知等。

3.3.2 消费者网络健康信息 该类包含7、10、11、58号主题词,其内容包括网络健康信息需求、搜寻行为与利用研究。例如Valero-Aguilera等[20]发现泌尿系统肿瘤患者对短期的治疗措施、性生活、康复措施等信息较为关心,乳腺癌患者对治疗的长期效果和对其家庭和个人生活影响的信息较为关注。患者的网络健康信息查询行为与疗效没有直接的关联,但是受教育程度较高的年轻患者希望能参与医疗决策制定过程。

3.3.3 健康促进 该类包含33、55号主题词。健康促进是指一切能促使行为和生活条件向有益于健康改变的教育和生态学支持的综合体,通过提供健康信息、疾病预防项目和方便的医疗保健获取等措施,鼓励消费者采取最佳行为来优化其健康状况(包括身体和心理健康)。健康促进项目一般是以国家为主体,如向国民倡导减少脂肪、胆固醇等摄入,增加体育锻炼,以预防、降低血脂异常、动脉硬化、冠心病等疾病发生,对慢性病的发生起到了很好的预防作用。而各类健康相关问题的研究及其相关信息的发布已经成为非常重要的健康促进措施,也成为以国家为主导的健康促进的有效补充。

3.3.4 信息传播与健康教育 该类包含46、49、50号主题词。健康教育是通过信息传播和行为干预,帮助个人和群体掌握卫生保健知识,树立健康观念,合理利用资源,采纳有利于健康行为和生活方式的教育活动与过程。作为公共卫生的一个非常重要的内容,健康教育项目必须经过严格的设计、实施、评价,倡导和鼓励健康的生活方式、政策和环境等。在实施阶段,需要通过培训、大众媒介等进行宣传来改变目标人群的健康知识、态度和行为等,项目结束后再进行效果评估。在信息化的今天,应用社交媒体如Twitter、Facebook等进行健康教育已经成为可能,如Scanfeld等[21]研究了通过Twitter传播抗生素的机制及其效果分析。

3.3.5 自我治疗的社会支持 该类包含31、48、53号主题词。自我治疗是患者根据掌握的医疗保健信息和可获取的资源,自我进行治疗。而社会支持主要是指亲戚、朋友、同事、团体组织等为身体残障或心理疾患的患者提供鼓励和帮助,使其能更好地处理相关疾病。对社会支持的作用和支持强度与各种疾病(如心衰、糖尿病患者)的自我治疗效果及其关系的研究成为热点。

3.3.6 儿童健康知识 该类包含40、56、36、23、45、29号主题词,主要包括儿童对健康及疾病的认知与态度,以及父母对儿童健康及相关疾病的认知、态度与实践,改善儿童健康,培养健康行为,提高儿童疾病的治疗效果。如儿童对口腔卫生以及肥胖知识的调查。

3.3.7 患者教育方法 该类包含24、37、47号主题词,其内容主要涵盖对患者及其家属等的健康教育方法。包括传统的健康教育方法如面对面的培训,而在信息化的今天更多的还是要采用信息化技术,如健康教育类网站以及社交媒体等。Takoo等[22]报道了应用在线信息与交流项目来帮助怀孕母亲预防和管理一些危险征兆,以及将YouTube作为腰椎间盘切除术患者教育的信息来源。

3.3.8 受教育程度与健康教育 该类包含18、22、44、57号主题词。患者教育针对不同文化程度的人群有不同的效果。

3.3.9 年龄、性别、社会经济因素与健康态度 该类包含34、59、26、54号主题词,主要探索年龄、性别以及社会经济因素对健康态度的影响。例如Moon分析不同年龄阶段的高血压流行、认知、治疗和控制趋势。

3.3.10 老年人健康素养 该类包含19、25、28、35号主题词。老年人由于其年龄因素,思维固化、接触社会少,尤其是80岁以上老人,其健康行为和认识与一般人不一样,开展对这部分老人健康素养的调查显得非常重要,如Arnold等[23]普查社区诊所的老年结肠癌患者的健康素养障碍。

3.3.11 互联网消费者健康信息利用 该类包含30、39、38、51号主题词,其研究内容包括各类疾病的患者对互联网工具和信息的利用、障碍及其影响因素,以及用户网络健康信息搜寻行为。如Bert等[24]调查了意大利孕妇的网络应用及对其决策制定的影响;魏萌萌等[6]、李凤萍[10]分别对国外网络健康信息搜寻行为进行了研究。

3.3.12 医患沟通交流 该类包含32、52、21、27、16号主题词,其研究内容包括医患沟通交流、患者教育以及如何通过健康信息学习让患者参与到临床决策过程中去。医患关系是当前医疗活动中非常突出的话题,进行有效的医患沟通与交流,其中非常重要的是医患之间的等量(或对称)信息,这样患者才能相信医生并参与到临床治疗决策制定过程中,彻底缓解医患关系,而等量信息非常重要的来源就是高质量的网络健康信息。

3.3.13 消费者健康信息标准与方法 该类包含15、23、20、42号主题词,其研究内容主要针对具体疾病建立网络健康信息的质量评价及其评价体系,包括健康类网站的评价,以及相关疾病网络信息的可读性、适用性、可达性和质量评价等。如Chong等[25]对拇囊炎网络信息进行了评价;孙丽等[13]探索了国外网络健康信息质量评价系统的应用现状。

3.3.14 健康类相关网站内容组织管理与可用性 该类包含41、60号主题词,其内容包括健康类网站框架结构的选择与评价、探索主题词、本体等工具在健康类网站的信息组织利用,以及如何对高质量信息添加质量标签(如HON标签、DISCERN标签)来帮助消费者明确该信息的可信度。健康类网站的组织架构、内容组织方式将直接影响到用户的使用体验、用户黏度和效果。

4 结语

本文应用共词聚类分析方法对来源于PubMed的消费者健康信息文献的高频主题词与副主题词等进行了聚类分析,找出研究热点。选取词频大于或等于82的前61个词语(累积频次达到48.56%)作为高频主题词,涵盖面较为全面与合理。正是因为选取高频词语的原因,没有进行分段时间的动态分析,所以不排斥一些在本研究中出现的低频词成为将来的研究热点,这是本研究的局限所在。使用本研究方法是反映当前研究的热点,如果要进行全方位的领域发展预测,还应该结合一些突发词的检测与跟踪技术作为手段来进行科研跟踪。

1 管鹏程,许蓉,雷剑波. 消费者健康信息学的发展和进展[J].中国数字医学,2011,6(4):64-66.

2 Consumer Health Information[EB/OL].[2014-06-26].http://www.ncbi.nlm.nih.gov/mesh/?term=Consumer+Health+Information.

3 张馨遥,曹锦丹,王佩鑫.健康网站信息服务满意度评价指标体系研究[J].情报杂志,2010,(10):29-10.

4 刘艳丽. 网络用户健康信息质量评价模型[D].长沙:中南大学,2008.

5 张会会,马敬东,邸金平.网络健康信息质量评估研究综述[J].医学信息学杂志,2014,35(3):2-5.

6 魏萌萌,魏进. 国外网络健康信息搜寻行为研究及其对我国的启示[J].医学信息学杂志,2014,35(3):12-16.

7 任冠华. 健康信息开发利用标准体系框架研究[J]. 医学信息学杂志,2011,32(1):3-8.

8 张洪武,冯思佳,赵文龙,等. 基于网络用户搜索行为的健康信息需求分析[J].医学信息学杂志,2011,32(5):13-18.

9 曹岩,杨军. “健康信息报导”的目标和定义新探[J].医学信息学杂志,2000,21(5):26,22.

10 李凤萍.国外网络健康信息行为研究[D].北京:中国人民大学,2013.

11 王立宇.面向公众的网络医疗健康信息质量分析[J].哈尔滨医药,2013,(6):33-36.

12 张会会,马敬东,蒋春红,等. 健康类网站信息质量的评估研究[J].医学信息学杂志,2013,(7):34-37.

13 孙丽,曹锦丹.国外网络健康信息质量评价系统的应用现状及启示[J].医学与社会,2011,(7):15-17.

14 宋立荣.网络信息资源中信息质量评价研究述评[J].科技管理研究,2012,(22):51-56.

15 肖璨,马昱,胡俊峰,等. 中国公众健康素养综合评价指标体系研究[J].中华预防医学杂志,2009,(3):227-231.

16 崔雷,刘伟,闫雷,等. 文献数据库中书目信息共现挖掘系统的开发[J]. 现代图书情报技术,2008,(8):70-75.

17 钟伟金,李佳. 共词分析法研究(一)——共词分析的过程与方式[J].情报杂志,2008,27(5):70-72.

18 Donohue JC. Understanding Scientific Literatures: a bibliometric approach[M]. Cambridge: The MIT Press, 1973: 49-50.

19 Cunningham CT, Sykes LL, Metcalfe A,et al.Ethnicity and Health Literacy: a survey on hypertension knowledge among Canadian ethnic populations[J].Ethn Dis, 2014,24(3):276-282.

20 Valero-Aguilera B, Bermúdez-Tamayo C, García-Gutiérrez JF, et al.Information Needs and Internet Use in Urological and Breast Cancer Patients[J]. Support Care Cancer, 2014,22(2):545-552.

21 Scanfeld D1, Scanfeld V, Larson EL.Dissemination of Health Information Through Social Networks: twitter and antibiotics[J]. Am J Infect Control,2010,38(3):182-188.

22 Takoo S, Chhugani M, Sharma V. Effect of Information Education and Communication (IEC) Programme on Knowledge of Pregnant Mothers Regarding Prevention and Management of Warning Signs During Pregnancy[J]. Nurs J India, 2013 ,104(6):284-288.

23 Arnold CL, Rademaker A, Bailey SC, et al.Literacy Barriers to Colorectal Cancer Screening in Community Clinics[J].J Health Commun, 2012,17(Suppl 3):252-264.

24 Bert F, Gualano MR, Brusaferro S, et al.Pregnancy e-health: a multicenter Italian cross-sectional study on Internet use and decision-making among pregnant women[J].J Epidemiol Community Health, 2013,67(12):1013-1018.

25 Chong YM, Fraval A, Chandrananth J, et al.Assessment of the Quality of Web-based Information on Bunions[J].Foot Ankle Int,2013,34(8):1134-1139.

Hot Spots Analysis for Consumer Health Information Research Based on Co-word Clustering

DUZhi-yin,HEXiang-qian,

CollegeofMedicalInformation,ChongqingMedicalUniversity,Chongqing400016,China

The paper carries out co-word clustering analysis on the subject headings of relevant papers downloaded from PubMed database, extracts high frequency subject headings and generate co-occurrence matrix, according to the bonding strength calculating formula, the center word for each category is determined, so as to explore the hot spots of consumer health information, including information literacy investigation for various ages, consumer network health information, health promotion, etc.

Consumer health information; Co-word clustering analysis; Hot spots

2014-10-08

杜志银,副教授,发表论文20余篇。

R-058

A 〔DOI〕10.3969/j.issn.1673-6036.2015.01.011

猜你喜欢

共词主题词医疗
关键词的提取与确定
《中国医学计算机成像杂志》2020 年第26 卷主题词索引
基于突变检测与共词分析的深阅读新兴趋势分析
基于Matlab的共词矩阵构造
京张医疗联合的成功之路
我们怎样理解医疗创新
医疗扶贫至关重要
《中国骨与关节杂志》2016 年第五卷英文主题词索引
基于共词知识图谱技术的国内VLC可视化研究
基于GEPHI的共词可视化分析:以文献计量学作者合作关系为例