艾滋病健康信息需求研究*
2020-11-25刘艳丽袁文娟
刘艳丽 袁文娟
(杭州医学院图书馆 杭州310053)
1 引言
艾滋病是由艾滋病病毒即人类免疫缺陷病毒(HIV)引起的一种病死率极高的恶性传染病,目前没有疫苗可以预防,也没有治愈该疾病的有效药物和方法,严重危害公众健康[1]。加强艾滋病防治工作是实施健康中国战略的重要任务。国家卫生健康委联合多部门印发《遏制艾滋病传播实施方案(2019-2022年)》(以下简称《方案》),第1项措施即实施预防艾滋病宣传教育工程,要求居民、流动人口、老年人及易感染艾滋病危险行为人群艾滋病防治知识知晓率达90%以上;各地积极探索利用大数据信息、人工智能技术判断艾滋病防治重点人群和对象,通过互联网精准推送防治信息[2]。开展健康信息传播对于艾滋病防治工作至关重要,而分析用户对相关健康信息的需求特征能更精准地为其提供所需健康信息。
2 研究现状
2.1 国外
网络因其获取信息的便捷性,已经成为公众获取健康信息的重要途径。艾滋病患者由于社会歧视与排斥,也更偏向于通过网络获取相关健康信息。通过网络用户不仅可以浏览信息,还可主动提问,有研究发现网络问答社区是用户获取健康信息的重要途径[3]。目前国内关于艾滋病健康教育的需求研究以面向特定人群的问卷调查为主,由于问题预先设定,不能全面反映公众真实需求。对社会问答平台中关于健康话题的提问进行研究,能有效反映用户对相关健康信息的需求。国外关于社会问答平台健康信息需求与行为的研究已逐步兴起[4],Park MS等采用内容分析与语义网络分析的方法分析网络用户关于乳腺癌话题,以研究用户信息搜索行为[5];Ji Z等通过分析雅虎问答和百度知道中关于癌症的问题,对中美两国用户健康信息需求进行分析[6];Alasmari A等对比分析雅虎问答和WebMD两种社会化问答平台的健康信息需求[7]。
2.2 国内
国内有少数学者开始尝试研究社会问答社区中用户健康信息需求,如邓胜利等利用ROST CM文本挖掘软件分析百度知道中有关高血压的提问[8];赵安琪等采用内容分析法对知乎中关于抑郁症的提问进行研究[9];曹树金等采用社会网络分析法揭示社会化问答网站用户糖尿病相关信息需求[10];Zhou X等对中国某健康网站中关于糖尿病的提问进行分析[11]。但国内关于艾滋病健康信息需求的研究鲜有报道,王国华等通过分析百度贴吧“HIV吧”版块内容,发现其中寻求社会支持最普遍的是信息类,寻求建议和参考,需求信息远多于供应信息[12],但对用户信息需求内容未做深入研究。本文对百度知道中关于艾滋病的提问进行文本挖掘,分析用户对艾滋病健康信息的需求特点,为精准推送相关健康信息提供科学依据。
3 资料与方法
3.1 数据来源
主要以百度知道为数据基础。百度知道是基于百度搜索的互动式知识问答分享平台,用户有针对性地提出问题,通过积分奖励机制发动其他用户来解决该问题。同时这些问题的答案会作为搜索结果,提供给其他有类似疑问的用户,达到知识分享效果[13]。本文主要研究非医学专业人员对艾滋病相关信息的需求,在获取相关数据时未对艾滋病专业术语“获得性免疫缺陷综合征”进行检索。经过初步检索发现用户除以“艾滋病”一词进行提问外,还常用其英文缩写"AIDS","HIV"也较多地用于提问中,因此本研究以“艾滋病+AIDS+HIV”为关键词(+表示逻辑或的关系),通过八爪鱼采集器获取百度知道相关提问内容,包含发布时间、回答者、回答个数、点赞数、标题、问题详情、浏览次数、最佳答案等信息。数据获取时间为2019年12月11日。利用Excel对采集到的问题内容进行清洗,筛选掉重复数据、没有提问内容或提问内容与艾滋病无关数据,最终研究样本共有1 579条提问数据。
3.2 方法
利用Python对采集的问题样本进行分词及词频分析,采用Gephi进行语义网络分析。分词是进行文本分析的基础,通过Python中的jieba分词对提问内容进行分词处理。在实际分词过程中,根据初步分词结果将提问中涉及但未被正确切分的词语添加为自定义词语并重新分词。对分词结果进行词频统计,使用Python中的Wordcloud库制作关键词云图,以揭示用户对艾滋病的主要关注点。采用Gephi绘制关键词共现网络图,以分析用户对艾滋病健康信息需求的主题分布。由于艾滋病及相关概念有多种表达方式,为更准确地分析语义网络,对这些同义词或不规范的表达进行统一处理,将概念统一为“艾滋病”和"HIV",将“艾滋病病人”、“艾滋病人”统一为“艾滋病患者”,“艾滋病宣传日”统一为“艾滋病日”。
4 结果
4.1 高频关键词
对研究样本分词后进行词频统计,共得到2 167个词,筛除无实际意义的词如“请问”、“到底”、“谢谢”等,去掉征求艾滋病的作文或英文翻译等方面的词如“作文”、“英文”、“一篇”等。取筛选后频率最高的前100个词,绘制词云图,见图1。根据词云图的生成原理,词语出现频率越高,其显示规格越突出、离图中心越近。图1可以直观显示出用户对艾滋病健康信息需求的关键词:艾滋病、艾滋病病毒(hiv)、感染、患者、传染、检测、预防、症状、传播、检查等,频率最高的20个关键词及词频,见表1。分析词频时HIV自动转换为hiv,词云图中以hiv形式出现。
图1 艾滋病相关问题关键词
表1 前20位高频关键词及其词频
4.2 共词网络
为了解各关键词之间的关联,揭示信息需求主题分布,根据高频关键词共现关系构造共现网络,见图2。节点代表关键词,节点越大其中介中心性越高,表明该关键词更容易与其他关键词共现;连边代表关键词之间的共现关系,连边越粗,关键词之间的共现频率越高, 关系越密切;根据聚类系数对节点颜色进行区分,相同颜色代表节点间关联度较强。由于本研究的问题样本都围绕艾滋病,故在构建共现网络时将“艾滋病”这个节点去掉,以更清晰地体现其他节点之间的关联度。由图2可见节点主要分为5种颜色,分别代表5种不同主题。
图2 关键词共现网络
5 讨论
5.1 主题分布
结合表1和图2分析高频词及词间关系,整理得出用户对艾滋病健康信息的需求主要集中在5个方面,见表2。此外还有少数与艾滋病密切相关的问题,如艾滋病起源、危害,HIV与艾滋病的区别,艾滋病患者能否生育等。
表2 艾滋病健康信息需求主题及关键词
5.2 用户特征
本研究中艾滋病健康信息需求来自不同人群。关注艾滋病健康信息的用户除感染者或高危人群外还有其他人员,这部分人群主要关注艾滋病流行趋势和预防知识以及传播途径和致病机理等,表明艾滋病具有比较广泛的社会影响。艾滋病病毒感染者或疑似患者更多地关注艾滋病传染与临床诊断,包括艾滋病病毒检测等,对治疗等信息关注较少。根据HIV传播途径,容易引起HIV传播的行为称为高危行为[14]。其中大部分用户未确诊,部分人与患者或病毒携带者接触过,部分人有过艾滋病高危行为,部分人已经出现某些症状,其提问主要是咨询是否患病或检测方面的问题;部分人已确诊为艾滋病,则询问生存期或者具体办法。怀疑感染艾滋病时大多以“不会感染/传染艾滋病了吧”这种方式提问,还有部分用户使用“救命”、“好怕”等词。可以看出这类用户流露出对艾滋病的恐慌与担忧。“治疗”一词出现频率为20次,大部分是针对艾滋病治疗药物和方法的提问,还有少数用户对艾滋病能否治好进行提问。此外有一部分提问围绕艾滋病患者的日常生活、职业、生育等方面。关于艾滋病的阻断药相关问题有24个,以询问阻断药购买地点为主。这一类用户是有过艾滋病高危行为的用户。发生艾滋病高危行为后,在72小时内服用艾滋病阻断药可以阻拦艾滋病病毒[15]。
5.3 相关信息传播建议
艾滋病作为一种危害性极大的传染病,受到社会广泛关注,健康信息需求的用户群体非常广泛。关于艾滋病的健康宣传教育不仅要针对艾滋病感染者、疑似患者以及高危人群,也要面向广大群众,而不同人群对艾滋病健康信息需求有所差别,要根据不同人群特点开发针对性和可接受性强的宣传材料[2]。本文基于文本挖掘分析各类人群信息需求特征,为不同人群提供健康信息。针对公众,在全面普及艾滋病危害、传播、症状等基本知识的基础上,应着重宣传艾滋病预防知识。艾滋病疑似患者潜藏于普通大众中,由于社会歧视,这部分人群不敢轻易暴露,其信息需求较难发现。因此在为公众提供健康信息时应考虑这部分人群需求,提供艾滋病检测方面的信息,如检测机构、方法等。本研究还发现由于大众对艾滋病的恐惧,与艾滋病患者有接触史者通常会担心感染艾滋病而发帖求助,因此应提供相关信息以消除这类人群的恐惧心理。针对高危人群除进行防护措施的科普外,还应加强关于艾滋病阻断药的宣传。由于阻断药的采购和发放受到国家严格管控,很多人不知道应用阻断药或如何购买,可能错失防治艾滋病的关键时期。艾滋病患者信息需求特征比较明显,主要关注生存期与治疗,其次关注日常生活、职业与生育方面。对于艾滋病患者,国家采取最大的隐私保护及救治措施,患者接受治疗的同时能接受相关健康教育。但仍有部分患者由于某些原因而未能接受健康教育,对相关健康信息特别是日常生活、职业与生育等方面的信息需求迫切但因害怕泄露隐私而不敢公开求助。因此关于艾滋病生存期与治疗、日常生活、职业、生育等方面的健康信息应面向公众传播。
6 结语
本文基于Python语言对百度知道中关于艾滋病的提问进行文本挖掘,通过词频和共词网络分析揭示用户对艾滋病健康信息需求的主题分布,在此基础上进一步分析用户特征,提出艾滋病健康信息传播对策建议,为精准推送信息提供参考。无论是艾滋病患者、高危人群或是普通大众都存在对艾滋病健康信息的需求,信息传播内容应全面充分,传播对象应覆盖所有人群,且健康信息内容根据人群的不同而有所侧重。本研究还存在一定局限性,研究样本只是针对百度知道中关于艾滋病的提问进行研究,较为有限。此外艾滋病患者情感信息需求展现不够充分,只揭示艾滋病疑似患者以及少数确诊患者恐慌与无助的心理。而情感支持对于艾滋病患者非常重要,应挖掘艾滋病患者情感需求。另外还应调查用户对艾滋病健康信息的需求是否得到满足,为更好地开展艾滋病健康信息传播提供依据。