基于百度搜索指数的“老年痴呆”网络信息关注特征分析
2021-03-03王雨嫣孙凤丽
王雨嫣,孙凤丽
阿尔茨海默病是一种中枢神经退行性病变,俗称“老年痴呆”。根据国际阿尔茨海默病协会的统计数据,阿尔茨海默病是痴呆症中最为常见的一种类型,占60%~80%;65岁及以上人群中的老年痴呆总患病率达5%以上,轻度认知障碍患病率高达20.8%[1]。资料显示,截至2017年9月,我国患有阿尔茨海默病的人数己经超过了900 万,位列世界第一,并且每年还在新增30万名患者,是增速最快的国家之一[2]。随着人口老龄化的加剧,阿尔茨海默病的发生率也在上升。有研究预测到2030年,我国60岁以上老年人患阿尔茨海默病的人数将达到2 075万[3]。由此可以预测,“老年痴呆”将成为重要的健康与社会问题。
随着人口老龄化逐渐成为一个显性社会话题,健康中国战略的提出,老年人的健康问题愈受关注。健康信息搜索行为是指个体为满足其特定的健康信息需求,利用各种信息资源进行有目标导向性的信息获取行为[4]。研究网民的健康信息搜索行为有助于了解公众对“老年痴呆”的关注和需求,把握社会关注点,发现社会问题,以期为“老年痴呆”的健康传播与科普教育提供依据、为提供健康信息的平台提出建议、为政府决策提供参考。利用百度指数研究人们的健康信息关注与信息需求具有现实性和应用价值,在较广范围内为研究者采纳。
1 资料与方法
1.1 资料来源
百度指数是以百度用户行为信息为基础的数据平台,可以用来研究特定关键词的搜索趋势、网民的特征和信息需求。搜索指数是以搜索量为基础,计算关键词在搜索频次的加权,可以反映网民对特定主题的关注情况。对比阿尔茨海默病这一医学术语概念,“老年痴呆”的名字更广为人知。本文对人民日报数据库和读秀新闻数据库进行了初步检索,发现以“老年痴呆”为标题的新闻远远多于以“阿尔茨海默病”为标题的新闻,说明“老年痴呆”一词具有更高的使用率,故本文选择“老年痴呆”为关键词。以“老年痴呆”为关键词,获取2011—2019年全国网民在电脑及移动端对“老年痴呆”疾病信息的日均搜索频次。以国家统计局发布的2011—2019年60岁及以上人口占比反映老龄化程度。
1.2 分析过程
分析搜索指数及其变化情况以反映网民的信息行为,采用SPSS 软件对数据进行分析,通过Pearson相关性分析网民对老年痴呆的关注度与我国老龄化程度和老年人口上网的相关性。基于人群画像分析网民的群体特征,采集2020年1—6月每周排名前10 位的相关检索词,共获得210 个来源词和210个去向词,统计高频词并进行分析。
2 结果
2.1 时间变化
2.1.1 年度变化
搜索指数日均值由2011 年的395 上升到了2019 年的2 246,网民的搜索行为更加频繁,对老年痴呆的关注度上升。 2012年中共十八大召开,提出要坚持人民健康服务导向[5];2017年中共十九大提出健康中国战略,这两个时间点之后的搜索指数都出现了较大幅度的增长,说明国家政策对于促进人们的健康关注具有重要作用。
移动搜索指数与整体搜索指数(电脑+移动)的比值可以反映网民移动端的使用率。见图1。随着智能手机的普及,人们可以随时随地上网,信息搜索更为便捷。碎片化的信息推送使人们更容易接触到与老年痴呆有关的资讯,但碎片化信息往往是片面的、浅显的、表面的。因此,如果人们想进一步了解老年痴呆,就可能会转向搜索行为。移动搜索指数越来越接近整体搜索指数,手机等移动设备成为人们进行信息搜索的主要渠道。
2.1.2 与老龄化程度、老年网民比重的关系
60岁及以上人群占总人口的比例反映了我国老龄化程度, 60 岁及以上网民占网民总体的比例映射了网络在老年人群中的普及情况。见图1。“老年痴呆”的搜索指数与老龄化程度、老年网民比例在特定时间段的变化一致,说明网民对老年痴呆的关注与人口老龄化程度和网民中老年人占比具有一定的关联。分析显示“老年痴呆”搜索指数与老龄化程度具有显著相关性(r=0.866,P<0.01)。搜索指数与老年网民比例不相关,说明网络在老年网民中的普及并未使其对健康信息的搜索行为增多,可能与老年人的网络使用率和网络健康信息素养较低有关。
2.2 网民群体特征分析
2.2.1 地域特征
江苏省网民搜索老年痴呆疾病信息的频次最高,广东、北京次之。排名前十位省市每年名次都有变化。根据中国统计年鉴资料,排名靠前的省份老龄化程度均较高或处于持续上升状态,绝大多数位于东部地区。以上地区经济发达、人口密集、城市化水平高、生育率低,或因劳务输出、环境宜居等原因导致老年人口的比例不断上升,老龄化程度是这些省市关注老年痴呆疾病的重要现实依据。
2.2.2 性别特征
本模块仅能提供最近1 个月的数据。研究发现,老年痴呆发病率女性高于男性,搜索指数也呈现出一定的性别差异。 2020年7月、 9月,女性占所有搜索“老年痴呆”关键词网民的57.3%和59.4%,均高于男性。根据9月全网搜索用户的性别分布(女49.2%,男50.9%),搜索“老年痴呆”网民中的女性占比要高于女性在所有搜索用户中的占比,这说明女性比男性更想了解“老年痴呆”疾病相关知识。当前我国“老年痴呆”以家庭护理为主,其主要照顾者多为女性,因此,女性对老年痴呆疾病相关知识有更大的需求。
2.2.3 年龄特征
“老年痴呆”发病率与年龄相关,不同年龄段群体的信息搜索行为存在差异。搜索老年痴呆疾病知识的网民存在年龄分层, 20~39岁的中青年群体是新媒体的最主要使用者,其在搜索中的占比自然最高, 50 岁及以上的用户占比最低,比较符合我国整体网民的年龄分布;40 岁及以上的用户占比上升,与中老年上网人数增多有关。近年来,新媒体市场逐渐向老年群体发力,根据第45 次《中国互联网发展状况统计报告》, 40 岁及以上的网民占比已经达到了34.5%,其中50 岁及以上的群体占比为16.9%[6]。
2.3 高频搜索词特征
2.3.1 医学专业术语与通俗称法引疑惑
来源搜索词是指用户主动键入并进行搜索的词,模糊反映网民在搜索行为前的现实信息了解情况;去向搜索词是指用户在得到初次检索的结果后再次搜索的词,包含着网民的信息兴趣和实际需求。高频搜索词见表1。阿尔茨海默病是“老年痴呆”的医学术语,具有一定的专业性和生僻性,很多人可能知道“老年痴呆”但不知道阿尔茨海默病,因此,该词在来源及去向词中均排名第1位。从“老年痴呆又叫什么名字”在来源词中的频次达到15也可以看出,人们对这两个名称存在一定的疑惑。
表1 “老年痴呆”高频搜索词
2.3.2 注意力在相似疾病信息之间转换
帕金森病也是一种常见的老年神经系统退行性疾病,与“老年痴呆”在症状上有较多相似之处,尤其是在晚期。检索前者的用户可能会收到与“老年痴呆”相关的信息推送,引发相关搜索行为。进行疾病信息检索的网民中有一部分属于自诊性检索,即根据自己或身边人在现实中的一些症状表现进行检索确认和自我诊断,用户在进行帕金森病信息搜索时很可能根据相同的症状表现跳转到检索“老年痴呆”。“脑萎缩”的发病群体同样以老年人为主,老年人疾病的特点是“一身多病、症状不典型,并发症多”,人们在对某一特定疾病进行检索的时候很可能会在多种疾病信息之间转换。
2.3.3 对自诊断信息和预防信息有需求
“老年痴呆症的前兆”和“老年痴呆测试30题”透露了人们对自诊断信息的需求。“老年痴呆”起病隐匿,临床上的表现有记忆障碍、失忆等。然而,正常的衰老过程也常常伴随着记忆力下降,人们很难自行对两者进行区分,因而检索识别性、辨别性信息。“老年痴呆症的预防”在来源搜索词中排第五,说明网民对预防“老年痴呆”疾病的重要性具有较高的知晓度;“如何预防老年痴呆”是指向具体措施和解决办法的信息,在去向搜索词中排第二,具有行为导向性,网民在看过初步检索的结果后有一定的概率去检索“如何干预”,说明初步检索得到的信息对人们提高健康意识是有效的,也反映了人们对患“老年痴呆”症较高的担忧。
2.3.4 关注与老年痴呆有关的其他疾病
抑郁症是一种常见的精神疾病。根据相关研究,“老年痴呆”症患者有一定的抑郁风险[7],抑郁也是患“老年痴呆”的风险因素之一。虽然老年人不是抑郁症的主要患病人群,但其发病率却在逐年升高。抑郁症表现为情绪低落,中国的孝文化提倡不仅要在物质上赡养父母还要在精神上慰藉父母,子女往往很重视老人的情绪。人们在检索“老年痴呆”时可能会注意到其与老年抑郁有关的信息,进而去检索到“老年抑郁”。以老年抑郁为代表的疾病名称词成为检索高频词,反映了人们对老年人健康的全面关注。
对比来源词的频次,去向词的频次并不高,其最高频次在来源词中仅能排第6位。来源词高频词的频次占到了总词频的98%,而去向词高频词的频次仅占总词频的41%,这说明去向词的聚集度不高,比较分散,超过一半人们的注意力被引向了“红酒的分类、皇家海军陆战队、茶叶如何保存”等与老年痴呆无关的信息。
3 讨论
根据人们的搜索特征和高频词情况,研究者对提供疾病信息的网络平台提出以下建议。
尽量避免提供模糊性信息。在对医学术语进行大众化转换时既要保证科学性又要实现通俗性,将民间俗语与现代医学中的概念联系在一起的时候要注意适用性,更要对医学科学知识与人们日常生活中依据经验得出的知识进行区别,提供准确的信息。随着网络的普及和人们对健康的重视,网络上健康和疾病信息越来越多,信息质量良莠不齐、真假难辨。不准确的疾病信息会对人们的行为造成误导,从而最终损害人的健康,这就要求平台方加强把关、承担起社会责任。老年人上网越来越普遍,但老年人的信息素养薄弱,针对老年人的信息更应该提高准确性。
针对网民在搜索时出现注意力转移的情况,应精准识别用户的信息需求,提高链接和推送的有效性。从“老年痴呆”搜索的去向词来看,平台算法对于精准识别需求还存在缺陷。虽然检索行为本身就具有很大的跳跃性,但初次检索结果的混乱会在一定程度上加剧注意力的分散。因此,应提高推荐信息与核心关键词的关联性,剔除无关的信息,使检索结果更加聚集,维持用户对特定话题的关注,促进人们对相关议题的深入了解与公共讨论。
针对人们或由自诊断需要而实施的信息搜索行为,应引导人们及时真实就医。尽管平台可以保证提供的信息是准确权威的,但不能保证人们对信息的理解是准确的,因而需要考虑对用户进行提示。人们会通过网络上的描述进行自我诊断,但普通个体毕竟不是专业医生,会进行自我映射,从而得出错误的结论甚至产生错误用药。平台应引导网民去医院或向医生咨询,勿要轻易相信自我诊断的结果。
针对人们对预防信息的较高关注,应把握恐惧诉求的尺度,避免造成对健康的过度担忧。“如何预防”在去向词中的地位反映对可能罹患疾病的担忧,侧面说明在检索结果中存在较多恐惧诉求的信息。恐惧诉求是一种宣传和说服技巧,利用人们的避害心理,善加使用可以使人产生某些好的行为。研究表明恐惧诉求的程度较轻时,说服是有效的,但超过一定程度则可能会使人陷入紧张或焦虑。网络检索的用户中虽然存在自诊性检索,但更多属于知识性检索,即只是想知道“老年痴呆”是什么,过多恐惧诉求的信息会导致健康的人也产生患病焦虑,影响心理状况。
本研究存在以下局限性:对于“老年痴呆”搜索指数人群特征的性别与年龄分布,本文仅收集了2 个月的数据,未能反映较长时间段内人群特征的变化。影响网民对“老年痴呆”进行搜索的因素较多,本文只能在数据的基础上进行分析,未能对宏观的社会因素和个人层面的微观因素进行探讨,后续研究可在这两方面深入。