APP下载

在线医疗社区健康科普知识供需匹配研究

2023-07-20夏苏迪邓胜利汪璠

现代情报 2023年7期
关键词:用户需求

夏苏迪 邓胜利 汪璠

关键词:健康科普知识;在线医疗社区;健康知识需求;知识供给;用户需求

DOI:10.3969/j .issn.1008 -0821.2023.07.005

[中图分类号] G252.0 [文献标识码]A [文章编号]1008-0821(2023)07-0038-10

健康科普知识采用科普形式,通过文字、视频等方式向公众传递健康相关科学知识、方法、思想和精神,以培养公众健康意识,提升公众健康素养。近年来,公众对各类健康知识特别是健康科普知识的需求日益增多。调查显示,相较于2019年,2020年微信平台中有关保健、养生类的健康科普阅读量同比增长299%。对此,2022年国家卫健委等多部门联合印发了《关于建立健全全媒体健康科普知识发布和传播机制的指导意见》,要求相关主体增加优质健康科普作品数量,丰富健康科普作品形式,持续提升健康科普知识质量,推动全媒体健康科普知识发布和传播水平迈上新台阶。

然而,当前数字环境下的健康科普知识鱼珠混杂。各类社交媒体和网络平台充斥大量低劣的健康知识,这些知识通常披以科普外衣,内容真假难辨,甚至对用户健康带来巨大危害。调查显示,31. 2%的网络用户有过被虚假健康科普欺骗的经历,68%的社交媒体用户经常偶遇虚假健康信息。面对上述问题,充分发挥健康领域专家的作用,增加权威健康科普知识的供给,能够有效遏制虚假健康信息,净化健康科普知识传播环境。而“医—患”型在线医疗社区(Online Health Com-munity,OMC)则为优质健康科普知识供给与用户高质量健康科普知识获取提供了有效途径。医生具有较高专业素养,其发布的健康科普知识具有较强权威性,这为普及健康科学知识、提升全民健康素养、推动“健康中国2030”战略提供了可靠保障。因此,探究在线医疗社区健康科普知识的供需现状及优化策略具有较强现实意义。

现有关于健康科普知识的研究聚焦新媒体平台健康科普知识的传播策略与效果分析,鲜有研究从供给侧分析在线医疗社区健康科普知识的主题分布及呈现形式,并从需求侧分析用户对知识主题和内容形式的偏好。鉴于当前研究局限,本文结合文本挖掘和数理统计方法,深入探究在线医疗社区健康科普知识的供需现状,并以用户需求为导向提出供给优化策略,以提升在线医疗社区健康科普知识供给成效。

1文献综述

1.1健康科普知识的相关研究

当前健康科普知识的研究侧重于探讨微信等新媒体环境下健康科普文章的传播策略及效果。研究显示,数字环境下健康科普文章在充分了解用户知识需求基础上,还应创新知识的内容和呈现形式。健康科普文章应密切关注社会热点事件,针对目标用户的特性精准发布个性化科普知识。同时,健康科普文章应融合文字、漫画、音频、视频等多种形式,结合讲座、直播等方式提高知识的通俗性。在传播效果上,在发布时间方面迎合用户阅读习惯、满足用户需求以及融合多种呈现形式的健康科普文章具有较高浏览量,能够获得更多用户青睐。此外,还有研究基于健康科普文章的主题和患者提问,探讨了融合LDA和TF-IWF方法实现健康科普文章个性化推荐的可行策略。

1.2健康知识需求相关研究

现有健康知识需求的研究通常以特定类型疾病为研究对象,如表1所示,如糖尿病、癌症、抑郁症、高血压、宫颈癌等。这些研究多以用户问答数据为载体,通过主题挖掘和内容分析方法,揭示不同疾病下健康知识需求的特征。不同疾病在症状、危害、周期等方面存在显著区别,因此健康知识需求的维度与侧重点也存在差异。例如患有心理疾病的用户在健康知识搜寻中,更加关注疾病对社交关系和活动造成的影响。同时,作为健康知识需求的特殊类型,健康科普知识也受到关注。相关研究利用问卷调查收集公众关于健康科普知识的需求,内容不仅涉及疾病预防与治疗,还包括营养、饮食、运动、急救、政策法规、习惯等与日常生活密切相关的主题,这与以疾病为核心的健康知识需求之间存在较大差异。此外,也有研究分析对比了不同群体和不同情境下健康知识需求的差异,例如针对同一需求对象比较不同国家(地区)以及不同疾病中的健康知识需求差异。

综上所述,健康科普知识的研究侧重于分析健康科普知识在社交媒体的传播效果及策略,而对在线医疗社区健康科普知识的研究较为匮乏。同时,在分析健康科普知识特征时,现有研究主要利用人为设定的类别目录和标签划分知识类别,分类结果存在人为主观因素,未能深入知识内容本体揭示科普知识的内容与形式特征。同时,现有关于健康知识需求的研究聚焦问答情境下的特定疾病,尚未有研究深入分析网络医疗情境下用户对健康科普知识的内容需求及偏好。因此,本研究将从供给侧与需求侧分析在线医疗社区健康科普知识的供需现状。在供给侧,使用LDA主题模型挖掘OMC健康科普知识的内容特征,揭示OMC健康科普知识的主题分布、呈现形式和发布者特征;在需求侧,依据用户行为及生成内容,结合数理统计方法探究用户对健康科普知识的需求主题及偏好。最后,分析OMC健康科普知识的供给与需求匹配情况,据此为OMC健康科普知识的供给优化提出策略。

2研究数据与方法

2.1样本选择与获取

本文选择好大夫在线平台的“科普号”板块收集样本数据。在科普号栏目,医生可以发布健康和医疗相关的科普文章、视频、音频和付费内容,为普通用户普及医疗、健康方面的科普知识,这为本文提供了充足的样本数据。本文选择“癌症”和“皮肤病”两种疾病类別收集健康科普知识数据,理由如下:①作为一种周期长、危害大的疾病,癌症在用户健康需求中占据了较大比例。同时,癌症患者涉及不同职业、年龄、民族、性别的群体,其健康知识需求表达具有代表性和普遍性;②本文拟在大量OMC健康科普知识中提炼出代表性强、一般化的知识主题。因此,另行选取与癌症在特征、病理上差异甚远的皮肤病样本为补充,总结两种疾病中健康科普知识的共性,归纳OMC健康科普知识的主题大类。

本研究使用Python爬虫程序在公开页面渠道获取样本数据,内容涵盖医生个人信息、健康科普知识、用户行为及评价信息。样本数据获取时间为2022年6月1日—4日。在对空缺值和重复值做删除处理后,如图1所示,本研究最终数据包含1486位医生的50407条健康科普知识数据。

2.2数据预处理

为将数据样本输入LDA主题模型进行训练,需对数据进行向量化处理,构建文档词语矩阵。除文章类型外,视频、音频类型的健康科普知识以非文本形式呈现,因而使用其标题作为文本分析对象。因标题文本为短文本,借鉴以往研究的处理方式,本文将同一医生所有视频、音频和付费格式的知识标题进行拼接,通过主题挖掘获取知识主题,并将该主题赋予对应的样本数据。具体步骤如下所示:

1)停用词表构建。因本文涉及较多医学专有名词,因此参考Mesh医学主题词表对“症状”“疗法”等医学术语进行保留。此外,一些语词如“肺癌”“皮肤病”“癌症”等词语出现频率较高,且为样本数据的表征对象,本研究需要分析这些对象的特征及关联语词,参考前人操作,对高频词做删除处理。

2)文本分词。在利用停用词表基础上,本研究使用Python中的Jieba分词库对样本数据集进行分词处理。

3)文本特征提取。作为一种文本加权技术,TF-IDF方法以某一特征词的出现次数在所有包含该语词文档数的占比作为该语词的权重,从而体现其在文档中的重要程度。本文使用TF-IDF方法赋予文档语词权重特征,据此构建基于TF-IDF的LDA主题提取模型。

2.3基于LDA的主题建模及计算

LDA模型即隐含狄利克雷分布,该技术能够在大规模文档中识别出潜在的主题信息。作为一种非监督机器学习技术,LDA利用三层贝叶斯概率模型从若干文档中识别出预先设定的Ⅳ个主题,并生成各个主题的文档一主题概率分布和主题一词语概率分布。

2.3.1主题个数的确定

为确保主题划分效果,提高主题内部的相似性和主题之间的独立性,本文结合一致性得分(Co-herence Score)和困惑度指标(Perplexity)共同确定LDA主题提取个数。一致性反映了同一主题下语词之间的语义相似度,一致性越高表明主题划分效果越好。困惑度代表了概率预测样本的效果好坏,它代表模型判断某一文档属于特定主题的不确定程度。困惑度越低表明主题提取效果越好。利用两个指标对模型进行交叉验证训练,当主题提取个数为14时,模型困惑度曲线平缓且数值较低,同时模型的一致性得分相较于其他主题的得分较高。因此,本文最终以14个主题为预定主题个数训练构建LDA主题模型。

2.3.2主题广度与深度计算

为探究每条健康科普知识中蕴含的主题丰富度和信息量大小,本文参考前人研究对健康科普知识的主题广度和深度进行了计算。对于主题广度,根据LDA输出文档对应的主题概率,可以计算得到各文档蕴含的主题个数,以衡量文档主题丰富度。主题个数的确定使用经验值l/k为阈值(k为主题数),当某一主题的概率高于经验值时,该主题可算作当前文档蕴含的主题个数。同时,在保留高于阈值的文档一主题关键词概率基础上使用信息熵计算文档的主题深度,以此衡量文档包含的信息量。信息熵计算方法如下:

3研究结果

3.1 OMC健康科普知识的供给状况

利用LDA主题建模挖掘OMC健康科普知识的主题,揭示单条健康科普知识的主题类别及所属概率,进而计算各主题类别蕴含知识的数量、广度与深度,最后分析不同主题类别健康科普知识的呈现形式和发布者差异。

3.1.1知识主题分布

部分主题的关键词内涵存在共性,可据此提炼其隶属主题的大类。如表2所示,14个主题可分为8个大类,分别为疾病治疗、检查及技术方案(Cl)、病理知识(C2)、健康护理(C3)、药理及研究(C4)、特殊患者群体(C5)、疾病研究进展(C6)、健康科普教育(C7)、就医指导与健康咨询(C8)。其中,C1、C2、C3、C5等5个类别均围绕特定疾病展开,涉及疾病的病理、治疗手段和康复方案。C4和C6侧重介绍某一疾病和药物的研究进展及学术性成果,C7涉及科普性质的健康知识。不同于社会化问答社区.C8为OMC中的特有类别。OMC不仅为用户提供线上医疗服务,也提供预约挂号途径辅助用户线下咨询,因而有关就医指导、注意事项和咨询活动的内容也占据一定份额。在8类知识主题中,C1知识数量占比最高,其次是C6和C3,三者数量在总量中占比超过2/3,而最贴合科普性质的C7占比很少,僅为4.24%。

相关性分析显示,健康科普知识的主题广度与深度呈现负相关关系(p=-0.120,P<0.01),即某一文档中知识的主题越丰富,则蕴含的信息量较少。对各知识主题而言,主题知识的广度与知识数量呈正相关关系(β=0.150,P<0.01)。主题中包含的知识数量越多,则蕴含的知识类别愈加丰富,如图2所示。而主题中知识深度则与知识数量呈现负相关关系(β=-0. 107.P<0.01)。在总量层面,C1、C6、C3和C2这4个主题的知识类型较为丰富,且蕴含的信息量也较大,这是由4个大类相对较多的知识发布数量导致的。

3.1.2知识呈现形式

健康科普知识通过文章、视频、音频和付费内容4种形式呈现,如图3所示。纵向来看,除健康科普教育和就诊指南与健康咨询外,其余类别在4种呈现形式上均有分布。这两个知识主题多以教育性、公益性内容为主,知识主题本身不以营利为目的,因此两个类别均不包括付费内容。而在疾病治疗、检查及技术,健康护理、药理及研究等主题中,一些内容涉及医疗技术、药物和疗法的商业宣传,部分内容需付费获取。在横向比较上,疾病研究进展、健康科普教育和就诊指导与健康咨询等多以文字化形式呈现,其余知识大类则结合文字、音频、视频等多种呈现方式。这些知识类别涉及医学技术与设备、疗法、患者护理等操作性强或宣传性内容。相比文字描述,音视频等呈现方式更加通俗与直观。

3.1.3知识发布者特征

不同医生发布的健康科普知识在主题类型与内容形式上存在差异。如图4所示,医生专业职称在不同主题类别中分布差距不大,而在疾病研究进展、病理知识、健康科普教育、药理及研究等主题中,医生学术职称普遍较高。相关性分析显示,医生学术职称与发布知识的总数(β=0.057,P<0.05)、发布文章的数量(β=0.064,P<0.05)之间呈现正相关关系,如表3所示。具有学术职称的医生更倾向于主动发布知识,且偏好发布学术化、专业化的知识内容,而发布科普性质的知识数量较少。这些主题知识涉及医学研究、理论及技术,因此也需依托发布者扎实的学术功底和研究水平。

在线上声誉上,发布病理知识、疾病研究进展、特殊患者群体和就诊指导与健康咨询的医生,获得年度好大夫称号的数量要高于其余主题类别的医生。这一荣誉反映了患者对医生问诊服务的认可,而这类医生发布的知识主题也较多涉及疾病病理、患者就诊和健康咨询。发布健康护理、就诊指南和健康咨询的医生,获得诊后服务星称号的数量更多,而这也与两类主题涉及内容的服务性相吻合。此外,表3显示医生线上荣誉也与其发布知识的数量和主题广度呈正相关关系,而与主题深度之间呈负相关关系,说明线上声誉越高的医生发布知识的数量越多,内容涵盖领域更加广泛,知识内容也更加浅显。

3.2 OMC健康科普知识的需求状况

健康科普知识浏览量在一定程度上体现了用户需求,反映了用户对该主题知识的关注。为消除不同主题类别在知识数量量纲上的差异,本文使用主题大类下知识篇均浏览量代表用户对该类主题的需求程度。

3.2.1不同主题类别的用户需求数量

OMC健康科普知识按需求等级由高到低依次为病理知识、健康科普教育、就诊指导与健康咨询、特殊患者群体、健康护理、疾病治疗、检查及技术、药理及研究和疾病研究进展,如图5所示。有关症状、病因、危害等病理知识的需求排名最高,而就诊指导与健康咨询、特殊患者群体也分列第三、四位,这说明OMC用户对健康科普知识的需求以特定类型疾病为对象,科普知识内容以疾病为核心展开。这是由在线医疗社区线上问诊服务目标和用户在线上寻医就诊的目标决定的。而疾病治疗、检查及技术、药理及研究和疾病研究进展等主题的用户需求排名滞后。调研发现,这些知识主题内容偏重学术研究与成果展示,偏离个人日常生活与健康管理,科普性较弱。同时,这些知识主题的理解与接受需依托领域知识,对普通用户的认知增添较大负担。

3.2.2不同主题类别的用户评价

诸如点赞量等评价信息集中体现了用户对OMC健康科普知识的满意度,体现了知识的质量。因好大夫在线中视频、音频和付费内容的知识未呈现用户点赞数,因此本研究仅针对文章类型健康科普知识的用户点赞量,分析各个主题类型的知识质量。如图6所示,就诊指导及健康咨询(C8)、特殊患者群体(C5)、健康护理(C3)这3个主题具有较高的点赞数,内容质量得到了患者认可。而病理知识(C2)、药理及研究(C4)和健康科普教育(C7)这3个主题的点赞数相对较低,说明这些知识主题的质量有待提升。

3.3 OMC健康科普知识供需匹配分析

3.3.1供给与需求的数量匹配

在线医疗社区中健康科普知识的供给与需求不平衡,现有知识主题在类别与数量上未能精准匹配用户的需求。供需缺口最大的知识主题为就诊指导与健康咨询,其次为健康科普教育、病理知识和特殊患者群体。有关症状、病因等病理知识的较高需求也在不同类型的问答情境中得以表现,反映出这一需求在用户健康知识需求中的重要地位。同时,健康科普教育的需求在当前在线医疗社区中存在较大的供需缺口,知识供给数量较少。此外,在OMC在线问诊情境下,用户也表现出诸如就诊指导、健康咨询等特殊类型的知识需求。相比上述主题,疾病研究进展、疾病治疗、检查及技术和健康护理方面的主题内容存在“供大于求”的状况,这些主题供给数量充足且远超用户需求。

可见,当前OMC及医生未能精准把握用户健康科普知识需求。不同于“医一医”型在线医疗社区,“医一患”型社区主要为用户提供健康知识服务。患者较多关注疾病症状与成因、健康科普、个人健康管理及医疗咨询与资源渠道等方面的知识,而疾病研究进展、治疗技术、药理研究及学术前沿等知识主题存在较高的行业壁垒,其内容需依托专业领域知识,且受众更多面向健康、医疗专业人士,科普性较弱。

3.3.2供给内容与需求偏好的匹配

用戶需求偏好涉及知识的内容价值和呈现形式。如表4所示,知识的点赞数与简短易懂(β=0.853,P<0.01)、讲解透彻(β=0.787,P<0.01)、内容实用(β=0.810,P<0.01)、消除困惑(β=0.769,P<0.01)、形象生动(β=0.777,P<0.01)和贴合需求(β=0. 838,P<0.01)等之间存在较强相关性。这说明健康科普知识不仅要在内容上具有较高实用价值,也要在形式上以通俗的表述和形象的展现形式方便用户理解与接受。相较于特殊患者群体、就诊指导与健康咨询、健康护理这3个主题,其他主题的健康科普知识因存在专业壁垒或晦涩的呈现形式,未能得到用户好评。此外,相关性分析显示,健康科普知识的主题广度与用户点赞数和各评价维度间均呈现正相关关系,而主题深度则与用户点赞数和各评价维度呈现负相关关系。这说明用户更加关注健康科普知识的丰富度和多样性,倾向于获取更多的知识内容,而过多的信息量则会增加用户认知难度和理解负担。

4需求驱动的OMC健康科普知识供给对策

针对OMC健康科普知识的供需现状,本文将以用户需求为导向,从知识主题内容与呈现形式等维度提出OMC健康科普知识供给的优化策略,以期普及健康科学知识,提高全民健康素养,助力健康中国建设。

4.1加大需求导向的优质内容供给

在线医疗社区及医生应以用户需求为导向,满足目标群体个性化的健康科普知识需求。根据OMC健康科普知识的供需特点,健康科普内容应以特定类型的疾病为切入点,围绕疾病症状、成因、危害等病理知识、疾病,对不同患者群体的影响、疾病预防、治疗和康复护理等内容,创作各种形式的健康科普作品。健康科普作品应面向不同用户群体,以知识普及、疾病预防和个人健康管理为主,降低医学专业知识的比重。同时,不同于其他類型的健康社区,在线医疗社区用户还具有线上或线下就医就诊的特殊需求,如检查结果解读、诊前诊后注意事项等也受到用户广泛关注,增加该领域知识供给有利于提高患者的就诊效率。

4.2促进研究成果向科普内容转化

通过组建健康科普创作团队,OMC能够协助医生将其学术化、专业性强的研究成果转换为科普性质的作品。研究表明,具有学术职称的医生更乐于在社区中发布知识,但集中在病理、药理及医学研究方面。这些知识虽然具有较高学术价值,但从用户视角而言,其感知有用性和接受度较低。因此,OMC可以组建专业化的健康科普创作团队,通过需求调研、内容重构、知识提炼等方式,揭示学术成果与生活常识、个人健康管理之间的联系,将学术化、理论化成果转化为科普性强、面向用户日常需求的大众作品,促进医疗健康知识的公众普及,提高公众的科学与健康素养。

4.3提高社区医生科普创作能力

OMC可以举办科普内容创作培训活动,从写作、内容营销等方面提高健康科普知识的内容质量与传播效果。研究显示,主题丰富、表述通俗、生动形象、浅显易懂的健康科普知识能够取得较好的传播效果,其内容更易于广大用户接受,而不少医生在科普写作与传播方面的能力尚未达到用户预期。因此,OMC可以针对社区医生举办各类健康科普知识内容创作培训活动,从内容选题、语言风格、表述方式、内容营销等各个方面提高医生健康科普知识的创作水平,从而增强健康科普知识的传播效果,让广大用户在健康科普知识的获取中潜移默化地提高个人健康素养。

4.4融入交互元素的科普知识呈现

利用短视频、直播等媒介技术转变健康科普知识的呈现形式,将互动元素融入科普作品。研究表明,科普知识传播有中心广播模式、欠缺模式和对话模式3种,当前科普知识传播以单线传播为主,而有沟通和对话的科普形式相对匮乏。本文结果同样显示,直播、论坛、大讲堂等形式的健康咨询活动得到了用户的普遍关注与好评。依托上述形式创作健康科普知识作品,将融合文字、图片、音频、动画、视频等多种呈现形式,有利于增强知识可读性和趣味性。同时,相比文章呈现形式,直播、讲坛等形式的健康科普作品借助专家口语化表述增强了知识呈现的表现力,其互动环节也为用户即时咨询与知识获取提供了便利。因此,OMC应当鼓励社区医生采用直播讲座等方式开展健康科普知识教育。

5总结与展望

本文以在线医疗社区为情境,从供给与需求两个层面分析了健康科普知识的主题类型、数量、呈现形式及用户偏好与需求。在理论上,本文揭示了当前在线医疗社区中健康科普知识的主题分布状况,发现了用户在内容数量和质量上对健康科普知识的需求偏好,分析了当前在线医疗社区健康科普知识的供需矛盾。研究结果是对健康科普知识组织、健康信息需求和在线医疗社区用户行为等领域的补充和细化。在实践上,本文结果也为在线医疗社区的管理者和健康医疗专业人士优化健康科普知识的供给提供了参考。

本文同样也存在一定的局限。因音频、视频和付费内容均未通过文本形式展现知识内容,本文使用其标题文本作为主题划分的依据,这会导致部分知识主题划分的偏差与遗漏。未来研究可在知识主题自动划分的基础上,可结合人工标注的方式对这类知识内容的主题进行归类,进而提高主题划分的准确性。同时,本文仅使用肺癌和皮肤性疾病的健康科普知识数据作为研究样本,未来研究可以加入多个疾病类别的健康科普知识数据,从而提升研究结果的泛化能力。

猜你喜欢

用户需求
基于用户需求的图书馆移动信息服务
网络时代电子文件和档案管理的探索
基于用户需求的政务微信发展策略探析
探析网络视频的产业化发展
基于用户新需求的高校图书馆学科化服务
公众对医学院校图书馆健康信息公益性开发的需求研究
FTTH技术及规划设计