微博环境下网民就医体验观点发掘和情感分析
2022-05-27曹佳雨赵俊
曹佳雨 赵俊
摘要:目前,以微博为主导的网络媒体平台已经成为民众信息交流的主要渠道。分析微博相关评论文本,有利于为医疗服务管理提供帮助。研究基于新浪微博,挖掘网民对医疗服务体验的评价内容,进行意见挖掘、情感分析等实证研究,把握和理解网民就诊体验关注点演变情况,为医疗机构改进就医流程、改善就医体验提供参考。
关键词:微博;用户评论;观点发掘;情感分析
根据《2020年微博用户发展报告》,截至2020年9月,微博月活跃用户达5.11亿,日活跃用户达224亿,广泛覆盖全国范围。伴随互联网高速发展,微博迅速推广,越来越多的网民可以借助网络平台获知信息,发表观点。微博是一种当下时兴的互联网社交平台,具有发布信息便利性强、阅览时效性高等优点,逐渐成为民众搜集信息、沟通交流的主要工具。
网络舆情即指网民对社会环境中的种种现象和事件表达的态度、想法、看法、情绪等观点的总和。针对就医体验相关网络文本数据进行分析,有利于把握了解网民用户对于医疗服务的观点体验,有助于医疗机构获得及时反馈,提高其服务水平。
内容情感分析是指通过分析自然语言、计算机语言来挖掘主观文本包含具有隐藏情感色彩的信息,例如判断文本内容是消极还是积极。文献研究表明,目前情感分析方法已经相对成熟,利用该方法进行研究具有一定的参考价值。
研究框架
数据采集
利用网络爬虫收集数据,基于“就诊”“就医”等关键词,收集至2021年7月31日的个人用户原创微博内容,包括博主头像、发布ID、文本主页、用户账号是否认证、博文独立网址、发布日期、发布媒介、转发数量、评论数量和点赞数量等信息。
数据处理
将原创微博内容导入到Excel表格中,按照博主ID、账号类型、博文网址分类记录表格管理。根据研究条件,筛选过滤不符合研究需要的相关博文。筛选条件包括微博账号类型为非个人,微博无效内容,如广告、网页链接或与研究主题无关的微博文本数据。使用Jieba分词组件对文本数据进行处理,删除重复和无关的文本数据,参照停用词表删除停用词,基于单词词性对每一个被分割出来的关键词的词性依次标注记录。结合关键词词语属性标注记录结果,剔除属性为助词、虚词、连词、介词等没有实际含义的主体词语和所有的标点、符号,最终获得每条带有词语属性分类标注的微博内容文本主题词数据集合。
观点发掘
通过对微博内容文本的阅读可以得出,网民为了表达某些观点所使用的词语往往都存在一类能够涵盖基本观点内涵的关键词。因此在本研究中,使用微博文本中出现的关键词的重要程度作为指标来评价文本内容数据的主要内容。高频词是指微博用户在微博内容中频繁使用出现的词语或者短语。本文采用文本特征加权法提取热点,计算主题词权重,过滤低频词,提取高频词。通过上述方法所提取的意见词语后,再进行两次人工鉴别、选择、过滤提取内容观点,进一步进行聚类分析。情感分析
网友的情绪即是网友在受到外界社会生活刺激从而产生的心理层面的感受,可以分为积极情感、消极情感以及中性情感。本文利用情感分析工具Snow NLP对文本内容进行分析,对积极情绪、消极情绪和中性情绪词语进行分类和计数,最终统计得到网友积极情绪、消极情绪和中性情绪数量和所占比例。
研究结果
观点发掘
研究共收集4772条微博数据,最终筛选得到27条有效数据,处理的可视化词云图如下。其中,按Tf—idf值排名前十的热点词分别是:“健康、朋友、感染、比较、那个、第一、必须、确诊、中医、病情”(见图1)。首先可以看出网民对健康问题的关注度日渐提高,广大群众对健康的需求也成为了一个重要话题;其次,特征词“朋友”的高频率说明朋友之间的交流是用户沟通的主要渠道;“比较、那个、第一”等词反映出用户对医疗机构的要求也在逐渐增加,体现人们对医疗卫生资源的多层面需求日益加大;“确诊”等词汇主要与疫情相关,显示了民众对当前疫情的重视,以及对疫情期间就医行为的关注;“中医”体现了随着健康素养的增加,民众对传统中医药的评价与需求逐渐加大,越来越受到民众的认可支持;“病情”直观反映了人们对自身健康安全的关注,成为人们就医治疗的主要需求。总体来说,网民的就医体验与对医疗保健服务和健康的需求的日益增长相关,主要集中在治疗效果、医疗资源选择和诊疗方式等方面,希望获得更好更优质的医疗服务。
情感分析
研究利用情感分析工具Snow NLP对评论文本进行情感分析,计算主题词情感值,情感值范围在0~1之间,取值越接近1,表达情感越正向,越接近0表达情感越负面。本文以0.5为分界值,把情感值大于0.5分的划分为正向情感文本,小于0.5分的视为负向情感文本,其余标记为中性情感文本(见图2)。分析可见,中性情感最多,共4825条,占48.6%,其次是正向情感,共3143条,占31.6%,负向情感最少,共1963条,仅占19.8%。数据显示大部分网民没有过多地表达个人情感,对就医体验话题的评论也较为理性。正向情感占比高于负向情感,表明网民就医体验的满意度较高,结合评论内容可发现与医疗服务质量高、医疗服务效果好等原因相关,体现了改善医疗服务工作的显著成效。负向情感文本里的关键词主要包含表达自身消极情绪状态,如“担心、紧张、压抑”等和对就医体验的负面评价,如“无语、一塌糊涂、不好”等,侧面反映目前看病难、看病贵、看病烦等问题仍然存在。
讨论
以健康需求為关注点,未来需要进一步完善需求保障
研究分析可得患者就医体验的变化,这些变化在某种程度上也反映了影响患者在就医过程中的主要关注点。通过热点图谱可见患者的健康需求为主要影响因素。患者对各种医疗服务的需求是否被满足与就医体验正相关,医疗卫生等部门机构未来应落实“以患者为中心”的服务精神,将服务模式从“能提供什么”转变为“需要提供什么”,提升服务满意度。
网民对就医服务的情感价值存在提升空间,未来应注重情感支持与人文关怀
情绪价值对网民就医体验和就医行为存在积极影响,当接受医疗服务时,患者期望获得更好的情感体验也演化为健康需求的一部分,即不只是基于业务关系的医患沟通,更多的是情感上的支持和关怀。未来应更多地关注患者就医过程中的情感体验,予以更丰富的情感支持和人文关怀,从而提升患者的就医体验。
坚持落实分级诊疗制度,确保能最大限度利用有限的医疗资源
看病难,主要是因为难以享受优质的医疗资源,实施分级诊疗制度可以有效促进医疗卫生资源的合理配置、基本医疗卫生服务公平化的关键举措。未来应在深化医改的基础上,明确各层次医疗机构的职能定位,推进不同级别机构间的协同合作,促进形成高效的分级诊疗模式。
搭建官方信息沟通平台
做好官方微博等沟通渠道建设,积极接受公众网民的评论、建议,有利于及时掌握网络舆情状况,及时全面了解与医疗相关的新闻、热点动态,有针对性、高效地把握处理网络舆情的时机,也可以为医疗机构媒体宣传提供帮助。
做好负面言论的处理工作
积极关注网民公众的就医需求和情感状态,结合微博等网络平台,及时对负面消极评论进行澄清回复,对疑问咨询细心解答,针对发布不良言论的用户,采用教育警告等惩罚措施,阻止违法信息的进一步传播。
建立网络舆情协调管理体系
网络舆情的处理往往牵涉多方利益的部门系统,由于信息沟通不充分、整体
规划不合理等问题的出现,可能会在处理过程中产生回避推卸责任,导致舆情处理不及时的后果。医疗机构应加强网络舆情协调管理体系的建设,全方位、科学合理整合规划资源,使不同机关部门能够各司其职、积极处理,体现统筹协调能力。
研究借助微博平台,搜集网民关于就医体验的博文内容,使用Tf—idf算法进行特征降维,Snow NLP分析模块進行情感分析,绘制微博平台用户就医体验热点图谱,分析用户就医关注点和情感体验,为今后提升医疗机构服务水平提供建议。研究发现,网民就医体验总体较好,患者的健康需求、推荐意愿、医疗服务质量和服务便利可及性是主要的关注点,看病难、看病贵、看病烦等问题仍是影响患者就医体验的主要因素。未来应进一步完善需求保障,注重情感支持与人文关怀,坚持推进分级诊疗制度,提升民众的就医满意度。此外,本文在研究过程中依然存在一定不足之处:研究仅针对微博用户数据进行分析,数据来源渠道相对简单;并且情感分析只是基于Python的第三方库,数据处理过程也较为简单。在未来将会基于更多平台,扩大数据样本的全面性,提高研究结果的科学性、准确性。
参考文献:
[1]微博数据中心.2020年微博用户发展报告[EB/OL].(2021-03- 12)https://data.weibo.com/report/reportDetail?i d=456.
[2]吴鹏,刘恒旺,沈思.基于深度学习和OCC情感规则的网络舆情情感识别研究[J].情报学报,2017,36(09):972—980.
[3]赵妍妍,秦兵,刘挺.文本情感分析[J].软件学报,2010.
[4]左芬.突发事件网络舆情的负面效应及其应对研究[D].湖南师范大学.
(作者单位:1.南京医科大学医政学院
2.南京医科大学第一附属医院)