APP下载

基于养老体验评论数据进行省域养老产业发展关注度演化研究

2024-10-20张毅张清龙李丹刘胜任宋欣欣

科技风 2024年29期

摘要:本文以江苏省养老产业体验者为研究对象,以社交媒体在线评论数据为基础,从具有养老需求的老年人及其子女的角度,借助LDA主题模型等文本挖掘方法,找到养老需求方面并计算其权重,研究复杂环境下省域养老产业发展关注度演化情况。

关键词:养老体验;省域养老产业;关注度演化

1概述

养老产业发展艰巨且复杂,呈现出多主体、多维度、多领域、多阶段的发展特征[1]。已有研究主要从养老政策、产业结构等宏观层面关注养老产业的发展[2],鲜有从养老需求的微观方面出发对养老产业发展以量化方式进行深入研究,同时对不同阶段和多种情景下的养老产业发展研究也不够全面。江苏省作为我国经济发达的地区之一,养老产业的发展备受关注。为了更好地了解江苏省养老产业的发展情况,本文以江苏省养老产业体验者为研究对象,以社交媒体在线评论数据为基础,从具有养老需求的老年人及其子女的角度出发,借助LDA主题模型等文本挖掘方法,找到养老需求方面并计算其权重,研究复杂环境下省域养老产业发展关注度演化情况。

2研究方法

2.1数据收集

本文选取IP属地为江苏省的“居家养老吧、社区养老吧、养老机构吧、养老吧、养老服务吧、医养结合吧”等有关养老话题的百度贴吧评论数据,最终爬取并收集了5974个评论数据。抓取时间为2021年1月至2023年3月。

2.2LDA主题模型

本研究通过LDA来识别大规模评论信息中潜在的主题信息。LDA的主要目的是根据每个文档的词频(文档由预定义的概率生成)来识别指定语料库的潜在主题[3],具体步骤如下:(1)特征权重计算。本文选取文本在特征向量上的权重的计算方法为词频——逆文档频率(TF-IDF),基于TF-IDF方法的LDA模型降低了主题词汇间的相似度[3],即当某个关键词在一篇文本中出现的次数越高而在其他文本中出现的次数越少,该关键词的权重和区分度就越高,则越具有代表性。(2)建立LDA主题模型。假设人们关于养老体验的评论组成整个集合D,其中某条评论d由N个关键词组成,并且假设评论集合D中含有k个隐含的主题。首先以一定概率生成该评论的一个主题分布,然后从上述被抽到的主题中生成对应的词分布,再根据主题中的词分布随机选取一个词,重复上述过程直至生成完整的主题以建立LDA主题模型[3]。(3)主题数选择。通过控制不同的主题数量分析困惑度指标,当主题数为6时,困惑度出现较明显变化且没有增长趋势,考虑到主题数过多模型会过度拟合,失去分析意义,因此选择最优主题数为6。

2.3用户评论文本主题挖掘结果

根据确定好的主题数得到每个主题的关键词分布,主题挖掘的部分词汇结果以及主题的特征识别归纳如表1所示。

2.4计算关注度

在本节中,本文借鉴Wang[4]的方法,捕捉有养老需求的消费者关注点在3个月时间间隔内的变化。使用等式(1)计算养老在不同时期对每个主题的关注度。

ADzt=∑mzi=1fzit×wki,z=1,2,…,15(1)

其中,ADzt是t时段内消费者对主题z的关注度,fzit是t时段内第z个主题中第i个关键词的词频,wzi是LDA话题建模得到的第k个主题中i个关键词的权重。

3复杂环境下养老体验的关注度演化研究

计算2020年01月至2022年03月期间每个养老需求关注度累积值、最大值、最小值、平均值和标准差,如表2所示,以分析养老需求的时间演化特征。

如表2所示,本文通过标准差表示关注度波动大小情况:首次发现关注度较高的是养老需求,一般其波动较大;关注度较小的养老体验其波动一般较小;特别是养老政策支持的关注度较大而波动较小。将养老体验关注度绘制成图,如图1所示,依据养老需求关注度的波动变化,可以将养老体验为两峰型和多峰型。按照以下思路分析:先刻画养老体验需求波动及趋势,然后重点关注养老体验关注度波动拐点,解释其发生原因。

图1养老体验2021.01—2023.03需求波动情况

注:横坐标1~9表示时间间隔,分别为1表示2021年1~3月、2表示2021年4~6月、3表示2021年7~9月、4表示2021年10~12月、5表示2022年1~3月、6表示2022年4~6月、7表示2022年7~9月、8表示2022年10~12月、9表示2023年1~3月。

3.1老人健康养生

由图1可知,老人健康养生属于两峰型,总体呈现下降趋势,在2021年9月出现了最显著的波峰。“老人健康养生”包含的主要关键词有“食物、养生、疾病、预防”等,如表1所示,由此推测养老对老人健康养生的关注主要是身体健康、食物营养、疾病预防、运动锻炼等养生方式,是与身体生理、自身安全与健康保障相关的话题。《养生堂》等节目在抖音等平台发布有关老年人养生的视频,粉丝1623.7万,点赞关注量为7000万,使得“老人健康养生”关注度上升,由此产生关注度的波峰。抖音等社交媒体平台推送的内容是被官方认可的、具有导向和警示作用的内容,高点赞量也说明在养老群体中的普遍性,不难发现社交媒体和舆论对养老需求有影响。

3.2医养结合需求

由图1可知,医养结合需求属于多峰型,总体呈现下降趋势,其中关注度最明显的波峰出现在2022年9月。由表2可知,关注度均值最大,标准差波动排名第二,极差排名第二。“医养结合需求”主要的关键词有“服务、服务平台、生活、医疗”,如表1所示。在苏杭地区,医养结合为老年人提供居家生活照料、巡诊、康复护理、送餐、助餐等服务,其波峰的产生依托社区居民网上健康学习平台等,在社区推进健康管理的知识普及,提高老年人健康素养和自我管理水平,且针对老年人视力功能、口腔健康、营养状况等进行早期筛查干预措施,实现健康评估和功能维护,加强老年人的健康管理、身体机能训练和慢病运动干预等[5]。

3.3失能老人护理

由图1可知,失能老人护理属于多峰型,呈现下降趋势,其中主要的波峰出现在2021年12月。由表2可知,关注度均值排名第四,标准差波动程度排名第三,极差排名第四。“失能老人护理”主要的关键词有“照顾、护理员、选择、自理、设备”,如表1所示,可以发现,“失能老人护理”造成的问题主要是养老机构及服务人员是否能够提供自理老人必需的照护服务和生活需求。随着人口老龄化的上升,失能老人护理不仅是老人与子女的需求,也是人民群众的共同期盼、政府保障和改善民生、促进社会共享发展的重要内涵[6]。

3.4养老机构环境

由图1可知,养老机构环境属于双峰型,呈现上升趋势,其中最高的波峰出现在2021年12月。由表2可知,关注度均值排名第六,标准差波动排名第五,极差排名第五。“养老机构环境”主要的关键词有“电动、装修、扶手、自动”,如表1所示。养老机构的环境通常依其地域、人文和服务类别的不同而有各自的设计要求。由于老年人的生活能力和活动范围有限,江苏省“养老机构环境”包括公寓先进的设施设备和社区自然环境。因此,从评论中可知,老年人及其子女认为养老机构的设施越便利、社区环境越适宜,适应过程持续时间越短。

3.5养老机构宣传

由图1可知,养老机构宣传属于多峰型,呈现下降趋势,其中最高波峰出现在2021年6月,最低波谷出现在2022年3月。由表2可知,关注度均值排名第五,标准差波动排名第四,极差排名第三。“养老机构宣传”涉及主要的关键词是“展会、参观、公寓、展示、传播、品牌”,如表1所示。养老体验的关注点之一是“养老机构宣传”是由于养老机构的宣传工作,比如参观展会、公寓,现场体验,品牌交流等,可以通过物理接触或者实践获得养老机构设施设备的交互体验和反馈,增加老年人及其子女对养老机构和养老服务的认知和了解。

3.6养老政策支持

由图1可知,养老政策支持属于多峰型,呈现下降趋势,其中“养老政策支持”最明显的波谷出现在2022年3月。由表2可知,养老政策支持的关注度较大而波动较小,其关注度均值排名第三,标准差波动排名第六,极差排名第六。“养老政策支持”频繁出现的词是“政府、技术、国家、政策、管理”,如表1所示。江苏省作为中国最早进入老龄化社区的地区之一,在解决老龄化问题上进行了诸多尝试。省政府出台了《省政府关于全面放开养老服务市场提升养老服务质量的实施意见》《省政府关于进一步推进养老服务高质量发展的实施意见》等多项政策。正是由于江苏省重视优化养老资源和提高养老服务的政策支持,江苏省百姓对养老产业的关注度更高[7]。

4结论

本文利用LDA主题模型应用于百度贴吧养老评论,识别养老需求并计算其关注度,通过关注度演化分析试图长期跟踪养老体验演化趋势。

首先,本文发现了一些新的规律,养老机构宣传、养老机构环境、失能老人护理、老人健康养生、医养结合需求、养老政策支持是养老体验最关注的养老问题。

其次,本研究发现一些有趣的规律:(1)关注度平均值高的养老体验需求,其波动幅度一般也较大;(2)关注度平均值低的养老需求,其波动幅度一般较小;(3)存在例外,养老政策支持的关注度平均值较高而波动幅度较小;(4)医养结合需求关注度平均LmUA7M40NqHoCqIUJKy1+w==值最高,老人健康养生的波动幅度最大;(5)医养结合需求、养老政策支持、失能老人护理、养老机构宣传的关注度是上升趋势,老人健康养生、养老机构环境的关注度是下降趋势;(6)关注度上升的养老需求数量多,关注度下降的养老需求数量少。

最后,本文发现养老需求关注度受社交媒体和相关舆论影响较大。因此,养老产业发展需要关注社会媒体的舆论引导,限于篇幅虽无法使用严格的计量经济模型验证,但是抖音(Tik

Tok)等社交媒体对养老需求的影响似乎存在某种联系,后期再做研究。

参考文献:

[1]李晓娣,原媛,黄鲁成.政策工具视角下我国养老产业政策量化研究[J].情报杂志,2021,40(04):147-154.

[2]何秋洁,杨晓维.大健康产业与养老服务的耦合协调度分析[J].软科学,2019,33(10):45-49.

[3]KimD,SeoD,ChoS,etal.Multi-co-trainingfordocumentclassificationusingvariousdocumentrepresentations:TF-IDF,LDA,andDoc2Vec[J].Informationsciences,2019,477:15-29.

[4]WangY,ChiY,XuJH,etal.Consumers'attitudesandtheireffectsonelectricvehiclesalesandcharginginfrastructureconstruction:anempiricalstudyinChina[J].EnergyPolicy,2022,165:112983.

[5]杨哲,陈思思,陈永妍.社区医养结合服务参与主体行动逻辑及调适策略[J].中国管理科学,2023,31(04):218-227.

[6]李建伟,吉文桥,钱诚.我国人口深度老龄化与老年照护服务需求发展趋势[J].改革,2022(02):1-21.

[7]廖阳,郑嘉茵.城市居民入住养老小镇意愿影响因素分析[J].统计与决策,2019,35(17):116-119.

基金项目:本文是国家社科基金项目“网络社群对即时众包物流平台用户体验的影响研究”阶段性成果(项目编号:22BGL124);江苏省卫生健康发展研究中心课题“复杂环境下省域养老产业发展战略模式与政策研究”阶段性成果(项目编号:JSHD2021058);中国高等教育学会2021年度专项课题“基于人才培养效率的区域高等职业教育评价改革研究”(项目编号:21ZJD15)

作者简介:张毅(1980—),山西人,博士,教授,研究方向:养老产业管理;张清龙(贡献等同于第一作者)(1977—),江苏人,硕士,高级会计师,江苏省卫生健康发展研究中心副主任,研究方向:人口政策研究、卫生政策研究。