APP下载

养老服务视角下城市老年人用户画像构建*

2021-10-08何振宇朱庆华

情报杂志 2021年9期
关键词:画像标签养老

何振宇 朱庆华 白 玫

(1.南京大学信息管理学院 南京 210023;2.南京大学工程管理学院 南京 210093)

0 引 言

我国老龄化进程较西方发达国家虽然较晚,但发展速度却非常快。按照《中国发展报告2020:中国人口老龄化的发展趋势和政策》[1]的预测,2022年左右65周岁及以上人口将占总人口的14%以上,预计到2050年时老年人口将达到5亿。这意味着养老问题已经成为急需解决的社会问题。

智慧养老是指利用先进的物联网等信息技术手段,能够为人民群众带来智能化、物联化、个性化养老服务的新型养老模式[2]。为了实现智慧养老产业健康快速发展,国务院在《国务院关于积极推进“互联网+”行动的指导意见》中将“促进智慧健康养老产业发展”作为“互联网+”益民服务重点行动中的子行动提出[3],工业和信息化部、民政部、国家卫生计生委在《智慧健康养老产业发展行动计划(2017-2020年)》[4]中提出:“到2020年,基本形成覆盖全生命周期的智慧健康养老产业体系。”我国智慧健康养老产业正面临着前所未有的机遇与挑战。养老服务产业虽然核心服务对象是老年人,但随之而来的却是一个拥有勃勃生机的新型市场。如何准确挖掘老年人群体的养老服务需求,提供精准的定制化养老服务,成为了养老服务平台方和提供商的关注焦点。目前广泛应用于电子商务、社交媒体等领域的用户画像,正适合应用在养老服务领域。

1 文献综述

1.1养老服务养老服务是指国家和社会以发扬敬老爱老美德、安定老年人基本生活、维护老年人生理健康、充实老年人精神文化生活为目的而采取的政策措施和提供的设施服务的总称[5]。席恒[6]将养老服务体系划分为7个基本要素,分别为养老服务的内容、形式、制度、管理、经济、技术和文化。其中,对于养老服务的内容归纳为生活照护、医疗护理、心理慰藉、临终关怀四项,如表1所示。

表1 养老服务内容

国务院办公厅发布的《社会养老服务体系建设规划(2011—2015年)》[7]将我国社会养老服务体系划分为居家养老、社区养老、机构养老三个部分,其中居家养老服务涵盖生活照料、家政服务、康复护理、医疗保健、精神慰藉等;社区养老服务包括社区日间照料和居家养老支持两类功能,主要面向家庭日间暂时无人或者无力照护的社区老年人提供服务;机构养老服务主要通过老年养护机构为失能、半失能的老年人提供专门的助餐、助浴、助洁、应急等服务。

目前国内对于养老服务需求的研究大多集中在需求分析和影响因素分析两方面。蔡中华[8]采用问卷调查方式,发现吉林市的老年人对专业化程度高、有专门管理机构、有持续资金投入的养老服务有较高需求,对社区医疗护理服务和精神文化生活服务强烈关注。姜向群[9]的研究发现由社区或街道组织提供的日常生活照料服务也逐渐被老年人所接受,一定程度上弥补了家庭照料资源短缺和社会化服务发展不足的缺陷,但目前的社区服务内容单一,难以满足老年人多元化的需求。黄雅颖[10]的研究发现独居老年人的养老服务需求与正常差异较大,更希望社区能提供配餐送餐服务和精神慰藉,以解决生理和精神需求。

吉鹏[11]通过实地调查,发现农村老人对市场化居家养老服务项目的需求程度不仅受个人特征因素的影响,包括年龄、性别、受教育程度、慢性病状况、个人年收入,同时也受家庭特征因素的影响,包括婚姻状况、儿子数、女儿数、家庭经济状况,还受子女关系的影响。章甜甜[12]采用多项logit模型实证研究发现年龄、文化程度、婚姻状况、月收入、原工作单位性质对老年人居家养老服务需求的影响有统计学差异。魏民[13]的研究认为子女数量、患慢性病种类、月收入、抑郁状态影响老年人选择养老服务。董倩楠[14]认为不同文化程度和日常活动能力的老年人对养老服务的需求存在差异。

1.2用户画像用户画像(User Persona)的概念最早是由交互设计领域的学者Alan Cooper提出的,他指出,用户画像是现实中目标用户的具体表示,又被称为用户角色,是基于大量目标用户的信息构建的用户标签体系,是对产品或服务对应的目标人群做出的特征刻画,进而实现产品的优化设计和服务的精准投放,如图1所示。用户画像的内涵包含三个要素, 即用户属性、用户特征、用户标签,区别于普通的用户研究, 用户画像研究更加关注用户整体特征, 试图还原用户全貌从而了解用户需求并提供服务[15]。

目前用户画像的研究涉及电子商务、医疗健康、旅游、图书馆等多个领域[16]。从构建方法的角度,主要有基于用户行为、兴趣偏好和本体三种画像构建方法。

从用户行为角度,费鹏[17]在研究中系统融合了用户网络消费行为特征,由此抽象出绘制用户画像的该模型框架能够快速、准确地识别出电费敏感型客户。王仁武[18]基于图书馆用户的访问日志数据,构建了学术用户的画像标签体系,从而进行资源服务推荐。汪强兵[19]收集用户的手势行为数据及手势对应的内容挖掘用户兴趣,根据数据构建用户兴趣画像并基于用户兴趣画像对用户进行推荐实验。

从用户兴趣偏好角度,张钧[20]以图书馆用户为例,构建了融合读者兴趣的用户画像,提出图书馆读者画像的知识发现服务模型。Hoang[21]将推特用户的用户行为和社区兴趣结合起来,提出了同时基于行为和兴趣的用户画像构建模型。Tang[22]使用概率主题模型对提取的用户信息进行建模,并构建用户兴趣模型。

从本体角度,Edwards[23]构建了本体OntoProfi来实现针对网络购物者的个性化画像呈现,研究结果表明该方法具有灵活性、可扩展性和可重用性,用户和电商对其接受程度很高。单晓红[24]以在线评论数据为基础,从用户信息属性、酒店信息属性和用户评价信息属性三个维度构建用户画像模型的概念模型,并采用Protégé工具建立本体来实现用户画像属性之间的关联,完成对酒店用户特征的完整刻画。

虽然目前学者们针对很多用户群体进行了用户画像刻画,但鲜有针对老年人用户的研究。从养老服务视角对老年人用户构建用户画像,有利于政府、社区和相关企业有针对性地设计和提供养老服务,提升老年人用户体验,推进智慧健康养老产业发展。

现有的养老服务需求研究大都采用访谈和问卷调查的方式,以老年人用户自我认知的“养老服务需要”来代表“养老服务需求”。但是在国外的养老服务研究中,二者是进行严格区分的,服务的实际消费和使用情况更能代表老年人用户的“养老服务需求”[25]。在如今“互联网+智慧养老”的背景下,养老服务的实际消费和使用情况是能够通过社区养老服务平台采集和利用的,由此进行需求分析相较于访谈和问卷调查,更能体现老年人用户的真实需求。考虑到社区养老服务平台的普及程度和城乡老年人用户群体的实际差异,本研究选择城市老年人作为研究对象,通过构建老年人用户画像的方式,划分用户类别并挖掘真实养老服务需求,为养老服务平台方和服务商提供参考。

2 研究设计

目前基于用户行为的用户画像构建的研究和应用在电子商务领域最为广泛。从数据源上来说,电子商务领域采集的用户行为数据以网络行为数据为主,而本研究使用的老年人用户信息数据则是纯粹的日常行为数据;从用户数量上看,电子商务网站的用户量是数以亿计的,而一个社区愿意通过养老服务平台或其他渠道获取养老服务的老年人可能只有几十个甚至更少,因此不能直接照搬现有的用户行为画像模型,要对模型作出针对性改进。

2.1方法流程想要构建用户画像,首先要从用户标签入手。用户画像从某种程度上来说,就是反映用户信息全貌的一个标签集合[26]。本研究选取层级标签构建方法来构建老年人用户画像,该层级标签结构的一般构成为:

(1)原始输入层。主要指用户的原始数据信息,例如用户登记信息、消费信息、网络行为信息等一系列未经处理的信息。

(2)事实层。事实层主要是用户信息的准确描述层,其最重要的特点是,可以从用户身上得到确定与肯定的验证。如用户的人口属性、性别、年龄、籍贯、会员信息等。

(3)模型层。模型层由一个或多个事实标签组合而成,是基于模型训练的结果,能够描述用户更为深刻的信息。

(4)预测层(有些使用情景下称为高级层)。在原有模型层的基础上总结出用户标签,通过打标签还能实现对新用户的行为预测。

该方法的一般构建步骤如下:

(1)通过多种类型渠道收集用户原始数据,根据应用场景和目标的不同,这些原始数据可以是人口数据(姓名、性别、年龄)、网络数据(浏览路径、页面停留时间)、消费数据、位置数据、设备数据、行为数据、社交数据等等。

(2)通过对原始数据的结构化处理、清洗、匹配,获得准确的事实层数据。常用方法包括统计分析、文本挖掘(TF-IDF、LDA)、分类聚类计算(神经网络、SVM支持向量机、K-means)等。

(3)模型层由一个或多个事实标签组合而成,是基于模型训练的结果。使用机器学习的方法,结合推荐算法,在模型层完成对用户的标签建模与用户标识,其主要可以采用的算法有回归、决策树、SVM支持向量机等。通过建模分析,可以进一步挖掘出用户的群体特征和个性权重特征,从而完善用户的价值衡量,服务满意度衡量等。

(4)利用预测算法,如机器学习中的监督学习,计量经济学中的回归预测,数学中的线性规划等方法,实现对新用户的预测(流失预测、忠实度预测、兴趣程度预测等等),从而实现精准营销、个性化和定制化服务。

2.2模型构建本研究基于老年人用户养老服务数据构建了用户画像层级标签模型,如图1所示。

图1 城市老年人用户画像层级构建模型

具体分层建模流程如下:

(1)原始层。本研究所能收集到的原始数据主要有老年人用户在养老服务中心留下的基本登记数据、老年人用户在注册智慧养老平台账号时提供的相关基本信息和需求信息、老年人用户在使用养老服务平台获取养老服务时生成的订单数据。

(2)事实层。经过对原始数据的观察讨论,本研究认为通过对原始数据进行清洗、统计、整理可以得出以下事实层数据:

① 人口属性(姓名、身份证号、性别、年龄、所属省市社区)。

② 身体状况(自理、需要适当照顾、半失能、失能)。

③ 居住状况(与子女同住、夫妻双方居住、独居)。

④ 经济状况(平均月收入:670元以下、670-1340元、1340-1750元、1751-3000元、3000元以上)。

⑤ 老年人用户注册账户时填写的养老服务预计需求类别(助餐、助行、助急、助洁、助乐、助学、助医、助浴、护助)。

⑥ 老年人用户现实下订单获取的养老服务类别(助餐、助行、助急、助洁、助乐、助学、助医、助浴、护助)、服务时间、服务金额。

(3)模型层。基于业务逻辑和订单规则,对事实层数据进行组合、建模得到的模型层指标,具体包括:

① 用户价值指标(最近一次获取养老服务距今时间、一段时间内获取养老服务次数、一段时间内养老服务消费总金额)。

② 真实服务需求指标(真实服务类别)。

(4)预测层。考虑到用户样本数和数据维度都不高,因此最终构成画像预测层的标签数量也不宜过多。本研究最终选择了用户价值级别、真实服务需求两个标签组成预测层。

① 用户价值类别:基于用户价值指标对老年人用户价值作出区分。

② 真实服务需求:基于老年人用户人口属性、身体状况、居住情况、经济状况、养老服务需求类别等指标对老年人用户的真实养老服务需求作出预测。

3 数据分析

3.1描述性统计本研究依托的平台是烽火祥云网络科技有限公司设计开发并投入使用的社区智慧养老平台,其中武汉市12个街道共108个社区的老年人用户的数据为数据来源。数据采集时间为2018年7月20日到2019年12月3日,内容包括老年人用户在养老服务中心留下的基本登记数据、老年人用户在注册智慧养老平台账号时提供的相关基本信息和需求信息、老年人用户在使用养老服务平台获取养老服务时生成的订单数据。

老年人用户经济状况方面,如表2所示,共有62.4%的老年人用户平均月收入处于1750~3000元区间,占了总数的一半以上,故在本研究中将平均月收入处于1750~3000元区间的老年人用户的经济状况标签赋值为一般。相对应的,将平均月收入处于3000元以上的老年人用户经济状况赋值为高,将平均月收入低于1750元的老年人用户经济状况赋值为困难。

表2 老年人用户经济状况

老年人用户居住状况方面,如表3所示,有13.5%的老人处于独居状态,夫妻双方居住和与子女居住数量相差不大,故本研究将老年人用户居住情况标签分别赋值为独居、夫妻双方居住、与子女居住。

表3 老年人用户居住情况

老年人用户身体状况方面,如表4所示,86.1%的老年人用户可以生活自理,13.9%的老年人不能做到生活完全自理。考虑到老年人用户身体状况与养老服务需求密切相关,尽管失能、半失能、适当需要照顾的老年人用户占比均不高,但本研究不进行合并处理。故将这老年人用户身体状况标签分别赋值为可自理、适当需要照顾、半失能、失能。

表4 老年人用户身体状况

订单数据方面,由2018年7月20日到2019年12月3日的数据采集期中,共记录了5 967条养老服务订单信息,具体订单类型与数量如表5所示,助餐和助乐是最常用的两种养老服务模式:其中助餐服务累计4 259次,平均每次消费18.3元;助乐服务以免费线上影视资源为主,无需消费。这5 869条养老服务订单信息集中在609位老年人用户身上,占总用户数量的7.5%,与我国养老服务“9073”格局(90%老人由家庭自我照顾,7%老人享受居家养老服务,3%享受机构养老服务)相吻合。订单最多的老年人用户在这1年多的时间里累计使用养老服务480次,平均每位用户使用养老服务9.6次。

表5 养老服务订单信息

3.2用户价值类别标签

3.2.1 RFM(Recency、Frequency、Monetary)模型 顾名思义,用户价值指的是用户对平台而言的“价值”,用户价值越高,越值得平台重视并倾斜资源。本研究采用RFM模型来实现用户价值类别标签的判定。

在RFM模型中, 近度 (Recency) 指最近一次消费, 也即客户最近一次购买产品或服务的消费状况。上一次消费时间越近的客户对提供的即时商品或是服务最有可能反应, 价值相对较高。频度 (Frequency) 是指在一定期限内客户进行消费的次数。消费频率越高的客户, 其对产品的满意度越高, 忠诚度越高。值度 (Monetary) , 也就是消费金额, 是客户价值最为直观的体现, 消费金额越高, 其为公司创造的利润也就越高[27]。

根据本研究采集数据的特点,研究对RFM模型各指标的定义如下:

R:由于数据采集截止2019年12月3日,故R取值为最近一次获取养老服务距2019年12月4日天数。

F:由2018年7月20日到2019年12月3日内获取养老服务次数。

M:由2018年7月20日到2019年12月3日内养老服务消费总金额。

3.2.2 基于RFM模型的用户价值分类 利用RFM模型对用户细分主要有两种方法,第一类是加权求和获得价值评判值, 再分段划分类别。设置指标权重, 使权重与RFM模型各指标的计算结果相乘得到各指标的加权指标值, 让最终的加权指标值相加以获得RFM指标的总值, 最后设置阈值以获得客户分类结果, 并且大于阈值的为高价值客户, 小于阈值的为低价值客户[28]。考虑到这种划分方式仅仅能将用户分为两类,本研究选择使用另一种用户细分方式。

另一种方式是R、F、M三个指标都进行分类,以指标值是否大于指标均值作为判别标准,将用户进行初步划分,如表6所示。

表6 初步用户分组

在每个指标层面都对用户进行二分之后,所有老年人用户就被划分为2^3=8个不同用户群体,每个群体价值均有差异,如表7所示。

表7 用户分组

由此,本研究将R、F、M指标是否高于指标均值作为标准,由这3个维度将用户价值类别划分为重要价值用户、一般价值用户、重要发展用户、重要保持用户、一般发展用户、一般保持用户、重要挽留用户、一般挽留用户8类。

其中,4类用户值得平台重点关注并倾斜资源:

(1)重要价值用户:即最近刚刚使用过养老服务,使用频率和消费金额都很高的老年人用户,这是社区智慧养老平台的最核心的稳定用户群体。

(2)重要保持用户:即有一段时间没有使用养老服务了,但曾经的使用贫富和消费金额都很高的老年人用户,这类用户属于平台的忠实用户,但有流失的风险,需要平台主动与其沟通,改善服务,使其继续使用社区智慧养老平台来获取养老服务。

(3)重要发展用户:即最近刚刚使用过养老服务,消费金额较高,但使用频率不高的老年人用户。这类用户具有极高的消费潜力和发展价值,平台可以对此类用户多推送各类服务,提升其使用服务的几率。

(4)重要挽留用户:即有一段时间没有使用养老服务,使用服务频率不高,但消费金额高的老年人用户。这类用户有消费潜力,但极易流失,需要制定挽留措施。

3.3真实服务需求标签无论是在电商领域还是其他领域,构建用户画像的最终目的都是挖掘用户的真实需求,进而提供有针对性的服务。尽管老年人在注册养老服务平台账号时已经勾选过自身需要的养老服务,但经过对比发现,很多老年人并没有选择获取这些养老服务。无论是因为主观还是客观的原因,老年人用户自我认知的养老服务需求与实际的真实服务需求并不吻合,毫无疑问老年人用户的真实养老服务需求更为重要。因此,本研究要分析老年人用户养老服务数据与其真实服务需求的联系,从而做到预测新用户与潜在用户(虽然注册了平台但尚未使用养老服务)的真实服务需求类型,实现精准推荐。

研究选择根据老年人用户性别、年龄、健康状况、经济情况、居住方式、需求类型来预测老年人用户的真实服务需求。考虑到变量复杂度和模型拟合效果,本研究选择BP神经网络方法来预测真实服务需求。

3.3.1 基于BP神经网络的真实服务需求预测 本研究采用了BP神经网络模型,以老年人用户性别、年龄、健康状况、经济情况、居住方式、需求类型作为输入数据,以用户真实服务需求类型作为输出数据,构建了一个3层BP神经网络来实现对用户真是服务需求的预测。具体步骤如下:

(1)确定输入层:输入层由性别、年龄、健康状况、经济情况、居住方式、需求类型6个节点构成,其中年龄数值型指标可以直接输入神经网络,其余指标为类别指标需要将其数值化。考虑到这些类别指标并不是等距划分,不适合用1,2,3,4代替,因此本研究用向量表示这些类别指标。例如居住方式向量表示为(独居、夫妻双方居住、与子女居住),独居的老年人用户居住方式表示为(1,0,0),与子女居住的老年人用户居住方式表示为(0,0,1);需求类型向量表示为(助餐,助行,助急,助洁,助乐,助学,助医,助浴、护助),有助餐和助医需求的老年人用户需求类型表示为(1,0,0,0,0,0,1,0,0)。

(2)确定输出层:神经网络的输出层为老年人用户真实服务需求类型,即其所有下单记录的类别统计。与需求类型类似,同样以向量的形式表达。以某随机某用户为例,他总计获取助餐服务17次,助乐服务5次,助医服务1次,则其真实服务需求表示为(17,0,0,0,5,0,1,0,0)。

(3)隐含层节点数:考虑到实际使用平台获取服务的老年人用户样本共607人,隐含层节点不宜过多,否则容易发生过拟合现象。根据经验公式(1),确定隐含层节点数h取值范围为[1,5]。

(1)

其中m,n,a分别为输入层节点数,输出层节点数,调节常数。

(4)神经网络参数:网络训练方法选取trainlm,节点传递函数选取tansig,最大训练次数epochs为500,目标误差goal取值为0.01,学习率lr取值为0.1。

3.3.2 预测结果 研究将607名老年人用户分为两组,其中507名老年人用户的养老服务数据用作训练数据,剩余100名老年人用户的养老服务数据作为测试数据。实验工具使用MATLAB,隐含层节点数取值从1到5分别基于训练数据得出一个BP神经网络。将测试数据输入神经网络,输出向量中数值最大的需求类别作为预测结果,将真实结果与预测结果对比,预测准确率如表8所示。

表8 神经网络预测准确率

可以看出,有3个神经网络的判别准确率超过80%,其中隐含层节点数选取为2的时候判别准确率最高。

3.4用户画像展示以用户价值类别标签和用户真实服务需求标签作为本研究老年人用户画像的核心标签,辅以健康状况、经济情况、居住方式等事实层标签,构成了最终的基于社区智慧养老平台数据的老年人用户画像标签体系。以任意老年人用户为例,最终得出的用户画像的主要标签展示如图2所示。

图2 老人甲用户画像展示

4 结 语

本研究从用户画像视角来实现老年人养老服务数据挖掘,选取了层级标签画像构建方法,对原始数据进行逐层探讨,设计了各层标签的属性和赋值,然后在此基础上提炼出了用户价值类别和真实服务需求两个第四层标签用以构建最终的老年人健康用户画像。老年人养老服务用户画像不仅能够促使社区养老服务中心针对不同类型不同标签的老年人提供有针对性的社区服务,也能为诸多智慧养老行业服务提供商的服务精准推送和产品开发商的产品设计提供参考依据,从而带动相关产业发展。

本研究的贡献在于:(1)区分了老年人用户的主观“需要”和真实“需求”,通过养老服务的现实消费和使用情况来分析老年人用户的真实需求。(2)尽管用户画像在许多领域得到广泛应用,但本研究针对城市老年人用户构建了用户画像,从而可以更精确把握老年人的养老服务需求。

受限于数据采集范围、隐私问题、养老服务普及度等原因,本研究采集的数据在维度和数量上都有待进一步补充和增加,构成画像的标签体系也较为简略。在未来的研究中,应把其他城市乃至农村老年人用户都纳入研究范围,从更丰富的渠道收集养老服务多源数据,实现更深层次的养老大数据挖掘。

猜你喜欢

画像标签养老
威猛的画像
养老生活
“00后”画像
画像
无惧标签 Alfa Romeo Giulia 200HP
不害怕撕掉标签的人,都活出了真正的漂亮
养老更无忧了
以房养老为何会“水土不服”?
养老之要在于“安”
让衣柜摆脱“杂乱无章”的标签