居家养老服务判别分析与服务推荐算法
2021-09-18张传一黄迎春蒋华萍项子珂胡海雷张政阳
张传一 黄迎春 蒋华萍 项子珂 胡海雷 张政阳
摘 要:伴随中国老龄化社会的逐步到来,利用大数据和人工智能技术匹配养老资源供给与居家养老需求成为亟待解决的问题。分析目前居家养老需求,建立居家养老服务数据模型,采用大数据技术构建居家养老服务分类组别,提出居家养老服务复合判别分析算法,设计面向服务架构的养老服务发现与推荐算法,采用爬取网络数据和仿真生成数据相结合方式验证了所提出算法的有效性。
关键词:居家养老 判别分析 服务推荐算法 面向服务架构
中图分类号:D669.6 文献标识码:A文章编号:1672-3791(2021)05(b)-0019-05
Abstract: With the gradual arrival of Chinese aging society, it is an urgent problem to use big data and artificial intelligence technology to match the supply of old-age care resources and the demand for home-based old-age care. Analysis of the current home-based care services, the data model of home-based care services is set up, using big data technology to build home endowment service classification categories, family endowment service composite discriminant analysis algorithm, design of service-oriented architecture endowment service discovery and recommendation algorithm, using crawl way of network data and simulation data generated to verify the effectiveness of the proposed algorithm.
Key Words: Home-based care; Discriminant analysis; Service recommendation algorithm; Service-oriented architecture
伴隨着中国老龄化社会的逐步到来,养老问题已经成为亟待解决的社会问题。目前养老方式主要有集中式养老和社区居家养老两种方式。居家养老是中国目前甚至是未来最主要的养老方式。目前的居家养老在信息技术的应用上还存在许多问题,主要表现在社会养老资源供给与养老服务需求的不匹配问题,即:虽然存在很多网络养老服务信息,但需要有效利用这些信息,对接居家养老服务供给与需求,满足老人个性化的居家养老需求。为此,许多学者开展了这方面的研究,所建立的模型和方法虽然在养老服务匹配和推荐方面进行了技术层面的探索,但在养老服务推荐的准确性和有效性方面还需进一步提高。因此,该文应用大数据和人工智能技术开展了相关研究,建立了居家养老服务模型,提出了复合判别分析算法和服务发现与推荐算法。
1 居家养老服务数据模型
为了能够更好地对居家养老的老人所需的服务进行服务判别、服务发现和服务推荐,参考智慧养老平台的构建准则[1]和基于行形式化描述的个性养老主题服务树模型[2],建立了由老人基本信息、健康状况、日常照料、医疗护理保健、精神咨询慰藉、文体娱乐活动、居家安全监控和法律金融科技支持8类指标数据模型,具体定义如下。
2 养老服务需求判别分析
在获取了影响养老服务需求的指标数据后,可进一步判别潜在的养老服务需求类型,该文提出一种基于大数据的养老服务需求复合判别分析方法。该方法首先采用大数据技术在可信的网站上爬取老人基本信息与养老服务需求的数据,然后建立养老服务分类组别,最后采用提出的复合判别分析方法对养老服务需求进行判别分析。
大数据处理流程包括数据采集、数据预处理与存储、数据处理与分析、数据可视化、数据应用等步骤。判别分析(Discriminant Analysis)是由费舍尔(R.A.Fishe)在1936年提出的一种多元统计分析方法,该方法根据观测到的一些指标数据对所研究的对象进行分类。与聚类分别方法不同,判别分析方法是在已知组别特征情况下对待判别的实例进行分类。
针对养老服务需求,提出一种复合判别分析方法,该方法的基本思想是:在判别分析过程中综合采用以下5种判别方法,如果这5种方法多数(至少3种)取得一致性的判别结果,则采用该结果;如果没有多数结果一致,则根据训练数据返回错误分类错误率的估计误差来输出判别结果,该误差是由组的先验概率加权的训练中被错误分类的观察的百分比,误差最小的分类结果将被采纳。参与复合分类的5种分类模型如下。
模型1(线性分类):用协方差的汇总估计,拟合每个组的多元正态密度。
模型2(对角线性分类):类似于线性分类模型,但是有一个对角协方差矩阵估计(朴素贝叶斯分类器)。
模型3(二次分类):用组分层协方差估计拟合多元正态密度。
模型4(对角二次分类):类似于二次分类模型,但具有对角协方差矩阵估计(朴素贝叶斯分类器)。
模型5(马氏距离分类):使用具有分层协方差估计的马氏距离。
其中,线性分类法假定表征k组类别的随机变量:
即各组的先验分布均为协方差矩阵相同的p元正态分布,此时由样本得出的协方差矩阵联合估计Σ;二次分类法也假设各组的先验分布均为p元正态分布,但协方差矩阵并不完全相同,此时可分别得出各个协方差矩阵的估计Σi,i=1 2 …,k;马氏距离分类法的各组协方差矩阵不完全相等,此时分别得出分组的协方差矩阵的估计,其中马氏距离是由印度统计学家马哈拉诺比斯(Mahalanobis)引入的,以下为马氏距离的定义:设Σ表示分类指标的协方差矩阵,即
3 基于SOA的养老服务发现与推荐算法
近年来,面向服务架构(Service Oriented Architecture,SOA)呈现蓬勃发展趋势,尤其随着互联网、物联网、云计算、大数据和人工智能技术的不断发展和应用,采用SOA架构的Web服务、云服务、App服务等多种服务应用越来越广泛。将SOA及其相关技术应用于居家养老服务对于提高服务发现、服务匹配和服务推荐等服务能力和质量越来越重要。在参考助老服务App软件中服务推荐策略[3]、供需主题画像模型匹配养老服务推荐系统[4]、基于深度学习多目标优化养老服务推荐方法[5]以及家庭护理服务实践测试结果[6]的基础上,该文采用形式化方法表达居家养老服务,并设计服务发现与推荐策略以实现高效的养老服务资源整合。服务发现需建立在服务匹配的基础上,下面给出服务匹配问题的定义。
定义9(服务匹配)给定一个服务需求集Q={q1,q2,…,qm }和服务候选集S={s1,s2,…,sn},服务匹配定义为函数f:Q×S→[0,1],使得f(qi,sj)作为衡量服务匹配程度的数量,其中:0≤f(qi,sj)≤1,f(qi,sj)=0表示服务完全不匹配,f(qi,sj)=1表示服务完全匹配。
在定义服务匹配的基础上,服务发现采用基于社交媒体信息的语义服务发现框架,通过服务信息语义的相似度、流行度、活跃度和衰退度这4个特征作为服务发现的影响因素。这4个特征可分为功能性和非功能性两种,其中相似度属于功能性因素,流行度、活跃度和衰退度属于非功能性因素,基于这些因素,设计了基于SOA的养老服务发现与推荐方法如下。
(1)对于功能性社交因素,利用潜语义索引(Latent Semantic Indexing,LSI)计算语义相似度。
(2)对于非功能性社交因素,即流行度、活跃度和衰退度,构造相应的评价函数对其进行度量。
(3)将功能性因素和非功能性因素整合为加权的统一评价模型。
(4)对于给定的服务需求,基于统一评价模型整合功能性和非功能性因素,生成推荐结果。
潜语义索引(LSI)是一个将查询需求输入和待查文档映射到同维度语义空间的模型,进而计算二者的相似度。LSI通过奇异值分解将词文档矩阵Xt×d分解为3个矩阵的乘积,分别是词矩阵Tt×n,奇异值矩阵Qn×n,以及文档矩阵Dd×n,即:
式中,t为词数量,d为文档数量,n=min{t,d}。基于LSI模型服务需求输入q与服务si之间的相似度函数如下:
式中,v为需求输入或文档在LSI模型中的词向量。
在非功能因素中,流行度反映功能类似的两个服务,用户更倾向选择的服务。由于不同服务的关注数量差异较大,为了将数据标准化,采用自然对数运算定义流行度评价函数:
式中,nfi为服务si的关注数量;minf和maxf分别为所有服务中关注数量的最小值和最大值。活跃度反映服务发布的频率高低,与流行度的计算方式类似,以服务的发推数量定义服务的活跃度如下:
式中,nti代表服务si的发推数量,mint和maxt分别表示所有服务发推数量的最小值和最大值。衰减度用来动态调整候选服务的权重,其定义如下:
式中,nli为包含服务si的列表数量,参数kd为列表数平均值的自然对数。
综上所述,服务匹配函数定义为以上4个因素的线性组合:
输入服务需求q和服务候选集S,采用函数f(q,si)计算服务匹配度,并生成降序的推的服务列表S={st1,st2,…,stn}。
4 仿真分析
4.1 复合判别分析仿真分析
为了验证复合判别分析方法的有效性,采用Web爬取的数据和仿真数据生成相结合的方式生成了判别分析所需的测试数据集,进一步通过数据裁剪和整理,基于Matlab语言的判别分析工具箱,实现了复合判别分析的仿真。基于Web爬取数据与仿真数据的复合判别分析分类结果见图1。
从图1可以看出,采用复合判别分析方法能够综合5种判别分析结果,降低了仅使用一种判别算法的判别错误概率。
4.2 服务发现与推荐算法的仿真分析
首先将定义3~8中列出的共计35种养老服务需求采用随机数仿真的方法产生原始需求数据,如果老人对服务指标点有服务需求,则该服务指标需求量化为数值1,反之,则量化为数值0。然后对于有服务需求的指标采用提出的服务发现与推荐算法进行服务匹配与推荐计算。例如:假设某位老人的养老需求数据量化为序列Q={0 0 1 0 1 1 1 0 0 1 1 1 0 0 0 1 0 0 1 1 1 0 1 0 1 0 1 0 0 0 0 0 1 1 1},序列Q有17个服务需求点的指标为1,因此对这些服务需求点采用服务推荐算法计算服务匹配度,设服务候选集S={s1,s2,s3},则该养老需求的服务推荐算法的计算结果见图2。
根据图2的结果,选取每个服务匹配度最大的服务形成的服务推荐集合为:{s2,s3,s2,s3,s3,s3,s1,s2,s1,s1,s2,s3,s3,s1,s3,s2,s1}。
5 结语
该文在研究居家养老服务需求的基础上,建立了居家养老服务需求系统数据模型,基于大数据技术的养老服务分类组别的构建,提出了针对居家养老服务的复合判别分析方法,设计了面向服务架构的养老服务发现与推荐算法,通过Web数据爬取和仿真相结合的方式测试了所提出算法的有效性。所提出的方法和算法可为居家养老服务系统的设计提供技术途径。
参考文献
[1] 郑岚.基于物联网技术的智慧养老平台建设探索[J].科技创新导报,2019,16(23):137-138.
[2] 卜云飞.面向养老服务的推荐方法研究及应用[D].哈尔滨工业大学,2017.
[3] 梁咏梅.助老服务APP及服务推荐策略研究[D].江西财经大学,2018.
[4] 董欣欣.基于供需交易主体画像的养老服务推荐系统设计与实现[D].哈尔滨工业大学,2018.
[5] 张恺琪.基于深度学习与多目標优化的养老服务推荐方法及实现[D].哈尔滨工业大学,2019.
[6] GUAY M, RUEST M, CONTANDRIOPOULOS D. Deimplementing Untested Practices in Homecare Services:A Preobservational-Postobservational Design[J].Occupational Therapy International, 2019, 2019(2):1-7.