APP下载

面对智能分诊的个性化推荐算法

2021-09-10王春成蒋永超金燚

客联 2021年2期
关键词:推荐系统协同过滤

王春成 蒋永超 金燚

【摘 要】针对电子医疗信息过载和医疗资源严重不足的问题,本文以辅助诊疗的结果为基础,将Skyline查询和局部范围内基于协同过滤的评分方式有机结合,提出了一种面向智能导诊的个性化推荐算法。实验结果表明,本文提出的算法能为用户提供个性化的合理推荐结果。该方法对合理分配和使用医疗资源有很大的促进作用,能从一定程度上缓解就诊压力,提高就诊质量,具有重要的实用价值和社会意义。

【关键词】辅助诊疗;智能导诊;Skyline查询;医疗推荐;协同过滤;推荐系统

中国人口数量与医疗资源之间的巨大反差使得医疗资源日趋不足,短期内增加医疗资源的总量几乎是不可能的,因此有效整合和合理分配现有的医疗资源,缓解就诊压力,提升就医质量,有着很大的实用价值与社会意义。智能导诊根据患者的主诉为患者自动推荐相应的医院和医生,对合理分诊起着重要作用。从数据的角度看,智能导诊是针对患者主诉和基本信息对医院和医生的推荐。

一、相关工作分析

近年来国内外与医疗领域推荐相关的研究很多,M.L6pez-Nores等[1]引入了一种新的过滤策略, 对于有特定疾病的患者,这种推荐方法的效率较高。徐守坤等提出过一种医生资源均衡推荐算法,使用最佳结果优先的推荐算法,解决了医疗资源的使用过度集中而产生的问题。

由上述分析可以看出,现行系统主要有两方面的问题:1)没有考虑现在医疗推荐方面最迫切需要解决的问题;2)没有考虑导诊与医疗推荐和传统的推荐在本质上的不同。针对这些问题,本文提出了一种面向智能导诊的个性化推荐算法,其主要有3个特点:1)算法提出了辅助诊疗机制,通过辅助诊疗能根据用户的症状表现,帮助用户大致确定其所患疾病,从而明确用户偏好,提升推荐结果的满意度。2)算法获得用户评分及反馈信息的方式以显式方法为主,并且在辅助诊疗时根据用户的反馈信息对诊断结果进行优化,从而提高诊断结果的准确性。3)提出了一种在有地域约束时的推荐算法。对Skyline查询进行改进,并将其结果作为推荐的候选集合,之后在局部范围内使用基于协同过滤的评分算法,对候选集合进行评分并排序。

二、整体框架

首先根据用户的症状表现,使用辅助诊疗算法给出初步诊断结果,再利用反馈信息和症状联想机制进一步确定所患疾病,从而完成症状到用户偏好的转化过程;第2部分是生成推荐结果的过程,由用户的偏好结合其地理位置信息,采用改进的Skyline查询算法,找出一定范围内符合要求的医院作为候选集合,最后在局部范围内由基于协同过滤的评分方式对候选集合中的医院进行评分、排序,从而生成最终的推荐结果。

三、基于医疗知识库的辅助诊疗技术

(一)分词与症状索引表的建立

为了提高分词速度,本文通过对《同义词林》进行适当的改造,构建了一个新的字典。首先,部分无用词汇被剔除;其次,按照词语的字数,字典被分为5个部分,这样每次匹配时词典最多被扫描一次。为了提高分词准确度,本文选用了逆向最大匹配法。为了加快诊断速度,本文采取了在症状信息上建立倒排索引的方法。该索引包含3个属性,分别保存症状分词结果对应的同义词林中的编码、疾病ICD编码和疾病中症状出现的次数,以及症状对应的疾病类型数。后两个属性在进行诊断时使用。

(二)辅助诊断技术

1.辅助诊断思路

辅助诊疗技术采用的核心思想是计算用户输入的症状信息与医疗知识库中疾病症状信息之间的相似度,从而确诊疾病类型,具体实现过程包括:

1)对录入的症状信息进行分词,使用分词结果在索引表中进行查询,记录所有匹配项,将对应的疾病作为候选集,并将其中的疾病总数记为N。

2)利用症状索引表计算输入与候选集中每种疾病症状的相似度,并依据相似度进行排序。

2.相似度计算

相似度计算公式借鉴了TF-IDF计算相似度的思路,其公式为

式中:S为输入q与疾病症状之间的相似度;numi表示q中的某一症状i在该疾病中出现的次数,当q值较大时,意味着此症状为潜在的主要症状,则提高该症状的权重;numsymptom表示疾病的总症状数,numi对进行归一化,以防止部分疾病系数偏大;typedisease表示症状对应的疾病类型数量,对数函数则是为了提高潜在主要症状的权重。

四、实验验证

本文所使用的测试数据来自超星医疗知识库。为了模拟症状表述不全的情况,每种疾病的症状信息都被拆分为两部分。实验在医疗知识库中疾病的 种类数为100和1 000时分别进行了测试。统计实验结果的策略是:如果诊断结果的前10位中出现该疾病,则认为成功召回;如果诊断结果中的前3位中出现该疾病,则认为诊断结果准确。1) 数据库中的疾病种类为100时,选取了10种疾病,共20个测试用例。 2) 数据库中疾病种类为1 000时,选取100种,共200个测试用例,实验结果表明,所选测试数据在此统计策略下,当数据库中疾病种类为100时,召回率为95%,准确率为85%,在优化诊断之后,准确率达到95%,召回率达到100%;当数据库中疾病种类为1000 时,召回率为91.5%,准确率为81%,在优化诊断之后,准确率达到88.5%,召回率达到96%。

五、总结

本文通过对医疗与导诊领域的深入研究,发现了医疗领域的推荐与传统推荐在本质上的区别,提出了一種面向智能导诊的个性化推荐算法,以辅助诊疗结果为基础,将Skyline查询和局部范围内基于协同过滤的评分方式相结合。本文中提出的算法和思路对于有效地利用电子医疗数据,合理分配和使用现有的医疗资源,缓解就诊压力,提升就医质量意义重大,有着很大的实用价值与社会意义。

【参考文献】

[1]LOPEZ-NORES M,BLANCO-FERNANDEZ Y,PAZOS-ARIAS J J,et al. Property-based collaborative filtering for health-aware recommender systems[C]//Proceedings of 2011 IEEE International Conference on Consumer Electronics. Las Vegas,NV,USA,2011.

[2]GONG Jibing, WANG Lili, SUN Shengtao, et al. iBole: a hybrid multi-layer architecture for doctor recommendation in medical social networks[J]. Journal of computer science and technology, 2015, 30(5): 1073-1081.

[3]徐守坤,吴伟伟.基于语义的医疗资源均衡推荐算法J]. 计算机工程, 2015, 41(9): 74-79.

[4]侯梦薇, 卫荣, 樊林,等. 推荐系统在医疗领域的处理模型及应用研究[J]. 中国数字医学, 2019, 14(01):85-87.

猜你喜欢

推荐系统协同过滤
数据挖掘在选课推荐中的研究
图书推荐算法综述
基于用户偏好的信任网络随机游走推荐模型
改进的协同过滤推荐算法
基于链式存储结构的协同过滤推荐算法设计与实现
基于相似传播和情景聚类的网络协同过滤推荐算法研究
基于个性化的协同过滤图书推荐算法研究
个性化推荐系统关键算法探讨
基于协同过滤算法的个性化图书推荐系统研究
混合推荐算法在电影推荐中的研究与评述