线上诊疗智能回复系统的研究
2021-09-23徐来陈树越林勤
徐来 陈树越 林勤
【摘要】 互联网医院的远程医疗使越来越多患者得到了医疗服务,同时也方便了医务专业技术人员。近年来,随着相关技术及基础设施的涌现,远程医疗服务已经逐渐成为趋势。自新冠肺炎爆发以来,人们不太愿意冒着新冠的风险亲自去看医生,所以远程医疗的优势也越发明显。本文主要關注了医生和患者之间远程问诊的用户体验。随着远程医疗服务需求的增加,远程问诊质量和效率显得至关重要。因此,本文设计一种智能自动回复机制,以帮助医生有效地响应咨询请求。首先通过聚类算法来识别医生使用频率较高的回复,然后手动标记相应数据,最后通过机器学习算法来生成预处理的数据并给予患者回复。
【关键词】 远程医疗 人工智能 深度学习
Abstract: The telemedicine of Internet hospital makes more and more patients get medical services, and it also facilitates medical professionals. In recent years, with the emergence of related technologies and infrastructure, these services have gradually become a trend. Since the outbreak of novel coronavirus pneumonia, people are not willing to take risks to see a doctor in person, so the advantages of telemedicine are becoming more apparent. This paper focuses on the user experience of remote consultation between doctors and patients. With the increasing demand for tele health services, the quality and efficiency of tele consultation are very important. Therefore, this paper designs an intelligent automatic response generation mechanism to help doctors respond to consultation requests effectively. Firstly, the most frequent replies of doctors are identified by clustering algorithm, and then the corresponding data are manually marked. Finally, the preprocessed data is generated by machine learning algorithm and the patients are given replies. In recent years, with the emergence of related technologies and infrastructure, these services have gradually become a trend. Since the outbreak of the new crown pneumonia, people are reluctant to take the risk to see a doctor in person, so the advantages of telemedicine have become more obvious. This article focuses on the user experience of remote consultations between doctors and patients. With the increase in demand for remote health services, the quality and efficiency of remote consultations are critical. Therefore, this paper designs an intelligent automatic response generation mechanism to help doctors effectively respond to consultation requests. First, the clustering algorithm is used to identify the doctors most frequent replies, and then the corresponding data is manually labeled, and finally the machine learning algorithm is used to generate preprocessed data and give the patient a reply.
Key words:Telemedicine Artificial intelligence Deep learning
一、背景
在线咨询服务广泛应用于各行各业,其主要包括客户服务、技术支持、咨询、销售支持和远程教育等。在线咨询服务相对于面谈和电话交谈,能支持高并发咨询服务同时也避免了实时咨询的尴尬[1]。随着智能手机和智能手表的普及,在线咨询服务已经由最初的电商客服逐渐成为各行各业不可或缺的一部分。互联网医院作为新兴产物,在线咨询是其的主要运营模式。
互联网医院最早是在民营单位推广。2018年国家卫生健康委、国家中医药管理局出台《互联网医院管理办法(试行)》,将“互 联网医院”发展模式界定为两种:一种是实体医院自己搭建互联网医院平台并申请互联网医院作为第二名称,其主要执业医生主要为本院医生及其集团单位医生;另一种是第三方机构申请举办互联网医院,以实体医院为依托,由企业提供资金和技术,搭建互联网诊疗平台。新冠疫情后,国家卫健委开始大力推进以公立医院为基础的互联网医院模式,因此线上接诊的在线咨询量也越来越大,互联网医院的运营面临着挑战。当产生高并发的患者咨询数时,人工的回复往往不够及时,所以对于高并发的患者咨询,自适应人工智能回复功能的开发迫在眉睫[1]。在线上接诊时采用智能回复能够缓解目前的高并发咨询回复不及时的问题。
二、线上诊疗智能回复系统的概述
2.1 线上诊疗智能回复系统的意义
随着国家的战略部署,互联网医院的发展进入快车道,高并发的患者咨询压力是目前互联网医院发展的瓶颈。由于医生资源的紧缺,线上人工诊疗回复往往不够及时,而智能回复系统恰好能够保证快速准确的响应,提高了线上接诊的效率,也减少了患者等待时间,提升了患者的服务满意度。同时线上诊疗智能回复系统能够同时处理多个患者的在线接诊咨询框,也节省了额外的人力成本。
2.2 线上诊疗智能回复系统的结构设计
线上诊疗智能回复系统与普通的聊天机器人不同之处在于,智能回复系统并不是每条咨询都自动生成回复。因此,需要首先对患者咨詢的消息进行预处理,再定义一个触发回复的模型,然后由该模型确定是否触发自动回复功能[2]。在建立触发模型时,首先需要调研现有的的数据库并从中抽取约3000条咨询模块的消息,通过对这些数据进行分析可以发现,医生和患者的咨询交流有两个显著特点即咨询消息的数量和轮次(医患间来回发送消息的次数)。通过对这些数据的调研可以发现,每个医患之间的平均咨询回合数约为15.5轮,每次咨询约含23.8条消息。下一步对这些医患咨询消息进行配对,即患者回复,医生回答为一组,然后手动进行标记,即确定配对的消息是否触发智能回复。
至于是否触发智能回复的条件可以设定为以下几点。第一点是过滤掉超过100个字的患者咨询回复。因为长回复通常包含的内容较多,也是患者对病情的详细描述,通常需要人工回复才能给予患者满意的答复,所以人工智能回复系统直接过滤掉这种长咨询。第二点是过于详细或过于笼统的咨询,过于复杂或冗长的咨询,这些咨询触发模型也可以直接忽略。详细的咨询首先要参考自设的常见病情咨询的专业术语及关键字[3],若扫描到这些术语或关键字,则系统自认定为详细咨询,因为这类咨询通常包含这类咨询通常涉及患者病情的重要信息并且不适应于其他患者,所以选择人工回复。而太过笼统的咨询可能并不涉及病情问题,所以也选择过滤。
在患者咨询自动识别回复时,即预处理的步骤中,要删除多余的空格,标点符号和URL等。遇到习语、简写和一些错别字的情况下,我们设计的智能回复系统需要先建立一个词典(Python中的词汇检查包),把常见的习语,简写录入,对此进行识别回复。而对于一些常见的习惯性错误词汇,例如“可以”打成了“阔以”,“好的”打成了“好得”需要予以识别并回复。
患者的咨询消息触发了智能响应系统后,接下来它将进入自动响应模型。本文所采用深度学习的算法,需要先手动进行标记。由于自动响应生成智能回复的调研数据量较大,手动标记的话工作量也较大,所以本次调研时,抽取了一些特征比较明显的对话段。首先在医生端,对医生常见的回复进行聚类,得出医生常见回复的数据集群。接着在患者端,对医生回复后,患者接下来的回复进行聚类,得出患者常见回复的数据集群。然后对这些数据进行整理后,可以得出医生接下来最常见应答的数据集群,最后从医生和患者的数据集群中,加权计算并抽取配对响应频率较高的语句,将之组建成一个回复响应数据包,将计算出的最常用加权平均词作为发送给患者的回复[4]。而这一模型实现的过程则由编码器,解码器来完成。编码器将患者的消息编码为上下文加权语境向量[5],然后将其传递给解码器生成医生回复的输出序列。
对于线上诊疗自动生成智能回复的精度问题,使用深度学习算法能够逐渐解决这个系统问题[6]。医生可以针对人工智能回复选择是否撤回信息。通过对医生撤回频率的计算,当相关医患配对回复的准确率大于80%时,智能回复系统所生成的该条回复消息才会作为优先使用的回复消息推送给病人。
三、线上诊疗智能回复系统的应用
目前互联网医院的的线上咨询模块和线上复诊模块是病患和医生进行沟通的两大主要模块。图1显示了某医院咨询模块的智能回复模式。
通过对患者问题的预处理扫描到关键字,接着可以生成问候类的结束语,或者提出检查检验及查看报告单的需求,针对性地对病患问题给与回复。其他如患者提出皮肤瘙痒等问题,智能回复系统会要求提供患处图片。经过模块测试,回复效果较为准确。
四、结束语
随着医院信息化的不断发展,互联网医院成了解决实体医院线下医疗资源紧张的一个突破口。但是随着在线问诊人数的极速增长问题,人工回复已经不能满足咨询量的暴涨。当然,医院可以通过增加在线医生的人数来解决这一问题。但是增加医生所带来的高昂成本,使得线上问诊这种主要收入为收取挂号费的盈利模式远远不够承担医生的薪水。相对于昂贵的用人成本,开发线上智能回复系统的花费几乎可以忽略不计了。同时智能回复系统还大大减轻了医生的工作负担,节省了医生的宝贵时间。虽然线上智能回复系统解决了很多人力问题,但是其完善扔需要一定的时间,未来随着大数据的引入,该系统的发展更值得期待。
参 考 文 献
[1] T. Nadarzynski, O. Miles, A. Cowie, D. Ridge, Acceptability of artificial intelligence (ai)-led chatbot services in healthcare: A mixed-methods study, Digital health 5 (2019)
[2]李国垒,陈先来,夏冬,等.中文病历文本分词方法研究[J].中国生物医学工程学报,2016,35(4):477-481
[3]张素荣. 智能客服问答系统关键算法研究及应用[D].南京:南京邮电大学,2018.
[4]马远浩,曾卫明,石玉虎,等 基于加权向量和LSTM-CNN的微博文本分类研究[J].现代计算机,2018(25):18-22.
[5]吴龙峰,于?,王峰. 向量空间模型的文本分类研究与应用[J].宿州学院学报,2019,34(12)69-72.
[6]A. Kumar, S. Vembu, A. K. Menon, C. Elkan, Beam search algorithms for multilabel learning, Machine learning 92 (2013) 65–89.