基于多Agent系统手术室在线调度研究
2018-12-13童海星季孟忠
童海星 谢 勇 季孟忠 项 薇
(宁波大学机械工程与力学学院 浙江 宁波 315211)
0 引 言
医疗运作管理程度会直接影响到医院的运作效率和服务质量。在医院运作管理中,手术室是关键环节。手术室科学管理的主要目标是确保手术医疗资源的最佳利用、手术的及时完成以及患者的最大化流动。手术室资源调度的低效运用,意味着手术可能延迟,使医院和患者双方造成了昂贵的成本。许多学者研究了手术排期调度问题[1-4],这类研究根据不同的优化目标对确定性择期手术进行医护资源的分配和调度。然而在实际运作过程中医院手术室具有动态不确定性,如突发急诊手术的插入、手术的延时或医护人员临时调整等。这些动态变化的环境,使得调度问题变得复杂,因此手术室需要建立具有柔性、自适应性和智能化的在线调度系统,以实现对动态环境的快速响应。
手术室运作流程中的复杂性、手术中涉及多种资源(医生、护士、麻醉师、手术室)的并行约束、医护人员的自主性行为等特性,使得手术室自适应在线调度优化问题难以运用传统数学解析方法、启发式优化或仿真优化方法解决。由于Agent具有自主性行为,越来越多的复杂系统研究中引入了Agent技术,用来实现系统的自适应控制。例如:制造系统领域,黄平[5]提出基于多Agent制造企业车间调度系统的柔性和敏捷性能适应制造企业内外部环境的动态变化。黄腾霄等[6]提出基于Agent智能制造系统的动态调度机制能有效减少设备故障对系统的影响;电子商务领域,多Agent系统在自动化流程[7]及商业流程的建模和设计[8]实现等方面已有成功应用;医疗服务领域,多Agent系统主要用于构造决策支持系统[9-10]和在健康护理过程中实现不同专家的协调能力[11],Othman[12]等提出基于多Agent系统对儿科急诊提供智能管理,合理优化资源配置,为患者改善医疗服务及减少等待时间。本研究旨在将Agent技术引入医院手术室在线调度管理中,构建多Agent在线调度系统,实现对手术室实际运作中动态问题的快速响应协调,并合理调度手术及相关资源。
1 多Agent系统架构模型
图1为基于JADE平台多Agent系统架构。手术室运作管理中的Agent主要分为三大类:① 手术任务Agent,主要负责协调各类手术所需的手术资源,选择最合适执行手术的资源;② 资源类Agent,主要负责协作共同完成手术任务;③ 外部环境Agent,存储手术任务基本信息,用于方便各Agent查询任务需求。考虑到便于实现各Agent间的交互,引入了一个通用的多Agent系统平台JADE构建手术室运作管理多Agent系统。进一步开发了适用于手术室运作管理的协同机制,设计基于手术室运作管理的共同语言、共同认知的本体机制,实现了手术任务Agent、各类资源Agent和外部环境Agent间便捷的协同交互目标,从而提高了手术室的在线运作管理的便捷性。
图1 基于JADE平台多Agent系统架构
2 本体构建
本体是语言表达的语义基础,如同人与人之间交流需要基于共同认知的常用语,否则无法正确理解所表达的语义,Agent间的交互也需要建立在共同理解的概念语义基础上,从而使各Agent间可以无歧义地处理信息。在多Agent系统中,必须慎重定义和描述其领域应用所需要的基本词汇概念,这些词汇是用于Agent之间的通信信息的主要组成。若每个Agent都自行定义常用词汇或概念,那么一方面会出现认知冲突,另一方面会造成概念的重复定义,即冗余现象。利用Protégé_3.5软件构建一个领域内的通用概念和认知系统,形成统一的本体表达模板并运用于多Agent系统手术室运作管理之中。本体开发设计主要有两个方面。
一是类框架结构的层次设计,为了更好地开发本体,要理清手术室系统中的各层级关系,手术室系统包括资源和手术两大类,资源可细分为医护资源和手术室资源,其医护资源中的科室医生选取医院门诊常开的三个科室。手术可细分为择期手术和急诊手术,如图2所示,图中实线代表继承关系,虚线代表执行或分配关系。
图2 手术室系统类层次结构关系
二是针对每个类定义具体属性特征,需设定其基数以及类型,以胸外科医生为例,如表1所示。
表1 类属性特征
3 自适应调度策略设计
在实际运作过程中医院手术室具有许多动态不确定性,造成既定手术排期与实际手术执行存在一定的偏差。因此,医院手术室运作调度系统必须要考虑不确定性因素,并合理设计决策来适应实际手术的运作环境。蚁群算法是一种以蚂蚁群体能够在变化环境下,通过信息素交互反馈适应变化,最终保证蚁群能够寻找最短觅食路径的智能算法[15]。在手术室调度系统中可以借鉴蚁群智能算法中自组织和自适应特征,设计合适的自适应策略,构建一个具有柔性、自适应性、智能化的在线调度系统。设计基于蚁群智能的信息素更新机制和启发式函数,并封装到多Agent系统的各类资源Agent和手术任务Agent的自主行为中,分别实现手术任务Agent自主选择合适的资源以及资源Agent自主决策待执行的手术任务。
3.1 蚁群智能封装到手术任务Agent的自主选择资源行为中
在蚁群智能优化中,信息素扮演着重要的角色,是实现正反馈和自组织的基础。每个蚂蚁释放信息素,后续蚂蚁对路径的选择依据信息素浓度大小及个体蚂蚁对环境的认知做决定。路径上信息素浓度高,被选择的概率就大,渐渐引导蚁群取得整体最优的结果。
首先把手术任务Agent视为一只蚂蚁,执行手术的资源视为觅食路径中的节点,利用蚁群算法中蚂蚁正确选择最优路径的方法,来考虑手术任务是如何选择手术需求资源。如果某个资源的任务队列中手术的总时间越长,则蚂蚁选择该资源的概率就越小,反之选择的概率就越大。
路径节点上的资源Agent的初始信息素是依据该资源任务队列中最晚完成的时间来决定,最早完成手术的资源Agent的初始信息素最高。
(1)
正常运作后,影响节点的信息素浓度的大小主要来自两个方面。一方面是当前资源Agent执行手术的状态,另一方面是在资源队列中等待执行手术时间的总和。其公式如下:
(2)
资源参与到手术中,手术任务Agent选择资源Agent是依据资源的信息素浓度和将要加入到资源队列中手术任务的启发式信息素两者的转移概率,其公式如下:
(3)
式中:α和β分别是蚁群的信息素因子和期望启发式因子,通过调整参数以平衡信息素与启发式信息素对概率的影响。
3.2 蚁群智能封装到资源Agent自主决策行为中
资源Agent如何决策下一步待执行的手术任务决定了手术的排序。此处,将资源Agent视为一只蚂蚁,待执行手术视觅食路径中的节点,若手术任务Agent信息素越大,手术优先执行的概率越大;反之手术任务Agent信息素越小,则手术就有可能被推迟执行。影响路径节点上初始信息素大小有两个因素:一是手术等待时间Wi;另一个是手术自身的紧急度Ei。在这两个因素中,医院实际管理中更倾向于考虑手术自身的紧急度,因此引入两个权重系数δ1和δ2,构成信息素。
(4)
式中:τPi(0)表示在资源队列中第i例待执行P(手术任务Agent)的初始信息,B是为了限制Wi与Wi+B比值小于1的常量,ηi是启发式信息素,当B的值不变时,启发式信息素与手术等待时间成正相关,手术等待时间越大,被资源选择的概率就越大。
(5)
式中:Ci、Ai分别是手术i任务当前时间和进入手术调度系统开始时间。手术等待时间的长短与当前时间有关,数值是动态变化的。
(6)
式中:Ei是手术i自身紧急度,Ti是手术i的工作时间,λi表示当前手术任务i的类别是0-1参量,若λi=1时,表明手术任务类别为择期手术;若λi=0时,表明手术任务类别为突发情形下的急诊手术,Si表示手术特征信息[16](Si=1,2,3),数值越大,手术紧急度越高。
τPi(t)=e(δ1·Wi+δ2·Ei)·fi(t)
(7)
式中:fi(t)代表手术i在资源中的状态。若手术需求资源执行完手术i,则fi(t)=0;若手术需求资源未执行完手术i,则fi(t)=1。手术任务信息素大小决定是否推迟执行手术。如果手术任务推迟了执行时间,手术任务的信息素变大,那么被资源Agent选中的概率大。由式(7)可见,由于当前时间会影响手术任务的信息素,每当资源Agent执行完手术任务时,任务Agent的信息素就会更新。
在资源Agent队列中,资源执行手术的先后顺序主要取决于Agent任务信息素浓度大小和启发式信息两者的转移概率,其公式如下:
(8)
4 算例验证
为了模拟手术室运作实际情景而建立了多Agent医院手术室在线调度系统。用两种不同的方法进行决策,一种是利用蚁群智能动态调度,另一种是用制造系统中先进先出(FIFO)规则调度。设计不同的手术类型,从本体构建模型中可知有三种不同类型的门诊科室的医生参于执行手术,所以相应的手术任务源也是这三种类型。每类手术的执行时间也有差别,为了简化手术计算的复杂性,手术的时间可整数化分为30、60、90 min三种。执行手术所需的各类资源数量都为1,参于手术的资源医生、护士、麻醉师、手术室数量分别为9、7、7、5。目前大多数的研究主要指标是针对工作能力、医疗成本、资源三个大方面,而突发状况的优化目标不同,使得评价指标也不相同。充分考虑突发状况下的特点,整理的主要四种评价指标分别是:总用时、资源的加班时间、患者等待时间、资源的工作时间利用率。
3种突发状况情形的算例设计:(1) 急诊手术插入;(2) 护士临时缺席;(3) 手术室故障,这3种情形程序都能适应。为了使仿真结果具有较强的科学性和有效性,模拟3种情形下5天随机产生的手术数量,如表2所示。
表2 每日手术量
对应表2三种情形的FIFO和动态调度规则的平均手术量进行分析,发现两种规则下的平均手术量相差不大,在可控范围内。在线调度系统利用两种不同的调度规则,模拟上表中三种情形的手术量,得到手术执行顺序以及手术资源配置。为了评价在线调度系统的效果,在参于手术所需资源中取护士和手术室作为分析对象,而对于第一种情形应添加一个评价指标是急诊患者的等待时间,分别计算各指标的平均值。对比FIFO调度和动态调度两种策略的结果,发现其都能实现手术室资源的分配,通过计算三种情形下护士和手术室资源时间利用率的离散性系数,动态调度比FIFO的离散值分别为0.117、0.074;0.098、0.041;0.084、0.096,这说明在动态调度规则下资源利用更均衡。分析三种情形下的其余目标,发现采用动态调度手术总用时至少缩短38.5%、资源加班少或不用加班、病人等待时间至少缩短2.09 h,而对于急诊病人的等待时间缩短约80%,可以快速安排急诊手术,如表3所示。
表3 三种情形调度结果的对比
续表3
5 结 语
随着主体技术的发展以及考虑主体自主性行为的特点,越来越多的复杂系统研究中引入了主体技术,在众多应用实践中显示,主体技术可以实现系统的自适应控制。本文通过设计手术室运作中各类资源Agent手术任务Agent及设计本体,建立了多Agent手术室在线调度系统,在Agent自主行为中封装两种调度策略,即基于蚁群智能的自适应动态调度和FIFO调度,可以实现手术室面临不确定性情况下的在线调度。并设计了仿真实验验证动态调度策略均优于FIFO调度策略,包含手术总用时短、资源加班少、资源时间利用率高且同类资源利用更加均衡、缩短了病人等待时间,更有助于实现急诊病人的优先排程。鉴于目前所提出的多Agent系统仅针对手术室在线调度,后续应用中可扩展到住院系统的调度中,将手术室和住院管理相结合,完善患者手术到达和离开医院的全过程。