应用合作博弈论解决医疗机构SPD供应链实践中效用分配问题初探
2019-08-28彭超婧史纪磊
彭超婧 曾 晗 史纪磊 蔡 蕾,2
(1.上海大学 管理学院,上海 200444;2.上海市第一人民医院,上海 200080)
本文拟从合作博弈理论着手,以本市公立医院之一的上海市第一人民医院(以下简称“市一医院”)SPD供应链管理的实际案例为基础,在有关数据的基础上合理应用合作博弈论模型,进行计算后得出相关结论,寻找使合作联盟达到稳定的最合理分配方法,探索解决医疗机构SPD供应链管理实践中如何分配效用的问题,从而促进医疗机构SPD供应链管理实践的可持续发展。
1 理论基础
1.1 合作博弈
本文主要的理论基础——合作博弈论,又称联盟博弈论,由于在解决世界上各类资源共享问题和避免冲突方面有独到的方法,近年来在经济学中的地位与日俱增。一个效用可转移合作博弈,简称TU博弈(TU game),用二元组(N,v)表示,N表示参与者集合,v被称为特征函数,是定义在N的所有子集的集合上的函数,其中联盟S中所有成员合作产生的收益称为S的效用,用v(S)表示。合作博弈强调群体理性 (group rationality),按照具有约束力的协议,部分参与者可组成一个小集团进行彼此合作以谋求更大的利益,这些合作的小集团被称为“联盟”(coalition),由所有参与者组成的联盟被称为总联盟(grand coalition)。
在合作博弈中,每个参与人都希望自身分配的利益越大越好,而分摊的费用越少越好。因此,各参与人之间对如何分配合作收益,如何分摊成本或效用就存在着冲突。只有处理好利益分配问题,才能保证项目顺利完成以及今后参与者之间的进一步合作。公平是利益分配原则中的核心,一个不公平的分配方案,即使是有效率的,在实际工作中也是难以实施的,只有公平才能保证各类对象共同参与项目,而公平地分配合作总收益则是刺激各个参与者进一步合作的动力。总而言之,合理的分配能够保证所形成联盟的稳定,使之继续合作下去。相反,不合理的分配,会使成员没有动机形成联盟,已经形成的联盟也将面临解散的威胁。
1.2 Myerson值
本文所采用的主要分配方法——Myerson值法,是合作博弈论中较为经典的联盟收益分配方法,适合多参与人合作博弈中所产生总收益的分配,它按照每个参与者对联盟的边际贡献量确定其收益,体现了公平性原则,有利于进一步提升联盟的稳定性。此方法在合作博弈收益分配案例中常被使用。
Myerson值法主要研究的问题之一即合作形成的大联盟收益v(N)如何分配。在TU-博弈(N,v)中,用一个支付向量(payoff vector)x=(x1,x2,…,xn)∈Rn来表示分配给第i个参与者的支付为xi。TU-博弈的一个单值解(single-valued solution)是一个函数f,表示分配给任意(N,v)的一个支付向量f(N,v)∈Rn。这个单值解就是指分配规则(allocation rule),其中一个著名的单值解是美国学者Myerson 于1977年提出的Myerson值μ(N,v,L),其基本计算公式定义为
μ(N,v,L)=Φ(N,vL)
其中:三元组(N,v,L)表示一个图博弈,它由TU博弈(N,v)和图结构(N,L)两部分组成。N代表合作形成的大联盟,v为联盟收益特征函数,L是网络中任意的边集,有L⊆LN={{i,j}│{i,j}⊆N,i≠j}。μ(N,v,L)表示图博弈上的Myerson值,Φ(N,vL)表示图限制博弈上的Shapley值。图限制博弈上的Shapley值可由下式得到:
其中:N代表合作形成的大联盟,S代表大联盟中所有的子联盟,n和s分别为联盟N和S的基数(即内部参与者个数)。
任意图博弈上的Myerson值满足分支有效性、公平性等基本性质。具体地:
(1)分支有效性:对于任意图博弈(N,v,L)及其内部任意分支(component)C∈N/L,有
该性质的含义如下:对于任意图中的某个分支C∈N/L,其中每一个参与者所分配得到的报酬之和等于该分支的效用总和,即所赚取的利益都分配下去,没有剩余,体现了分配的有效性。
(2)公平性:对于任意图博弈(N,v,L)及其内部任意边ij∈L,有
μi(N,v,L)-μi(N,v,Lij)=μj(N,v,L)-μj(N,v,Lij)
该性质的含义如下:对于任意图中的任意边(i,j),删掉该边,给构成该边的参与者i和j带来的损失应当相等。同理,增加一条边,i和j增加的收益也相等,这在一定程度上反映了分配的公平性。
1.3 概率图上的Myerson值
考虑到现实生活中成员之间的合作并不是完全的,Emilio Calvo等对每个连通边赋予一个概率p来表示成员之间的合作程度,进而将一般图上的Myerson值推广至概率图上的Myerson值。概率图博弈可用一个三元组(N,v,p)表示。其中:(N,v)是一个联盟博弈,p:{{i,j}│i,j∈N,i≠j}→[0,1]是一个概率映射,它给每一对可直接联系的参与者连接的边赋以一定的概率。
假定这些概率相互独立。当联盟中的参与者i,j能够以一定概率pij合作时,可以得到合作收益v({i,j}),同时它们也有1-pij的可能不合作,此时,只能得到两人单独工作分别获得的收益之和,即v({i})+v({j})。因此,参与者i和j的期望收益为
vp({i,j}):=pijv({i,j})+(1-pij)(v({i})+v({j}))
接着,定义联盟S中任意一条边的记号为l,定义联盟S中所有的点导出的边集为L(S)={{i,j}|i,j∈S,i≠j},对于任意的边子集L⊆L(S),若满足
则称边子集L基于联盟S是概率实现的。
假设边集L⊆L(S),由L在联盟S中导出的连通分支记作S/L,其在一般图上获得的Myerson值记为vL(S),则
vp(S):=∑L⊆L(S)pS(L)vL(S)
(1)
其中,vp(S)即联盟S在概率图上获得的Myerson值,即联盟N中任意子联盟S的期望收益。由式(1)可得概率图上Myerson值的收益表达式如下:
μ(N,v,p)=∑L⊆L(N)pN(L)μ(N,v,L)
(2)
其中,pN(L)是边集L上的概率,三元组(N,v,p)是一个概率图博弈(probabilistic graph game),它是由TU-博弈(N,v)∈GN和概率图(N,p)∈PN两部分组成,GN和PN分别代表所有TU博弈的集合和所有概率图的集合。μ(N,v,p)为该概率图博弈的Myerson值,μ(N,v,p)∈RN。
2 医疗机构SPD供应链管理实践
2.1 SPD供应链管理的概念
SPD供应链管理模式的命名取自医院院内药品耗材流转过程中供应(Supply)、加工(Processing)和配送(Distribution)三项核心工作,是目前国内逐步开始实施的一项基于第三方物流和集中化管理理念医院內部药品流转管理模式,其核心是将医院内药品、检验试剂、手术器械、消毒物品等各类医用耗材的流通转运交由第三方集中管理,医院则专注于临床工作,目前国内已有几十家大型三级医院开始施行。其最初设想来自20世纪六七十年代,美国医生戈登弗里曼将自二战开始美军的物流管理理念引入医院管理之中,设计将医院内一切与医疗无关的工作交给专业的第三方企业负责,医院将核心精力集中于临床工作,利用第三方物流管理理念去支持医院医疗工作的开展。80年代日本引进了美国的相应管理方法,并结合本国特点进行相关改进,形成了可以商品化的服务模式。
SPD在医疗机构内部运行的基本模式如下:医疗机构向SPD服务供应商(特定第三方)集中采购药品、耗材、试剂等医疗物资,并将医疗机构内部的物流环节外包给该第三方管理;SPD服务供应商投入SPD服务必要的设备、系统、人员等,双方与物资供应商一起,共同构建基于现代物流信息管理平台的供应链管理体系。科学有效的SPD供应链管理可以提高医疗机构物资采购上下游环节以及院内配送环节的工作效率,降低运营成本。由于SPD供应链管理对提升医疗机构的竞争力来说具有深远的意义,最近几年来,受到国内医疗机构的高度重视,越来越多的医院将SPD供应链纳入医院运营体系中。
2.2 市一医院SPD供应链管理简介
市一医院是我国国内较早将SPD供应链管理模式投入实践的医疗单位,管理流程如下:首先,医院药师和通过招标产生的SPD服务供应商共同确定采购目录,医院和各物资供应商进行议价。SPD服务供应商根据采购目录中所列物资清单、医院和各物资供应商的议定价格,从医院指定供应商处采购物资,然后统一配送到医院的SPD中心库。SPD服务供应商根据上述议定价格,将采购的物资平价(无任何加成)销售给医院。同时,按照销售收入的一定比例向指定供应商收取配送费。SPD服务供应商的利润来源不是销售加成,而是从供应商处获取的配送费收入。
医院内库房采用两级库存管理模式,即SPD中心库和各消耗点二级库,均由SPD服务供应商统一管理。物资配送至SPD中心库后,SPD服务供应商派遣工作人员根据库存和实际需求情况补货至各二级库,最后送达患者手中。在最终消耗点,患者付费给医院,医院财务系统同时生成与SPD供应商的结算账单。
市一医院SPD供应链管理流程如图1所示。
图1 市一医院SPD供应链管理流程
通过实施SPD供应链管理,市一医院共节省人力163人,其中:药品环节42人,耗材环节115人,试剂环节6人。在资金结算方面采用先使用后结算,在财务上实现了零库存。在 SPD 管理模式下,医院的药品库存量管理工作多个流程被划分得非常清晰,利用了条形码技术后,工作难度也有一定程度的降低,本需要专业药师才能够进行的药品物流管理工作能够转由普通的物流人员来执行,促使临床药师回归临床进行用药指导,使医院每100个床位的临床药师配备达到3.3名,随着运行的进一步规范将达到每100床3.5人,使各消耗点的护理人员回归本职工作,有效缓解了临床一线护士配置缺乏的问题。
2.3 市一医院SPD供应链管理效用分配的难点
从市一医院的SPD供应链管理实践来看,SPD服务供应商在SPD供应链管理过程中虽然不参与医院和物资供应商之间的议价,但在负责物资配送的同时也充当了销售开票机构的角色。市场上的SPD服务供应商同时也是药品、耗材、试剂等医疗物资的代理销售机构,它们在参与SPD合作过程中,凭借所掌握的RFID技术、自动发药机、耗材定数包等一系列具有知识产权的软硬件,以及根据采购目录从各物资供应商处进行采购的便利,可以快速占领物资代理销售市场份额,对其他销售代理商形成较大的竞争压力。
SPD供应链合作是以参与者各方共同实现合理的联盟效用分配为基础和前提的,但医院尚未设计出一份有效的合作框架协议,明确对SPD供应链通过节约成本获取的效用分配方法。因此,医院免费享受SPD服务,节约人力成本的利益,会被误解为有向SPD服务供应商转嫁成本的嫌疑。更有甚者,有人提出SPD服务供应商向医疗机构免费提供SPD软硬件服务,目的就是为了快速获取代理销售的市场资源,形成市场垄断,有向医疗机构实行商业贿赂的嫌疑。可见,签订一份合理的SPD服务合作协议,并且在其中明确可量化的效用分配方法,就成为了保证SPD供应链合作各方利益和可持续合作的基础。
3 实例分析
3.1 探索Myerson值法在SPD供应链管理效用分配中的运用
市一医院的SPD供应链管理改革对于医院总成本的下降和SPD服务供应商利润的增加是有显著影响的。根据实际数据来看,医院通过招投标选定的SPD服务供应商自SPD项目合作开始以来,每年都会从物资供应商处获取配送服务利润,三年的利润分别为357万元、594万元和678万元,年平均利润(年平均配送收益)为543万元。医院参与SPD合作后每年节约人力163人,按照每人每年年收入12万元进行核算,即边际收益为1956万元。同时,降低库存成本年均约100万元。
基于市一医院SPD供应链管理的总效用历年来连续递增,且属于三方连通的图结构,因此本文探索使用Myerson值法进行收益分配。根据上文的论述,运用Myerson值法进行本例的计算,导出的收益分配解满足分支有效性和公平性等性质,这些性质可以保证分配的有效和一定程度的公平。具体计算步骤如下:
考虑一个三人合作博弈(N,v),N={1,2,3},其中参与者1、2、3分别代表市一医院SPD供应链合作的相关利益主体:物资供应商、医院、SPD服务供应商。将医院总成本的降低和SPD服务供应商的年均利润和设为收益值v,且将其收益特征函数定义如下:
v({1} )=v({2} )=v({3} )=0,即物资供应商、医院、SPD服务供应商单干时边际收益分别为0;
v({1,2} )=0,即物资供应商单独与医院合作时边际收益为0;
v({1,3} )=543+100=643,即物资供应商和SPD服务供应商合作时产生了配送收益。因为每年的配送利润都不一样,因此这里对三年的配送利润取平均值作为年平均配送利润,为543万元。此外,物资供应商统一指定SPD服务供应商进行配送服务所花费的成本比各自选取不同配送商有所降低,假定此处年成本降低平均值为100万元。
v({2,3} )=2056(医院年人力成本节省金额加库存成本节省金额163人×12万元/人+100万元);
v({1,2,3} )=v(N)=2699,即物资供应商、医院、SPD服务供应商三者进行供应链管理合作获得的边际收益总额为2699万元(543万元+100万元+2056万元)。
三者从SPD合作项目实施后取得的总收益中获得的效用可以通过协议约定,以货币金额的形式进行分配 ,具体分配的金额可通过Myerson值计算得出:
μ1(N,v,L)=321.5
μ2(N,v,L)=1028
μ3(N,v,L)=1349.5
综上,本例Myerson值为
μ(N,v,L)=(321.5,1028,1349.5)
使用上述合作博弈论模型得出的效用分配方案为(321.5,1028,1349.5),即物资供应商、医院、SPD服务供应商所应该分配到的收益分别为321.5万元、1028万元和1349.5万元。
通过比较分配方案及目前实际分配情况可以发现:医院的物资供应商应分配到的边际收益为321.5万元/年,但实际上没有获得分配收益(SPD供应链管理的合作谈判仅在医院和SPD服务供应商之间进行);医院应分配到的收益为1028万元/年,实际获得的成本节约利益为1956万元/年,高于应得利益;SPD服务供应商应分配到的收益为1349.5万元/年,实际获得的配送利润为543万元/年,低于其应得利益。
3.2 概率图上的收益分配解
Myerson值的收益分配解是基于各参与者之间合作关系都一定能建立的假设下,现实中其实不然,各个参与者之间的合作可能是不完全的,只是一定程度上的合作,那么将每个连通边赋予一个“合作”的概率是有必要的。本文为更好地贴近现实情况,引入概率图博弈来计算不同概率设定下的收益分配解,图2为概率图上联盟合作关系示意图。
图2 SPD供应链改革概率图上合作关系示意图
该概率图上的边集L(N)={{13},{12},{23}}共有8个子集,得出概率图上各参与者的Myerson值如下:
μ(N,v,p)=(μ1(N,v,p)μ2(N,v,p)μ3(N,v,p))=
假设本例中,医院更倾向于和SPD供应商合作,而与物资供应商直接合作的意向度较低。不妨设置p23为0.6,p12为0.3,p13为0.5,代入可得收益分配解为
使用上述概率图Myerson值法算出的效用分配方案为(221.17,677.21,837.97),即物资供应商、医院、SPD服务供应商所应该分配到的收益分别为221.17万元、677.21万元和837.97万元。三者共分配得1736.35万元,仍剩余962.65万元没有分配。这是由于概率图Myerson值法仅满足分支有效性,而非整体有效性。
为保证分配的整体有效性,本案例中对尚未分配的余数引入René van den Brink等于2012年提出的基于Myerson值的有效解,具体的计算公式如下:
(3)
其中,vp(N)=∑i∈Nμi(N,v,p),表示概率图上所有参与者的Myerson值之和,v(N)为大联盟的收益,n为大联盟N的基数(即参与者个数)。
对于任意概率图博弈(N,v,p),基于Myerson值的有效解满足有效性和公平性。
证明:对于任意图博弈(N,v,p),由(2)式可得
因此vp(N)=∑i∈Nμi(N,v,p)
对式(3)两边加和可以得到
vp(N)+(v(N)-vp(N))=v(N)
所以,基于Myerson值的有效解满足有效性。
下面证明基于Myerson值的有效解满足公平性。
根据式(3),有
φi(N,v,p)-φi(N,v,p-ij)=μi(N,v,p)+
φj(N,v,p)-φj(N,v,p-ij)
其中,p-ij({k,l} )=p({k,l} ), ∀{k,l}≠{i,j}, 且p-ij({i,j} )=0.
因此,基于Myerson值的有效解也满足公平性,定理得证。
由引理可知,基于Myerson值的有效解满足有效性和公平性,故可用来作为剩余收益的分配方法。经计算可得最终的收益分配解为
使用基于Myerson值的有效解算出的最终效用分配方案为(542.05,998.09,1158.85),即物资供应商、医院、SPD服务供应商所应该分配到的收益分别为542.05万元、998.09万元和1158.85万元。三者共分配得2699万元,全部收益分配完毕,没有剩余。
通过比较概率图上分配方案及目前实际分配可以发现:物资供应商应分配到的边际收益为542.05万元/年,但实际上没有在实际中获得分配收益(SPD供应链管理的合作谈判仅在医院和SPD服务供应商之间进行);医院应分配到的收益为998.09万元/年,实际获得的成本节约利益为1956万元/年,高于应得利益;SPD服务供应商应分配到的收益为1158.85万元/年,实际获得的配送利润为543万元/年,低于其应得利益。
相比于普通图上的收益分配解(321.5,1028,1349.5)来说,概率图上的收益分配解更加贴近实际,这是因为边概率的加入能够更真实地刻画参与者之间的合作程度,更加贴近实际情况。
普通图上的收益分配解与概率图上的收益分配解产生差异的原因是由于普通图上的Myerson值是在各个成员之间只要连通就是完全合作(pij=1)的情况下计算的,所以对于它而言只看连通关系,不看合作程度。也就是说,普通图上的Myerson值是概率图上Myerson值边概率均为1的特殊情形。但是概率图上的Myerson值既考虑了是否连通,又考虑了一旦连通可以达到何种程度(用pij来衡量)的合作,因此只要两成员之间的合作程度不为1,就会导致联盟收益vp比vL小(因为计算公式乘了一个概率)。
3.3 分配值是否稳定的分析
为了验证以上收益分配解的合理性和稳定性,这里引入合作博弈论中核心(core)的定义,核心是合作博弈理论中最重要的多值解之一,它给每个博弈分配的集合C(v)中的全体支付向量不被其他任何分配规则占优,是稳定的。其定义如下:
C(v)={x∈Rn│x(N)=v(N)且x(S)≥v(S), ∀S∈CL(N) }
其中,(N,v)为TU博弈。用xi表示分配给第i个参与者的支付,x=(x1,x2,…,xn)∈Rn表示一个支付向量。 对于任意的S⊆N,记x(S)=∑i∈Sxi。在合作博弈中,一旦收益分配解位于核心内,意味着没有任何一个参与者有动机离开大联盟N转而去组建一个较小的联盟S,因为那样所得的收益会有所减少,不符合个体理性和群体理性。因此,可以认为位于核心中的收益分配解可使大联盟的稳定性得以保证。
在本例的TU博弈中,要验证所得的Myerson值分配解是否在核心中,只需验证对于任意的S∈CL(N)有
成立即可。即,一个解向量x属于核心当且仅当x满足下列方程组:
根据上式,验证出本例中计算出的Myerson值分配解和概率图上基于Myerson值的有效解均满足上式,即位于核心内(证明略)。因此,本例中所求的收益分配解均满足联盟形成的有效性和稳定性性质。
4 结论及建议
上述案例中,两种收益分配解计算出的合作总效用的分配方案和实际三者所获得的效用(收益)金额的差异反映出,医院实际上通过SPD供应链管理所获得的收益是三者中最高的,可见其除了正常获益以外,还从上游的物资供应商和SPD服务供应商处获得了一部分超额收益。
为了有利于SPD供应链管理模式的稳定性和可持续发展,使三者的合作能够长久存续下去,在计算得出三者应获得的效用分配金额的合理值后,建议作出如下改善:
(1)完善医院与SPD服务供应商之间的合作框架协议,在涉及各自权利和义务的条款中明确规定合作总效用分配的计算方法以及双方的分配金额。其中,对于医院多获取的超额收益部分,可以在双方协定金额的基础上,采用“购买SPD服务”费用的方式,由医院支付给SPD服务供应商,从而规避医院转嫁成本以及SPD服务供应商商业贿赂的嫌疑。
(2)随着SPD合作业务的稳定,SPD服务供应商所获得的上游物资供应商数量增多,其配送利润可能出现逐年递增的情况,甚至在今后,获取超额收益的参与者会从医院转变为SPD服务供应商。因此,一旦出现这样的情况,在合作框架协议中应明确SPD服务供应商应向医院支付的超额收益分配金额,形式可以为“管理费”等。
(3)SPD供应链管理的最终目的是为了降低管理成本、节约社会资源,最终解决人民群众“看病难,看病贵”的问题。参与SPD项目的合作各方在享受到边际收益增加的好处的同时,也应当切实考虑如何降低医疗产品价格的销售价格,真正体现医疗机构和企业的社会公益性。