基于Hadoop平台下医保智能控费系统的设计
2022-09-09陈复兴汤亮涂茂明
陈复兴 汤亮 涂茂明
(九江市第三人民医院信息科 江西省九江市 332000)
自2018年3月国家医疗保障局成立以来,国家医保基金监管条例陆续出台,全国公立医院不定期飞行检查,医保基金的管理已经立法,触犯了医保基金的管理将面临法律的处罚。医保基金的严格管理是维护全国人民群众的医疗保障合法权益,医保基金是老百姓的生命救命钱,各医疗机构应充分利用信息化技术加强对医保基金的监管。作为医保监管的主体公立医院,必须转变管理思维及方式,以往很多可通过人工审核发现的医保基金违规情况,在当前医保管理规则越来越细化、全民参保的形势下,人工审核已无法适应。随着计算机技术的高速发展,特别在公立医院信息化中,大数据技术已逐渐开始运用于各临床业务及医院决策支持。在医保监管条例日益加紧背景下,利用大数据技术实时分阶段分析医保费用数据已成为公立医院信息化发展的方向。
1 医保规则
2020年12月9日《医疗保障基金使用监管条例》通过审议,2021年5月1日起施行,这是关于医保基金使用的第一部法规,为医保部门提供了有法可依、有规必追的依据,结合近年来医保部门飞行检查涉案案例及地方医保政策异同,临床在违规使用医保基金主要有超范围用药、重复收费、分解住院、药品进销存、耗材进销存、过渡医疗、串换对照等类型。具体解析:
(1)超范围用药:门诊/住院诊断、治疗与医保用药说明不相符。
(2)重复收费:门诊/住院收费项目超检查次数、超住院天数等。
(3)分解住院:2 次入院相同诊断、相同治疗相隔时间较短。
(4)药品进销存:药品进销存量与门诊/住院实际收费量只差。
(5)耗材进销存:耗材进销存量与门诊/住院实际收费量只差。
(6)过渡医疗:一次住院期间发生检查费、检验费超出比例。
(7)串换对照等类型:医院端诊疗项目上传医保编码与医保收费项目编码不相符。
在医保基金监管日益严格的趋势下,仍有大部分公立医院发生违规使用医保基金、一方面是由于临床在诊疗活动中无法及时掌握医保政策、无法实时确定诊疗费用是否符合医保政策规定;另一方面医保管理部门无法及时掌握临床诊疗费用,仅仅依靠人工审核,人工审核只能粗略审核医保规则,较潜在的医保规则无法发现如分解住院、串换对照、药品进销存、耗材进销存。
2 Hadoop大数据技术
Hadoop 是一个由Apache 基金会所开发的分布式系统基础架构,因为稳定、高效等特性Hadoop 已是常用云计算平台之一,越来越受国内外知名企业广泛应用如谷歌、百度、腾讯、网易。Hadoop 的运算架构由主节点、分节点、Client 机器节点三部分组成,其中HDFS、MapReduce 两大Hadoop 核心任务模块由主节点监督、分配。在Hadopp 架构系统中HDFS、MapReduce、HBae、Pig、Hbase 等成员组成Hadoop 运算底层架构。
2.1 HDFS分布式文件存储系统
HDFS(Hadoop File System)是Hadoop 系统数据存储和管理中心,具有高稳定、高容错、高效率等特性。它是基于GFS 发展实现的分布式文件存储系统,其集群分NameNode和DataNode 两部分组成,通常单个NameNode 节点配合多个DataNode 节点组成的集群是一个HDFS 架构的典型集群方式。NameNode 负责管理文件系统的元数据和 DataNode节点,DataNode 是文件系统的实际工作节点,负责存储和检索数据,并定期将存储的块信息发送给 NameNode。
2.2 MapReduce编码模型
MapReduce 编程模型是当前大数据流行的数据集处理的编程模型。其基本思想是将数据运算任务分解成Map 和Reduce 两部分实现,MapReduce 编程模型先在Map 阶段对用户输入的请求数据进行分解,根据集群运算资源大小、请求数据资源大小分解成M 个分解任务,每个分解任务对应一个Map 任务,这M 个分解任务分别独自处理;在第二部分Reduce 运算部分中,将M 个Map 分解任务汇总并得到最终结果。
MapReduce 具体实现方式为:当用户请求任务时,Map分拆分多个分片,每个分片都以键值对形式(
图1 :MarReduce 编程模型
3 传统统计医保诊疗费用效率分析
患者在公立医院诊疗过程中,任何一项诊疗过程中均产生医保基金费用如门诊/住院诊查费、门诊/住院检验费、门诊/住院检查费,门诊/住院药品费。在具体费用业务系统中,涉及HIS、EMR、LIS、PACS、手术计费等系统。HIS、LIS、手术计费业务系统均为关系型数据库,费用信息查询可通过SQL 查询语句。如;EMR、PACS 等结构化结果业务系统均为非关系型结果集,核对费用信息时必须先通过自然语言处理解析结构化结构集,再核对相关费用。如在关系型数据库:
(1)查询重复收费SQL 语句:
select ztmc,count(*) a from (select ztmc,yzzh from zy_bqyz where zyh=:as_zyh and zxks<>检查科室代码 and ztmc is not null group by ztmc,yzzh)group by ztmc
(2)过渡医疗SQL 语句:
select (select sum(zjje)from zy_fymx where zyh=? and xmlx=1)/(select sum(zjje)from zy_fymx where zyh=?) from dual
(3)串换对照等类型SQL 语句:
select ylmlbm,sybxmbm from syb_fymx
在非关系型结构化结果中:
(1)EMR 病程中查询记录特殊用药情况:
Begin
Select(病程记录) //查询病程记录
NLP(病程记录) //自然语言处理病程记录
Spilt(病程记录) //自然语言分词病程记录
ConvertHIS(病程记录) //转换HIS 费用信息
End
在关系型数据库,为了提高查询效率,各关系型数据库均提供关键字段上建索引功能,而索引实质是一种树形结构,查询算法复杂度为O(LogN),根据查询数据量及网络传输带宽,关系型数据库中查询效率为公式(1):
其中:T 查询总时间;S 请求查询数据量;P 网络带宽
在非关系型结构化结果,查询效率依赖于自然语言解析效率,不同自然语言解析方法其效率不同,非关系型结构化结果中查询效率为公式(2):
其中:T 查询总时间;S 请求查询数据量;P 网络带宽
4 智能控费系统设计
本智能化控费系统基于Hadoop 平台设计,主要运用到Hadoop 中HDFS、MapReduce 两核心组件。其中HDFS 负责分布式存储医保诊疗费用统计信息,MapReduce 负责对这些医保诊疗费用统计信息并行计算并输出结果。如图2 所示,智能控费系统的处理流程科分为抽取、存储和计算。智能控费系统运算集群采用四台物理机组成虚拟化环境,通过虚拟化环境搭建15 台虚拟服务器,每台虚拟服务器安装Centos 7.0操作系统,15台虚拟服务器搭建Hadoop大数据运行环境。
图2 :智能控费系统架构
4.1 医保规则数字化
根据《医疗保障基金使用监管条例》将所有医保基金监管条例数字化,转化计算机可识别,为了提高转化效率,需联合医保、物价科、药剂科、医务科预先维护如下基础信息:
(1)医保用药说明,每种药品均维护对应具体适应症,如检验结果、检查结果、治疗方案。
(2)收费项目次数,每类收费项目均维护其收费次数。
(3)过渡医疗标准,诊疗活动中药占比、检验、检查占比。
(4)收费项目医保编码对照,提供医保收费项目编码库。
(5)药品库与耗材库与收费药品、耗材间对照。
根据基础信息,医保基金监管条例可转化计算机数字化,如超范围用药根据维护用药说明即可判断是否合规;重复收费可根据项目对应次数判断是否合规;药品进销存可根据对照关系分别统计收费药品与药品库中消耗只差判断是否合规。
4.2 分阶段控费
为了分阶段控费,各临床业务系统改造系统将产生医保诊疗费用后实时主动推送至Hadoop 平台中,平台接受到请求后,转发至NameNode 节点,NameNode 节点根据权限分配集群DataNode 节点。MapReduce 并行运算框架根据医保基金监管条例规则数字化Map 阶段逐个统计,Reduce 阶段汇总最终结果。 在事前控费中,如开立医保用药时,智能控费系统实时从Hadoop 平台中获取药品适应症,根据适应症智能诊断是否合规;在事中控制中,根据Hadoop 平台并行运算结果,将不合规结果主动推送至临床业务系统中,如过渡医疗、重复计费、分解住院;在事后控费中,当患者结算时,业务系统发送医保费用诊断请求时,Hadoop 平台返回串换项目、药品进销存、耗材进销存等不合规提示。
4.3 决策支持统计
为了医保部门、院领导及时掌握医保基金动态,Hadoop平台根据实时医保诊疗费用数据,统计个各类报表,如全院医保基金使用率、全院药品进销存、全院耗材进销存、全院过渡医疗等分布。
4.4 查询效率分析
Hadoop 平台下医保费用控制由于医保诊疗费用在个临床业务产生已实时推送至Hadoop 平台中,由Hadoop 平台根据医保基金监管条例动态判断是否合规,在事前、事中、事后医保诊疗费用判断合规仅依赖于网络带宽,如图3 和图4 所示:
图3 :事中医保控费提示
图4 :事后医保控费提示
其中: S 请求查询数据量;P 网络带宽。
5 总结
传统医保控费仅仅依靠关系型数据库SQL 查询语句判断诊疗行为是否合规,不仅查询效率低、部分规则无法通过SQL 语句判断,还直接影响临床日常工作效率,基于Hadoop 平台下智能控费系统的设计是对传统方式的彻底改良,从单机运行转化多节点并行运行,大大提高了运行速度,在临床业务中”零”干扰实现医保费用控制。