数据挖掘技术赋能医保监管
——基于上海市医保监管实践
2023-11-20朱碧帆侯晓慧覃湫珺陈玉倩汤真清
张 娟 朱碧帆 侯晓慧 覃湫珺 耿 韬 陈玉倩 汤真清 李 芬,5
(1复旦大学公共卫生学院 上海 200433;2上海市卫生和健康发展研究中心(上海市医学科学技术情报研究所)上海 200040;3上海市医疗保险监督检查所 上海 200040;4上海政法学院 上海 201701;5上海市卫健委财管中心 上海 200040)
数据挖掘技术是指从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的,但又是潜在有用的信息和知识的过程[1]。数据挖掘技术在医保监管中具有重要的应用价值,通过对医保大数据的处理和分析,可以发现各种隐蔽性的欺诈骗保行为,从而提供有效的监管手段。此外,数据挖掘技术还可以帮助建立个体化监管模型,对医疗服务方进行精准监管,确保医保基金的合理合法使用[2]。因此,充分应用医保大数据挖掘新技术实施全过程智能监管是解决医保监管痛点和难点的关键,是实现医保高质量发展必不可少的技术手段。
上海市作为国家智能监控示范点,充分利用大数据优势推进智能监管,建立数学模型,运用人脸识别和“互联网+”等新兴技术手段,对患者就诊、收费情况实行线上实时监控并对异常情况进行审核。采取常规和专项检查调查相结合的监管模式,全方位监管异常动态,提升监管时效。本文介绍上海医保智能监管经验,能够为其他地区推进医保智能监控提供借鉴。
1 上海市医保监管建设与发展
2011年,上海市印发《上海市基本医疗保险监督管理办法》,并发布相关配套文件,为医保基金监管提供了强有力的制度保障。2015年起,上海市医疗保险监督检查所开始应用大数据技术,建立医疗机构预警指标体系。2019年,国家医保局办公室印发《关于开展医保基金监管“两试点一示范”工作的通知》[3]。按照国家标准和要求,上海市医保局建设了涵盖市(医保监督检查所)、区(医保办监督科)和医疗机构的三级医保监管网络系统。该监管系统全面覆盖医疗保险各个项目和监管对象,并对事前事中事后进行全流程、全方位、立体化智能监管[4]。
上海市设置专业部门开展数据挖掘工作,建立了产、学、研联动机制。在纵向方面,设置市医保事业管理中心和医保监督检查所,确保医保相关事务得到有效管理和监督;在横向方面,与市公安局、民政局、卫健委等部门建立数据对接和联合执法等工作机制,促进信息共享和协同行动。同时,与高校和科研机构合作开展课题研究,提升医保信息平台的科学性和可靠性。在多部门协作下,医保信息平台建设稳步进行,为提供更好的医保服务奠定了坚实的基础。
近年来,上海市修订《上海市基本医疗保险监督管理办法》,贯彻落实《医疗保障基金使用监督管理条例》,并不断健全监管制度[3]。同时,修订完善定点医疗机构协议管理办法,完善医师和药师计分管理制度、举报奖励制度等,通过监管监督的法治化持续推动医保基金行政能力、执法水平提升。
2 大数据挖掘应用下的医保监管案例分析——上海市医保医师画像模型
2.1 医保医师画像模型建立的背景
医保医师是在执业医师的基础上为规范与医保相关的执业行为而构建的新身份,与医保部门签订服务协议,能够为参保人提供医疗服务的执业医师[5]。因个别医师的医保违规行为惩罚整个医疗机构不尽合理,加之临床病种种类繁杂,使得医保监管难度增大,建立医保医师制度是医保监管的发展趋势[6]。将医保监管从医疗机构延伸至医师个人,诊疗行为与医保支付挂钩并强化监管,有利于实现医保基金的合理使用[6]。
上海市以现代化手段推动医保基金监管,探索医保基金监管新路径,与信息公司进行合作开发,将研究成果转化为实际的应用。为解决医保监管中医疗机构规避问题的情况,应用数据挖掘新技术(如无监督机器学习方法),聚焦理疗、康复和中医治疗中的违规收费、虚构服务等较为普遍的问题,建立医师画像模型,对医师诊疗行为的不同特征进行预警处理。
2.2 医保医师画像模型应用数据挖掘新技术的方法
利用医保大数据优势,结合门诊医师的基本信息、接诊信息以及接诊病人的人群特征信息等指标,上海市医保部门应用数据挖掘技术新方法,对医师画像进行深入分析,筛选出疑点医生并建立预警级别。
该模型主要采用以下方法。(1)标准化:对数据特征进行归一化处理,消除不同指标之间的量纲影响,以确保它们具有可比性和可解释性。(2)相关性分析:研究变量间的关系,消除可能存在的多重共线性。(3)K均值聚类:将给定的数据集划分为K个不重叠的簇,基于数据点之间的距离来确定簇的分配,并通过迭代的方式优化簇的中心位置。(4)逻辑回归:将医保医师根据不同特征划分为多个不同类别,且各个类别之间无明确的次序关系。(5)决策树模型:自上而下对样本数据进行树形分类。每个节点代表一个属性或特征,每个分支代表该属性的不同取值,每个叶节点代表一个类别或一个预测结果。(6)层次分析(analytic hierarchy process,AHP):计算出变量权重,并对医保医师进行打分。可以将主观判断量化,并提供一种系统化的方法进行决策。
2.3 医保医师画像模型的建立步骤
本研究纳入11699名医保医师,通过数据分析和专家意见对其进行多维度全方位的行为研究,确定了30个模型变量,包括接诊信息、“治疗三费”、专家意见三个维度的指标。其中,接诊信息包括当月医生接诊数量及接诊费用、当月医生日均接诊数量及接诊费用、当月医生日接诊最多病人数及最高费用;“治疗三费”即当月医生康复治疗、理疗、中医治疗费用占所有费用的比重;专家意见是将中医、康复专家观点转化为医生开具诊疗项目的数量(单次超量)、频次(频繁开具)、项目间的关联(组合收费)。模型建立流程见图1。
图1 医保医师画像模型建立流程
第一步,采用相关性分析方法,对各变量进行两两相关分析。相关性系数≤0.4表示变量之间不相关,选取不相关变量纳入研究,将最初的30个变量降至10个变量纳入模型。
第二步,采用无监督机器学习算法,根据降维得到的10个指标变量对医师进行分类,得出每一类医师的特征。选择K均值聚类算法将被观测医师分为无重叠的15类,每个医生都有对应的类别标签。选用无序多分类逻辑回归模型对医师分类结果进行验证,结果显示预测标签一致率较高。
第三步,使用决策树模型得到各分类的影响因子,其系数越大表示对医师分类的影响越大。系统给出每一行色阶分布,颜色偏向红色表示指标数值越大,偏向绿色表示指标数值越小,指标数值越大越需要重点关注。利用AHP层次分析法计算出变量权重,结合实际监管经验及指标意义,选取疑点医生簇。
第四步,根据疑点医生分数的分布情况,建立疑点医生的红橙黄三级预警机制。从医生分值的上四分位数到最大值为红色预警,下四分位数到上四分位数为橙色预警,最小值到下四分位数为黄色预警。针对疑点医生进行实地核验,反馈的结果用于优化模型。
2.4 医保医师画像模型的应用
医师画像模型作为一种评估工具,能够为监管机构提供参考信息,辅助进行医师违规行为的判断。例如,医师画像模型可能会识别医师的临床质量、医疗安全记录、患者满意度等指标,这些指标与医师是否存在违规行为相关。医师画像模型可根据这些指标信息筛选出疑点医生,监管机构可以根据这些信息有针对性地进行调查和监管。2021年,上海市对11699名康复医生的基本信息、执业情况、处方偏好、日均费用、监管查处计分等特征进行画像,筛选疑点医生,建立预警指标体系。识别疑点医生1000余人,涉及疑点费用超过1400万元,其中高风险医生占到疑点医生数量的20%左右,涉及疑点费用占疑点费用总额的60%以上,实现了预警与风险控制前置,提升了医保欺诈管理能力。
应用模型确定疑点医师名单,约谈疑点医师,对违反医保规定的执业医师作出暂停医保结算等行政处理,对医保医师能够起到较好的警示作用[7]。医师画像模型提升了医保医师信用体系建设的水平,为规范医师行为提供帮助,对保障医保基金安全具有重要意义。
3 大数据挖掘新技术在医保监管中的成果与效益
3.1 医保智能监管系统
上海市建成了覆盖各医保险种和监管对象的全流程、全方位、立体化的医保智能监管系统。该系统涵盖了总览、智能监控、行政执法、信用监管和综合评价五大版块,贯穿线索发现、调查取证、违规处理、结果应用四大环节,具备事前提醒、事中控制、事后追踪三大功能。
该系统具备预警监控、监控案件管理、综合查询、规则筛查等功能,其中最核心的预警监控功能下又分为多卡聚集、三费预警、人床分离、人卡分离、异常检验、一脸多卡、区块链进销存等十多个大数据主题预警模型。截至2023年6月,一脸多卡模型已经覆盖848家药店,上海市医保部门运用三费预警模型将预警医生列为约谈对象,区块链进销存模型已覆盖297家定点机构,对医疗机构和药店进行风险排名。这些模型可以通过大数据、人工智能等技术,在海量医保基金结算信息中自动抓取疑点,并进行智能研判和快速预警。当执法人员在监管系统中看到预警后,便会循着线索前往医院核查,在大数据的助力下让违规行为无处遁形,实现了对医保违规的精准定位、定性和定量管理。
3.2 医保信息智能监控知识库
上海市建立了医保智能监控知识库,包括基识库、监控规则库、分析指标库和大数据主题模型库,目前已完善优化了24万条监控知识库和6万条规则库。针对长护险居家护理、“互联网+”医疗、DRG/DIP付费等医保新业态,市医保部门探索打造数字化转型场景新应用。结合上海市开展DRG/DIP支付试点,将1.4万余个标准病组、近900个DRG分组库纳入知识库统一管理。将实际检查工作中运用的近200条规则纳入监控规则库,将对民办医疗机构预警检查中运用的近400条指标优化后纳入分析指标库,并扩展使用范围至全市所有的定点医疗机构[8]。
上海医保智能监管系统构成一张“天网”,医保基金监管队伍组成一张“地网”,基金安全“防护网”更加织密扎牢。医保部门应用知识图谱和无监督机器学习等方法构建基于知识图谱的规则逻辑风控预警模型,形成了全市共享和动态更新机制,实现了数据监控和疑点排查100%全覆盖。2021年,通过智能监管系统筛查出8900万余条定点医药机构疑点数据、49.2万就诊购药异常的参保人员。2019年—2023年,上海市医保局对11575家违规定点机构追款5.5亿余元,对11696人次违规参保个人追款2000余万元,共追回医保基金近6亿元。
4 大数据挖掘新技术应用于医保监管的经验与思考
上海市医保智能监管为其他地区推广医保大数据挖掘与应用、推进医保信息化建设提供了参考经验。然而也存在一些问题与挑战,比如当地医保信息平台与国家医保信息平台对接不及时,数据挖掘的深度及广度有限等。因此,提出以下思考。
4.1 完善法规及政策,为医保监管提供制度保障
上海市制定和完善了一系列医保智能监管相关的法律法规和政策文件,明确了医保支付行为的监管要求和标准。法律法规的有效实施,不仅可以提升医保监管的水平和效能,也可以为其他地区的基金监管智能化提供有益的借鉴和参考。
4.2 加强医保大数据平台建设,及时对接国家平台
目前,上海市医保信息平台数据比较混乱,未做到数据的规范统一和完整,不能及时与国家信息平台对接[9]。医保信息平台的建设应规范数据采集和录入流程,建立数据清洗和校验机制,排除数据中的错误和重复信息等,提高数据可信度和可用性,推进医保平台标准化建设。建议依托全国统一大平台,从完整度、准确性、标准化、可用性、安全性等方面持续对医保大数据开展动态治理。
4.3 强化数据挖掘分析方法,加强相关人员能力培训
上海市设置了专业部门开展数据挖掘开发工作,建立了产、学、研联动机制。采用先进的数据挖掘工具和算法,对医保数据进行深度挖掘和分析。下一步,医保部门可加强相关人员的培训和能力建设,提高其在数据挖掘和分析方面的专业知识和技能,从而提高监管的准确性和效能。
4.4 加强多部门协作,让有需求的应用尽快落地
上海市建立了跨部门、跨地区的数据共享机制,与高校及科研机构开展课题研究,与信息公司进行合作并转化为实际的应用[8]。建议继续加强与相关企业和科研机构的合作,促进医保数据的共享和交流,提高数据的价值和应用效果,共同推动大数据挖掘技术在医保监管中的应用研究和创新。同时,还应加强与国家医保信息平台、卫生健康、药监、民政、人社、公安等部门的对接,建立联合管理和综合治理机制,进一步做好行刑衔接,提高监管的专业性和精准性。
医保监管保障了医保基金的安全性和可持续性,同时对于优化医疗资源配置、提升医疗服务质量以及保障患者权益等具有重要的意义。通过应用大数据分析技术和智能监管手段,提高了监管效率和精细化水平,推动了医保管理的现代化进程。上海市医保智能监管的建设与发展提供了成功的范例,通过充分应用医保大数据挖掘技术,建立医保安全和数据模型,实现了医保数据质量的提升和监管水平的精细化[10]。下一步,上海市应继续强化监管力度,丰富智能化监管手段,进一步深化部门协作,不断提高医保监管效能,推动医保事业高质量可持续发展。