APP下载

运用数据挖掘技术开展医疗保险基金审计

2021-05-27

审计月刊 2021年2期
关键词:疑点病种医疗保险

在大数据时代背景下,医疗保险基金信息化管理已较成熟,医疗保险基金数据呈现数据类型多样、数据量大、专业性强等特点。而传统的医疗保险基金审计,面对海量医疗诊疗、门诊住院结算业务数据,只能抽审部分病例档案,既难以实施全面核查,又难于接触到深层次问题,导致审计存在较大的风险。应用数据挖掘技术开展医保基金审计能提高问题查找的精准度,实施精确打击,找到住院医疗报销业务中的薄弱环节,顺利实现审计目标。

一、审计思路

本文利用数据挖掘技术里面的SPSS Statistics标识异常点模型和SPSS Modeler支持向量机回归算法(即Svm建模)来建立住院单病种病例模型。通过数据挖掘技术,查找明显不符合常规的疑问数据,同时建立预测分析模型,将预测值和实际值差异较大的记录列为疑点;通过建模筛选疑点再进一步审计核查,分析单病种住院情况下是否存在超范围、超比例、超标准支付医疗保险基金的情况,可以大大提高审计效率。

二、数据挖掘技术审计应用实例

(一)运用SPSS Statistics标识异常点模型分析实例

模型概述:SPSS Statistics标识异常点模型可以发现和分析明显偏离数据总体、不符合被审计单位业务规律的异常数据,从而找到对完成审计工作有价值的信息的一种数据挖掘方法。

审计思路:标识异常点模型是从被审计单位海量的财务数据中发掘出少部分的不符合整体规律的或明显存在异常的数据进而进行审计任务的模式。通常来说这种异常的数据通常会比大多数的数据更具有审计价值。

分析步骤:

第一步数据预处理。获取的医疗保险基金行业数据存放在sql sever数据库中,提取字段(住院序号、医院编码、医院名称、住院科室编码、出院时间、入院时间、出院病种名称、姓名、身份证号、总费用、药费、项目费、统筹范围费用金额、统筹支付、个人支付、年龄、本年住院次数)整理成所需的报销明细表excel表格导出存放。

第二步标识异常点模型建立。第一种方法利用SPSS Statistics软件筛选出异常值,“数据-标识异常个案”,将住院时间、出院病种名称、总费用、统筹范围报销金额作为分析变量,将身份证号作为个案识别变量,直接输出异常个案索引列表,得到异常值个案结果。将身份证号标识的个案异常点列为疑点重点,核查其档案资料,分析该病人住院期间有无异常费用支出。第二种方法利用SPSS Statis⁃tics软件中的“图形-图表构建程序-箱图”筛选出离群值,编辑元素属性,设置X变量为出院病种名称、Y变量为统筹范围费用金额,直接输出箱图离群值结果,改离散点所代表的住院记录作为疑点重点分析,核查其档案资料,分析该病人住院期间有无异常费用支出。

(二)运用SPSS Modeler支持向量机回归算法模型分析实例

模型概述:支持向量机回归算法模型是一种对线性和非线性数据进行分类的算法,使用一种非线性映射,把原训练数据映射到较高的维上;在新的维上,搜索最优分离超平面。Svm通过海量数据训练后得出的最优化算法,可以用于任何线性或非线性的高级分类。

审计思路:SPSS Modeler支持向量机回归算法模型是基于住院患者的病种、住院时间、年龄等详细数据,在学习海量数据中挖掘医疗报销费用和各相关因素之间的隐含联系,从而预测患者合理的医保报销金额,筛选出实际值与预测值差异较大的疑点。

分析步骤:Svm建模需要利用SPSS Modeler软件来分析建模。具体流程见下图。

第一步:数据预处理,提取字段(住院序号、医院编码、医院名称、住院科室编码、出院时间、入院时间、出院病种名称、姓名、身份证号、总费用、药费、项目费、统筹范围费用金额、统筹支付、个人支付、年龄、本年住院次数)整理成所需的报销明细表excel表格导出存放。

第二步:将表中不需要的字段利用过滤功能把住院序号、住院科室码、出院时间、入院时间、姓名、身份证号等字段过滤。

第三步:添加字段选项类型节点,将统筹范围费用金额字段设为目标,其他字段除医院名称外设置为输入。

第四步:导入支持向量机(Svm)模型,选择Svm模型节点建模节,运行生成结果,输出表查看;并输出一个多重散点图查看各个单病种统筹支付平均金额结果。

第五步:将单病种报销表中统筹支付金额与该病种统筹支付平均金额相差较大的记录列入疑点,重点核查。

Svm模型筛选出来预测值与实际值比例相差过大的疑点,都是值得重点关注的对象。该数据挖掘分析作为模拟性研究,具有前沿参考价值,在实际工作中,应不断结合真实数据进行模拟预测,经实践检验之后,可运用于实际。

三、方法小结

随着信息时代数据的海量增长,我们在审计工作中需要运用更加多样化的技术,从繁杂的数据中发现有用的审计线索,并将这些数据转化成有组织的、可利用的信息。SQL Server、Oracle等大型数据库软件对数据具有高效的批量管理和语句查询功能;SPSS Modeler等分析平台软件能够体现对数据分析的描述性和预测性,能够运用聚类、回归、离群点检测等数据挖掘技术反映数据内在信息。本次医疗保险基金审计中应用数据挖掘技术,在海量数据中轻松锁定审计疑点,极大地提高了审计效率,推动了审计信息化的发展,在大数据审计方式上取得了新的突破。

猜你喜欢

疑点病种医疗保险
超分辨率重建技术在海域使用疑点疑区监管中的应用
“新病种”等十五则
按病种付费渐成主流?
我国全面推进按病种收费改革
物联网技术在智慧城市建设应用中的难点与疑点
“三医联动”下医疗保险新走向
中国商业医疗保险的增长轨道
降低医疗保险拒付率
疑点
按病种付费改革的“宜阳实践”