深圳市区域医疗卫生指标数据规范研究与实现
2020-03-30林德南汤学民朱岁松吴晓云郭志武陈永超赵成闻周小明魏沛群蒋必旋黄武洲胡进辉廖洁容吴清平
林德南 汤学民 朱岁松 吴晓云 郭志武 陈永超 陈 妍 赵成闻周小明 魏沛群 蒋必旋 黄武洲 胡进辉 杨 艳 廖洁容 吴清平
1 深圳市医学信息中心,518000 广东 深圳; 2 深圳市人民医院,518001 广东 深圳; 3 深圳市南山区人民医院,518052 广东 深圳; 4 深圳市中医院,518033 广东 深圳; 5 深圳市松岗人民医院,518105 广东 深圳; 6 深圳市第二人民医院,518135 广东 深圳; 7 深圳市联影医疗数据服务有限公司,518000 广东 深圳; 8 环亚数据技术(深圳)有限公司,518000 广东 深圳
统计数据是科学决策的重要依据,统计数据质量的高低直接影响统计信息的有用性及统计信息价值的大小。在实际卫生统计数据采集过程中,存在诸多因素会对采集结果产生影响。医疗统计方法不统一,指标含义不明,统计口径理解不准确,直接影响数据的准确性[1]。统计人员业务素质和水平也会影响报送数据的质量[2-3]。医院诊疗业务不规范,导致诊疗人次的统计量与实际开展业务量存在不符。医疗数据的多源性、异构性,缺乏数据报送标准,导致健康医疗数据在数据源和抽取、转换、加载过程中容易引入各种问题[4]。统计数据质量控制措施缺失,数据质量评估机制不完善、不健全,也会导致数据质量下降[5-6]。陈敏等学者也一致认为目前平台采集的数据或存在质的问题,亟待采取措施对其进行规范[7-8]。源头数据的准确性难以把控,导致数据的应用价值降低。
《国家卫生和计划生育统计调查制度》对医疗指标进行了严格的定义,但对指标的统计口径、算法,以及如何在信息系统中对医疗数据进行采集并未作详细的阐释。鉴于上述数据质量问题,为保证全市不同医院间医疗指标数据的同质性与准确性,降低人为因素对统计数据的影响,深圳市医学信息中心组织专家开展了数据质量项目,因地制宜地对医疗卫生常用指标数据的定义、统计口径、算法、信息化采集方式等进行了规范。
1 资料与方法
1.1 研究依据
深圳市对医疗卫生统计指标数据进行了研究与规范,主要依据原国家卫生和计划生育委员会发布的《国家卫生和计划生育统计调查制度》[9],同时参照《广东省医疗机构统计报表制度》和《深圳市卫生资源与医疗服务统计调查制度》。
1.2 研究基础与条件
在现阶段,深圳市数据规范项目已经具备充分的实现基础,具体如下:(1)深圳市卫生健康信息区域平台项目的建设,信息集成平台、数据标准集系统、数据交换和数据校验系统等核心业务系统的建立,实现了公立医院与区域卫生数据交换共享平台的对接,为指标数据的信息化采集提供成熟的平台支撑。(2)《深圳市区域卫生计生数据报送标准规范(2016版)》的发布,制定了全市的数据标准,助力数据集成和医疗机构间数据的交互共享实现。(3)实现指标数据推送流程规范。各医疗机构采用“主动报送”的数据采集方式。卫生统计指标数据上传以天为单位,各医院严格按照《深圳市区域卫生计生数据报送标准规范(2016版)》《医疗卫生统计指标数据规范》将有关数据抽取并转换为标准数据,上传至前置机服务器数据库中(0 ∶00—7 ∶00),保证数据上传的及时性。中心平台库通过搭建统一的数据平台,数据抽取、转换和加载工具(ETL)将异构的数据进行采集。针对数据漏推情况,则启动漏推数据自动补推机制。由于网络波动、医院系统宕机等不可控因素存在,若每日数据采集推送失败,管理平台会自动往中间表写入漏推业务环节和业务日期,ETL工程作业读取中间表参数后,自动执行相应的补推工程,确保数据无漏推。(4)人才队伍的技术力量支撑。由信息、病案、统计、财务等领域的主任、专家组成的数据质量研究团队,同时具备掌握卫生和信息化的人才,熟悉医疗机构统计业务和数据报送运行机制,保障了指标数据采集的准确性和完整性。
1.3 研究方法
采用系统论和控制论的方法对医疗卫生统计指标的数据源头、采集流程进行规范化研究,紧紧围绕着进度控制、质量控制目标进行。在项目实施过程中或合理调整、或细化和精确化,调节和控制系统稳定地、最优地趋达统计规范化和信息化的目标。一方面解决由于对指标地理解不准确,或者数据采集方式多样等原因造成的数据质量问题,在现有基础上尽量保证数据的质量。另一方面则推动统计工作信息化,统计数据由系统自动生成,不再需要手工填报,避免其影响统计数据质量。
2 结果
2.1 数据标准的制定与发布
在遵循国家统计调查制度的前提下,深圳市医学信息中心对53项门急诊、住院重点医疗卫生统计指标的含义、统计口径、统计算法与脚本等进行全市的统一和规范,并整理成标准文件《医疗卫生统计指标数据规范》,通过原卫生和计划生育委员会进行了发布。
现以门急诊重点医疗卫生统计指标中的门诊人次指标规范为例:
(1)指标含义及说明:指统计期内,在门诊就诊的患者人次数。包括初诊、复诊、在门诊进行的孕期检查、产后检查、单项健康检查等,不包括根据医嘱进行的各项检查、检验、治疗、处置如皮试、注射、清创、缝合等工作量以及免疫接种、健康管理服务人次数。
(2)统计口径:有挂号流水,同一日历日内、同一病人、同一科室完成的诊疗人次计为一个门诊人次。每个门诊人次必须有对应的费用,费用类别可以为诊金、检查费、治疗费、药品费等(有任一项即可)。若一个流水号对应的科室超过一个,则仅有诊金的科室就诊记录不应计入。
(3)算法:门诊人次=门诊就诊人次总数-转医保人次总数-门诊退号人次总数+隔天收费的门诊人次+预约挂号的门诊人次。其中,预约挂号的门诊人次=门诊预约就诊人次总数-预约就诊转医保人次总数-门诊预约就诊退号人次总数。
(4)脚本,选节如下:
SELECT
COUNT (0) CNT1
FROM
(
SELECT A.ORG_CODE,A.REG_DATE,B.DEPT_CODE,A.OUT_SNO FROM
(
SELECT
A.ORG_CODE,
CONVERT (DATE, A.REG_DATE) REG_DATE,
B.DEPT_CODE,
A.OUT_SNO,
SUM(B.TOTAL) AS TOTAL
FROM
TM_OUT_REG A
INNER JOIN TM_OUT_FEE_DETAIL B
ON A.ORG_CODE = B.ORG_CODE
AND A.OUT_SNO = B.OUT_SNO
AND A.IS_APPOINT_REGISTER = 0
LEFT JOIN T_DICTMAP_MAPPINT C
ON B.DEPT_CODE = C.HOSPDICT_CODE
AND A.ORG_CODE = C.ORG_CODE
AND C.FIELD_CODE = ′DEPT_CODE′
AND C.PARENT_TABLE = ′TM_OUT_FEE_DETAIL′
WHERE
A.ORG_CODE = ′机构代码′
AND A.EMERGENT_FLAG = 0
AND C.DICT_VALUE <>′体检科′
AND CONVERT (DATE, A.REG_DATE) >= ′统计开始时间′
AND CONVERT (DATE, A.REG_DATE) < ′统计结束时间′
AND CONVERT(VARCHAR(100),A.REG_DATE,23)= CONVERT(VARCHAR(10),B.INVOICE_TIME,23)
GROUP BY A.ORG_CODE,CONVERT (DATE,A.REG_DATE),B.DEPT_CODE,A.OUT_SNO
)T WHERE T.TOTAL > 0
UNION ALL
......(略)
2.2 门急诊重点统计指标数据规范化研究与实现
遵循国家和广东省统计要求的前提下,根据深圳市实际情况,组织专家开展了门急诊重点统计指标数据规范化研究(指标名称见表1),因地制宜地对门急诊数据采集的定义、算法、采集方式进行了规范,有效实现门急诊数据采集的准确性、完整性。参见另文《门急诊重点统计指标数据规范化研究与实现》。
2.3 住院重点统计指标数据规范化研究与实现
遵循国家和广东省统计要求的前提下,根据深圳市实际情况,组织专家开展了住院重点统计指标数据规范化研究(指标名称见表2),因地制宜地对住院数据采集的定义、算法、采集方式进行了规范,有效实现住院数据采集的准确性、完整性。参见另文《住院重点统计指标数据规范化研究与实现》。
表1 门急诊重点医疗卫生统计指标
2.4 数据质量监管
一方面,中心建设指标数据质量监控系统,建立监测机制,加强数据质量的监管。指定专人负责监测数据上传的质量,监测内容包括数据上传率、医院端与平台端数据的误差量,以及数据值是否与实际值偏离等。另一方面,中心进行统计信息化检查。中心把医疗卫生统计规范和质量列入每年度深圳市公立医院综合评价得分,按照标准对各医院的系统进行评价,促使医院实现高质量指标数据推送。目前,深圳市63家公立医院的医院端和中心平台端指标计算已实现零误差。控制结果见图1。
3 讨论
3.1 主要成效
在标准文件《医疗卫生统计指标数据规范》制定中,指标含义清楚解释了指标统计的对象;统计口径指明统计数据所采用的标准、统计的范围、时间和调查方法;统计算法在给定的范围内求出符合设定条件的记录个数;脚本规定了统计指标的标准运算方法。中心通过市卫生健康信息区域平台,结合质控系统,开展数据规范化项目,并取得了以下方面的成效:
表2 住院重点医疗卫生统计指标
(1)对卫生行业标准实施提供技术保障。根据《国家卫生统计调查制度》和《中华人民共和国卫生行业标准》[10],深圳市从2015年启动数据质量项目,现已完成门急诊和住院重点指标数据规范共53项。中心通过市卫生健康信息区域平台,结合质控系统,实现了深圳市63家公立医院指标数据的信息化采集,保证了医院的医院端与前置机端指标结果的完全一致性。从源头上解决数据口径一致性问题,对卫生行业标准的实施提供了技术保障。
图1 数据质量控制系统
(2)实现数据报送规范化、常态化。平台数据中心采集医疗卫生统计指标数据采用前置机方式——通过建立中间库的方式,医院信息系统向平台服务器上传数据。中心依托原深圳市卫生和计划生育委员会发布《医疗卫生统计指标数据规范》,各医疗机构严格按照要求执行规范,加快医院信息系统升级改造,调整数据报送接口、完成字典对照,由机构集成平台或HIS通过系统或者SQL脚本方式推送数据,自动、定时批量地向前置机中间表推送数据。通过统一数据标准,发布强制要求的标准,实现在数据源头上的质量提升[11]。同时,指标数据采集的规范化和信息化,极大地提高了统计工作的效率。
(3)实现数据计算标准化。平台数据中心在规范中制定平台运算的唯一示范脚本,并组织全市63家公立医院统计、信息等相关的人员进行医疗卫生统计指标数据规范培训,会上强调、要求各医疗机构应严格按照规范要求,做到指标统计含义清晰,统计口径、统计算法参照平台脚本进行机构数据统计与推送,从而保证医院端和平台端指标运算过程参照标准的一致性,使两者数据间达到零误差。数据标准落地,影响着平台数据采集后续工作的效率,数据的质量和可用性[12]。
3.2 技术创新
提升数据质量就是要保证数据的准确性、完整性、及时性、一致性[13]。中心借助行政部门的力量,发布标准文件,对全市门急诊、住院重点医疗卫生统计指标的定义、统计口径、算法、信息化采集方式等进行全市统一。指标数据统计结果直接由系统自动生成,保证数据的准确性与完整性。同时,依托深圳市卫生健康信息区域平台建设,利用信息化手段,实现医疗卫生统计指标数据运算标准化及采集信息化。坚持中心平台端统计语句脚本的唯一性,各医疗机构以中心平台端的语句脚本为蓝本,结合自身实际情况,修订医院端的语句脚本,定时批量完成数据推送任务,从而使深圳市63家公立医院的医院端与中心平台端统计结果保持一致,保证数据处理、上传及时,保证医疗机构间数据的同质性,增强数据的可比性。
总之,数据质量是平台应用和大数据挖掘的重要基础[14],数据规范化是解决数据质量问题的重要环节。深圳市在全国范围内率先实现了区域医疗统计指标的规范化和采集的信息化。通过对采集的卫生统计指标数据的含义、统计口径、算法、信息化采集方式等进行全市规范,逐步形成流程、行为规范、最终达到数据规范。同时,利用市卫生健康信息区域平台实现医疗异构数据整合与利用,并加强数据质量监管,实现深圳市医疗数据信息价值利用最大化,提高了深圳市区域医疗机构整体信息化管理水平,为深圳正在着力打造健康中国的“深圳样板”,建设健康中国先行区,努力提升居民的获得感、幸福感和安全感添砖加瓦。