APP下载

全民健康保障信息化工程大数据分析系统设计与应用

2021-03-04王士泉陈忠民

医疗卫生装备 2021年2期
关键词:数据分析系统全民人口

王士泉,陈忠民,李 蓉,张 瑞,蔡 玥,李 伟*

(1.东华软件股份公司,北京100191;2.火箭军特色医学中心核辐射损伤与监测研究室,北京100088;3.火箭军特色医学中心健康管理科,北京100088;4.国家卫生健康委统计信息中心,北京100044)

0 引言

全民健康保障信息化工程一期项目(以下简称“全民健康保障信息化工程”)是国家政务信息化工程建设中的重点。该项目依托国家电子政务外网和现有信息化基础,以城乡居民电子健康档案、中西医电子病历和全员人口信息为核心,综合运用云计算、大数据、新一代移动互联网等新兴信息技术,有效整合卫生计生信息资源,实现跨地域跨部门的信息共享,上下联动,医疗、医药、医保协同,从而有效提高我国卫生计生服务能力、综合监管能力和信息服务能力,促进多部门合力解决社会突出问题,以满足人民群众多层次、多样化的健康需求。

截至2018年,全民健康保障信息化工程已经采集并存储了大量数据,包括全员人口、电子病历、居民健康档案、卫生统计、委属(管)医院上报等信息。但是这些业务信息分散在各应用系统中,亟须汇聚融合并有效利用,因此需要在拥抱信息化、迎接大变革、推动大健康、实现大发展的时代背景下构建深度应用[1]。本研究通过融通各类结构化、非结构化及半结构化的数据资源,建设一套全民健康保障信息化工程大数据分析系统,进行深度挖掘,辅助全民健康保障信息化工程在分级诊疗制度、现代医院管理制度、全民医保制度、药品供应保障制度、综合监督制度等维度打造示范应用[2]。

1 需求分析

健康医疗领域的大数据分析有别于传统常规业务工作中的统计分析,更强调从大量、多维度的原始业务数据中发现趋势以及变化规律、异常现象、关联因素等。大数据在分析过程中普遍采用人工智能方法,包括量化(如对病案首页中文本的处理)、分类(如基于特征提取的疾病分类)、搜索(如多模异构病例数据的关联检索、模糊匹配)、关联(如人口、死因、体征等信息的融通后表达)、预测(如基于病案首页的费用预测)、推理(如基于流行病学的扩散分析)等[3]。

全民健康保障信息化工程覆盖了综合管理、公共卫生管理、医疗健康服务、基本药物运行监测、卫生服务质量与绩效、全员人口统筹等业务领域,如图1所示,涉及服务范围广、业务数据量大,这对数据分析、业务响应速度和效率提出了更高的要求。但是传统的应用开发技术与数据处理方法难以满足全民健康保障信息化工程对庞大数据量的分析要求,大数据技术却能提供更好的支撑。全民健康保障信息化工程的六大示范应用中均有大数据分析业务需求。从系统集约化建设角度来看,将六大示范应用领域对大数据分析的需求进行提炼、归纳,并构建统一的技术服务体系与架构显得尤为关键。

图1 全民健康保障信息化工程六大示范应用

全民健康保障信息化工程作为国家卫生信息化基础支撑环境,其大数据分析的主要目的是对基本业务应用大数据进行综合分析,包括但不限于医疗服务质量与绩效评价分析[基于疾病诊断相关分组(diagnosis related groups,DRGs)的大数据决策分析、重点科室DRGs分析、医疗资源配置与能力评估分析]、药品分析(基本药物制度运行评价、药品价格比较、药品应用分析)、三大基础库分析(电子健康档案库分析、电子病历数据库分析和全员人口库分析)以及对国家发布的一系列与医疗卫生相关政策的分析,从而辅助国家卫生健康相关政策的制订,对政策落实情况进行跟踪和预测(包括医改政策、公共卫生政策、医疗服务政策等)。

2 系统设计

以“健康中国2030”为主线,按照“整合、优化、共享、外包”的理念,整合资源、系统、服务,建设全民健康保障信息化工程大数据分析系统,从而支撑公共卫生、区域医疗、临床科研、个人健康等服务。根据六大业务场景(即六大示范应用)的划分,设计全民健康保障信息化工程大数据分析系统总体业务功能框架,如图2所示。

国家全民健康数据中心为全民健康保障信息化工程提供大数据分析所需的基础业务数据资源,包括基础数据资源(全员人口、健康档案、电子病历等)、来自于业务应用系统的数据资源[44家委属(管)医院上报信息、基层医疗卫生服务及绩效考核评价信息、医疗资源监管与服务信息、医疗质量监管信息、妇幼保健信息等]以及历史数据[包括卫生统计直报数据(机构信息、报表信息、病案信息等)]和人口数据(死亡登记、出生登记等)。

图2 全民健康保障信息化工程大数据分析系统业务架构

3 系统技术路线

大数据分析系统作为全民健康保障信息化工程的基础系统,涵盖了从数据处理到数据分析、服务实现到服务管理,而不同功能面向的问题域不同,其实现机制也不尽相同,因此在系统建设中需要采用多元化的技术路线,以满足系统功能、性能、安全等需求。

系统技术路线采用以容器、微服务、DevOps技术为基础的云原生技术体系,从技术服务模式上可以划分为IaaS(Infrastructure as a Service)层面、PaaS(Platform as a Service)层面和SaaS(Software as a Service)层面。

在IaaS层面,由云服务运营商来提供基础网络接入与云技术支撑,包括云计算服务、云存储服务和云网络服务。其中,云计算服务包括x86云主机、裸金属、弹性伸缩、镜像服务、云桌面及GPU云主机;云存储服务包括云硬盘服务、对象存储服务、文件存储服务、云网盘服务、云主机备份及云硬盘备份;云网络服务包括vRouter、Floating IP、负载均衡、网络地址转换(network address translation,NAT)网关、私有网络(virtual private cloud,VPC)、域名系统(domain name system,DNS)等。

在PaaS层面,由平台承建商提供核心能力,包括基础技术层与技术服务层。其中,基础技术层包含大数据技术服务(包括数据平台MapReduce、列数据库Hbase、流计算Storm、内存计算Spark、数据仓库Hive、实时计算Flink、MPP引擎、搜索服务Elastic-Search)、中间件服务[包括微服务架构引擎、开发流水线(应用开发)、API服务网关、分布式缓存服务Redis、分布式消息服务RabbitMQ、分布式消息服务Kafka]和数据库服务(包括云数据库MySQL、SQLServer、PostgreSQL、MongoDB以及分布式关系型云数据库)。技术服务层包括全局序列、分布式任务调度、统一认证、统一时间服务、工作流引擎、规则引擎、微服务框架、加密服务、分布式事务、数据脱敏、分布式缓存、分布式对象存储等组件。

在SaaS层面,由各应用模块的具体研发单位提供业务服务支持。在开发层,以Java EE Web技术体系为主。后台采用基于模型-视图-控制器(model-viewcontroller,MVC)模式、对象关系映射框架(object relational mapping,ORM)模式以提高系统的灵活性、重用性和维护性,其中MVC选择的框架是SpringMVC,ORM选择MyBatis。前台采用HTML5、BootStrap框架。前后台交互采用Http+JSON方式实现。在数据层,系统数据存储主要采用关系型数据库、NoSQL数据库和分布式文件系统。其中,关系型数据用来存储数据资源中的基础业务数据和字典数据,主要是各类结构化业务数据,提供对数据查询、信息验证等数据服务的支撑;分布式文件系统用来存储数据资源中的数据仓库主题数据和专题数据库中的专题数据,主要是结构化数据、半结构化数据和文件,并结合数据批处理技术,提供对数据分析应用的支撑;NoSQL数据主要存储面向应用具体需要的缓存数据,支撑对性能、并发性要求较高的应用。数据处理主要采用SQL、批处理和流处理相关技术,以支撑数据查询、数据分析的需要。在服务层,系统采用面向服务的架构,基于高内聚、松耦合的设计思想,按照统一的标准,将系统对外提供的共享功能均封装为服务,并通过服务总线进行统一管理。对于需求变化大、访问并发数高的服务,采用微服务方式,将服务细分为可独立部署的微服务,并采用开发运维工具(DevOps)和容器技术实现自动化的部署,基于云技术实现服务资源的弹性伸缩,以满足性能和扩展性要求。同时,系统对外服务接口统一采用Restful Web Service技术,并通过JSON格式传递信息。

4 系统实现

全民健康保障信息化工程大数据分析系统的技术架构是在可扩展的分布式数据库与大数据技术支撑体系的基础上,结合全民健康保障信息化工程的实际情况而设计的多层、可扩展框架结构,如图3所示。架构的核心建设内容分为数据源层、数据整合层、分布式数据存储和处理层、展现与分析层、应用发布层及用户层6个部分,数据治理服务贯穿于其中。大数据分析系统的用户主要面向国家卫生健康委员会各司局、国家卫生健康委统计信息中心以及中国疾病预防控制中心等业务分析人员,且系统支持与医疗保障、药监局、民政、公安等外部机构进行信息交互。

图3 全民健康保障信息化工程大数据分析系统总体技术架构

系统利用综合分析工具、数学分析模型与展示工具完成卫生政策综合分析与决策支持、委属(管)医院监管、医改进程监测、慢性病监测与预警、基本药物制度监测、医疗服务价格和成本监测、医疗资源配置与能力评估、医院运行监测、成本收益监测、医疗质量监测等统计学分析[4]。针对管理者的不同需求,系统还提供多种配置方式,本系统可采用仪表盘、指示灯、曲线图、直方图、饼状图、报表等方式展示分析结果及数据[5]。同时,系统利用各类综合业务分析模型与数学模型对包含区域分级诊疗效果评价、医疗服务质量监测、医疗资源配置与能力评估、老龄化趋势在内的多项应用提供分析工具与分析服务,实现在卫生政策综合分析与决策支持、委属(管)医院监管、人口决策支持领域的大数据支持[6]。通过集成R语言及Cognos、Beyond BI等多种分析途径面向业务人员提供数据挖掘、联机分析、即席查询和报表等多种功能[7]。

截止到2020年4月,全民健康保障信息化工程大数据分析系统的部分功能已经研发完成并上线,主界面如图4所示。本文以DRGs分析、健康档案库分析、全员人口库分析作为应用示范进行说明。

图4 全民健康保障信息化工程大数据分析系统主界面

4.1 DRGs分析

DRGs分析模块包括重点专科评价、质量安全分析、数据模型分析、标杆对比等功能。其中,标杆是通过大数据测算得出的一个通用标准,分为常规指标与DRG指标2种。常规指标包括药占比、耗材占比、死亡人数、平均住院日等,DRG指标包括组数、入组率、病例组合指数(case mix index,CMI)、中低风险死亡数等。在大数据分析系统中,选中任何一家医院都可以与本省标杆、全国标杆、全国综合医院标杆进行对比,如图5所示,通过雷达图可清晰地看出各指标高低。

4.2 健康档案库分析

健康档案库分析模块包括双线转诊情况分析、二孩出生情况分析、健康指标分析、老年人健康分析、慢性病管理情况分析、健康档案库数据校验等功能。本文以双向转诊情况分析中的双向转诊流向分析功能和二孩出生情况分析为例进行说明。

图5 DRGs分析——标杆对比

双向转诊主要是充分利用各社区医院的服务功能和网点资源,促使基本医疗逐步“下沉”到社区,让社区群众危重病、疑难病的救治转到大中型医院。双向转诊流向分析功能实现了对不同年份各省、市公立医院转往基层医疗卫生机构住院患者占比与基层医疗卫生机构向医院转诊患者占比2个指标间的数据对比,如图6所示。其中,公立医院转往基层医疗卫生机构住院指标的计算方法为:年末公立医院转往基层医疗卫生机构住院患者数/基层医疗卫生机构住院患者总数×100%;基层医疗卫生机构向医院转诊患者指标计算方法为:(年末基层医疗卫生机构向上级医院转诊人次数+转入上级医院的住院人数)/[基层医疗(门诊人次数+住院人数)]×100%。

图6 健康档案库分析——双向转诊流向分析

同时,二孩出生情况分析中可以以柱状图的形式展现二孩出生人数的年度分布情况及各省份分布情况,如图7所示。

图7 健康档案库分析——二孩出生情况分析

4.3 全员人口库分析

全员人口库分析模块包括人口出生及死亡情况分析、人口老龄化分析、人口分布构成分析、人口婚姻状况统计分析等功能。其中,对人口出生及死亡情况分析以柱状图的形式展现人口的出生人数、出生率、死亡人数、死亡率,以表格形式展现各省份的总人口、城镇人口、城镇人口占比、乡村人口、乡村人口占比、人口出生率、人口死亡率和人口自然增长率。各指标中出生率指某一地区在一段时期之内(通常指1 a)出生人数与平均人口之比,可反映出人口的出生水平;死亡率指某一地区一段时间内的死亡人数与该时期平均总人数之比。人口出生死亡情况分析如图8所示。

人口老少比是反映一个国家或地区人口年龄结构的重要指标。人口老少比分析功能利用柱状图展现少年、老年人口数量,用折线图展现老少比的变化趋势,如图9所示。人口老少比的数据来源于全员人口库,人口数量指人口的绝对量,即人口总体中所包含的生命个体的多少。老少比的计算方式为:(≥65周岁人口数÷0~14周岁人口数)×100%。

5 结语

大数据分析系统作为全民健康保障信息化工程的亮点,其所支持的业务和采用的技术是不断变化的,因此系统建设不是一蹴而就的,而是要经过一个逐渐完善和演进的过程,将其提供的业务服务内容逐步丰富、粒度逐步细化[8]。通过实施全民健康保障信息化工程大数据分析系统,利用大数据信息处理技术与分析方法,对医疗服务质量与绩效、三大基础库进行分析,可以有效提升卫生行政部门科学决策、综合监管以及信息服务能力,促进多部门合力解决社会突出问题。当然,本系统在界面友好性、兼容性、数据分析粒度与维度以及跨机构应用场景拓展等方面仍有不足之处,将在后续工作过程中逐步完善[9]。

图9 全员人口库分析——人口老少比分析

猜你喜欢

数据分析系统全民人口
《世界人口日》
全民·爱·阅读
人口转型为何在加速 精读
利用GSM-R接口数据分析系统偏移的方法研究
焊接设备实时监测与数据分析系统在核电建造行业的应用
基于信息融合的社群金融信息数据分析系统的研究与实现
人口最少的国家
1723 万人,我国人口数据下滑引关注
智能数据分析系统研究及应用
可持续全民医保