APP下载

健康医疗大数据系统化发展路径探讨

2021-12-29张建

智慧健康 2021年28期
关键词:组学数据中心规范

张建

(南京医科大学转化医学研究院,江苏省转化医学研究院,江苏 南京 210029)

0 引言

健康医疗大数据应用发展将带来健康医疗模式的深刻变化,有利于激发医药卫生体制改革的活力,提升健康医疗服务效率和质量,有利于培育新的业态和经济增长点[1]。为此,国家将健康医疗大数据提升到重要的基础性战略资源高度。自2015年以来,国家发布了《促进大数据发展行动纲要》《关于促进和规范健康医疗大数据应用发展的指导意见》等相应政策文件,启动健康医疗大数据中心与产业园建设试点工程,同时设立国家级研究项目以大力推进我国的健康医疗大数据建设。本文首先介绍了健康医疗大数据各类别的发展现状,随后针对性地分析发展中存在的问题,最后深刻探讨了我国健康医疗大数据的系统化发展路径。

1 健康医疗大数据概念及分类

健康医疗大数据泛指所有与医疗和生命健康相关的极大量数字化信息的集合,其涵盖个人全生命周期内产生的多方面的数据,包括个人健康数据、医药服务、疾病防控、健康保障、食品安全以及养生保健等内容[2]。数据内容丰富、形式多样、结构各异,且来源众多。根据数据特征与应用领域可以将健康医疗大数据分为医疗大数据、健康大数据、生物组学大数据、卫生管理大数据、公共卫生大数据以及医学科研大数据等6 大类[2],见表1。

表1 健康医疗大数据分类[2]

1.1 医疗大数据建设现状及问题

1.1.1 医疗大数据建设现状

为推动健康医疗大数据的应用发展,国家大力推进以电子病历为核心的医疗机构信息化建设。在先后制定《全国医院信息化建设标准与规范(试行)》《全国基层医疗卫生机构信息化建设标准与规范(试行)》等系列文件的基础上,通过实施电子病历系统功能应用水平分级评价进一步推进电子病历信息化建设。同时,印发电子病历数据集、电子病历共享文档等标准、规范,推行卫生健康信息标准应用成熟度评价,以奠定医疗数据汇集、共享的基础。以江苏、福建、安徽、山东、贵州5 省作为国家东南西北中五个健康医疗大数据区域中心及互联互通试点省,同步确立了南京、常州、福州、厦门、济南、合肥、贵阳7个实施建设的试点市[3]。作为健康医疗大数据中心建设首批试点市,福州市健康医疗大数据平台已完成了37 家市级机构涵盖HIS、EMS、LIS、PACS 四个主要业务系统的数据采集、汇聚和治理以及34 家医院归一化处理工作[4]。

1.1.2 医疗大数据建设存在的问题

标准化是实现医疗数据向医疗大数据汇集和共享的基础。然而,在调查国内医院关于数据/术语标准规范的采用情况时发现,参与调查的1135 家医院中,疾病分类编码(ICD-10)、手术操作编码(ICD9-CM)标准采用率较高,而电子病历基本数据集标准(WS 445-2014)、HL7 以及电子病历共享文档规范(WS/T 500-2016)的采用率仅30%左右[5]。可见,医院的数据规范应用及标准化程度依旧不高。在医疗数据的来源上,除医院和基层医疗机构外,还涉及第三方医疗机构。对于此类机构,尚未有具体的信息化规范和数据标准要求。为此,有待卫生等相关部门制定并推动第三方医疗机构采用相应的信息化规范及数据标准,从而推动医疗大数据实现更全面的汇集和共享。

1.2 健康大数据建设现状及问题

1.2.1 健康大数据建设现状

居民电子健康档案作为健康数据汇交的基础,与其他健康数据整合成健康大数据。在国家的重视和推动建设下,电子健康档案建设已逐步走向正规,到2017年建档率已接近80%[6]。同时,健康体检中心、康复医疗中心以及安宁疗养中心等第三方医疗机构关于个人的健康疗养信息也逐步实现信息化。随着健康产业的发展,各种智能体征监测设备走进大众,采集个人运动、生活习惯、部分体征等健康数据。由于人们对自身健康的愈加重视,此类健康数据在未来将进一步急剧增长。

1.2.2 健康大数据建设存在的问题

电子健康档案首次建档采集的信息存有许多疏漏,档案的合格率较低。同时,因基层医疗卫生机构就诊率较低及居民信息素养较低没有意愿主动到社区更新健康信息等原因,导致档案数据更新不及时、死档较多[6]。第三方医疗机构的数据尚未有统一规范及标准要求,后期将难于汇集。同时,虽然智能健康监测设备发展迅速,但各企业设备信息数据自成体系,尚未有行业规范及标准,造成采集数据的准确度得不到保证。

1.3 生物组学大数据建设现状及问题

1.3.1 生物组学大数据建设现状

生物组学数据因高通量测序技术等的高速发展,使得生命科学研究拥有了巨量丰富的数据产出。此类数据更多地倾向于个体的微观水平研究,所得到的数据整合能够进一步充分认识个体机理情况。国内组学发展迅速,众多的科研人员致力于将单个组学或多个组学技术应用于疾病研究工作,推动了组学数据的发展。中国科学院北京基因组研究所于2016年初成立“生命与健康大数据中心(Big Data Center,BIGD)”,以提供组学数据汇交、共享及数据应用服务[7]。2019年6月,在国家层面成立了国家基因组科学数据中心,建立组学数据汇集共享的大数据平台[8]。

1.3.2 生物组学大数据建设存在的问题

国内组学数据平台建设起步较晚,数据汇集源头及机制需进一步协调完善。同时,需要逐步细化建立各组学数据汇集系统,并且在各个组学间布局交互形式,将生物组学大数据构建成整体。

1.4 卫生管理大数据建设现状及问题

1.4.1 卫生管理大数据建设现状

卫生管理数据大部分产生并存储于医疗机构中,部分存在于与医疗服务运营相关联的支持机构。该部分数据的汇集能够展现区域或全国医疗服务的整体情况,为区域及全国医疗服务质量及管理提升提供巨大帮助。2018年4月,国家卫生健康委员会发布了《医院人财物运营管理基本数据集》,对医院人力资源管理、财务与成本核算管理、物资管理以及固定资产管理数据提出了行业标准化要求,奠定了此部分数据汇集的基础。

1.4.2 卫生管理大数据建设存在的问题

对医疗服务支持机构所产生的相应数据尚未有衔接规范要求,因此汇集该类数据存在一定难度。鉴于该数据部分涉及医疗相关机构的内部管理及运营情况,属于机构内部信息,除须向上级监管部门上报相关数据信息外,部分运营敏感信息不适宜进行公开共享。为此,需就相应卫生管理数据建立合适的汇交数据集,后期针对管理及应用需求设定相应的数据权限。

1.5 公共卫生大数据建设现状及问题

1.5.1 公共卫生大数据建设现状

公共卫生数据针对社会群体而言,分为区域性及全国性的人口、疾控、传染病等数据。为公众群体的卫生健康进行的调查、监测数据。目前作为国家科技基础条件平台和国家人口健康科学数据中心,建设有公共卫生科学数据中心。2006年3月中国疾病预防控制中心信息中心制定了《公共卫生科学数据共享服务管理办法(草案)》,对公共卫生科学数据共享服务做出了规范。2012年,国家卫生部门发布了《疾病管理基本数据集》标准,关于艾滋病、传染病、疫苗等防治、登记及管理形成了行业标准。2020年12月,国家卫生健康相关部门及单位专家联合研究制定了《全国公共卫生信息化建设标准与规范(试行)》,进一步明确和强化全国公共卫生信息化建设的基础内容和建设要求。

1.5.2 公共卫生大数据建设存在的问题

该类数据多反映区域性、整体性的卫生情况。然而,各部门、地区、社会组织等治理主体间依然存在各自为战、信息共享“碎片化”、依托平台不同等诸多问题,尚未形成有效的协同机制[9]。需在建立区域性公共卫生大数据汇交融通的基础上,整合成全国性的公共卫生大数据,于此建成从区域到全国的整体化监测监管一体化渠道。

1.6 医学科研大数据建设现状及问题

1.6.1 医学科研大数据建设现状

这里的医学科研数据则是指与医疗和新药研发等密切相关的真实世界研究、药物临床试验以及医学文献等。2012年,国家开始以病种领域布局建设国家临床医学研究中心,要求搭建健康医疗大数据临床研究公共服务平台[10]。

1.6.2 医学科研大数据建设存在的问题

国内尚未建设该类专项数据资源库。国家临床医学中心是以病种类别来建立的,其具有单一性,并且各临床医学中心间尚未能实现良好互通。为此,可以将各临床医学中心的研究数据汇集整合到统一的国家医学科研大数据平台,逐步推动各类健康医疗大数据间的互联与融通。

2 健康医疗大数据建设问题的综合分析

2.1 健康医疗大数据的标准制定及应用尚不全面

标准化是数据汇交的前提。在信息化急速发展的当下,健康医疗数据更新日益频繁。健康医疗数据规范和标准还不全面,仍需进一步加快配套规范和标准的制定完善。同时,在标准制定后,也要建立推广和引导机制,助推相关数据采集和存储机构采用标准和规范。

2.2 数据集成分析技术有待开发

健康医疗大数据类别多、数据量大且形式各异,数据间集成及后续分析成为技术难点。数据间因难于集成形成了“数据孤岛”,数据价值得不到最大化的开发利用。研究破解数据整合技术难点,将具有关联性的数据集成一个整体,利用大数据分析工具进行分析,进而实现数据价值的挖掘开发。

2.3 缺乏相应的法规及管理规范

健康医疗大数据涉及人的隐私信息、机构内部敏感运营信息,以及存在数据归属权益不清晰等问题。在数据的采集、分析应用过程中,缺少对隐私信息的法规约束、机构运营敏感信息的处理机制以及数据归属权益的分配规范,制约了大数据的汇交及应用。

2.4 健康医疗大数据发展战略缺乏系统化

国家在2016年即把健康医疗大数据提升到战略资源的重要高度,发布了系列政策文件予以推动建设。目前,健康医疗大数据建设尚处于试点阶段,各地各点分散,还未形成系统化的发展战略。在全国设立了区域健康医疗大数据中心,缺少国家层面进一步的引导和规划,同时各区域中心间的数据也尚未形成互融互通机制。健康医疗大数据发展前期,需把更多资源和精力优先开展数据资源的汇交上来。汇交整合是前提,只有将巨量准确的健康医疗数据汇集到统一的大数据平台才会有后续的全面分析及应用,进而带动数据产业的发展。

3 针对问题的解决建议

3.1 梳理归类数据,制定标准规范

健康医疗大数据包含数据种类众多,数据源头、结构等存在较大差异。针对健康医疗大数据的发展,可以从各个类别入手,对各源头数据梳理并加以研究归类。根据数据类别不同,结合数据源头和结构特点制定数据规范及标准,并加以推广应用,从而为大数据的后期汇交衔接打好基础。与此同时,也便于后期的数据应用分析,尽快产出数据价值。

3.2 开发适合的数据集成与分析工具

不同类别的数据存储于不同结构的系统中,相关联的数据间需进行数据集成,使各类数据整合成一个整体,进而为医疗健康服务提供便捷。对于大数据而言,需要从海量的数据中挖掘提取出有效信息,功能强大的分析工具是不可或缺的。

为建立更加完备的健康医疗大数据,需将各个类别间进行融合关联,以形成整体,便于后期的分析应用。由于类别化数据的不同,医疗大数据、健康大数据和生物组学大数据间集成融通,使数据整合成基于个人的健康医疗大数据集成,进而形成人们的全面健康医疗信息采集。如此,将会有利于推进人们的个性化诊疗及精准医疗的实现。

3.3 制定出台隐私法规及信息管理规范

关于隐私的立法能够设立隐私的恰当限度,在规范相关数据信息安全的同时,也能合理推进数据的服务应用。制定和完善健康医疗大数据管理规范,对大数据采集、存储、加工、应用和共享等制定规范。通过法律和规范来保障数据安全及各方权益,有效促进健康医疗大数据的发展应用。

3.4 优化健康医疗大数据在国家及区域层面的系统化发展设计

在国家层面进一步统筹规划,充分利用国家健康医疗大数据中心、区域健康医疗大数据中心的层次效用,各中心均设立医疗大数据、健康大数据、生物组学大数据、卫生管理大数据、公共卫生大数据平台,有序汇交不同类型的数据。在划片区建立区域健康医疗中心的基础上,逐步协调片区内的省市参与到数据中心的建设中去,完善区域健康医疗大数据中心的定位与功能。在区域中心内开发数据集成技术,实现类别内不同数据间的关联整合以及类别间数据的关联,进而将数据整合成一个交汇互通的整体。同时,将数据汇交至国家健康医疗大数据中心。各区域健康医疗大数据中心通过汇集医疗大数据、健康大数据、生物组学大数据,建立区域内的数据融通共享机制及权限级别,构建权限级别定位,面向个体的个人健康医疗查询、面向医疗卫生机构的就诊患者健康医疗查询管理、面向监管机构的去隐私化群体概览统计分析、面向研究机构及外界公众的去隐私化查询统计分析。卫生管理大数据、公共卫生大数据则是机构与群体层面上的数据,汇交到区域健康医疗大数据中心,设立政府、机构以及科研账号,分配相应权限。医学科研大数据则仅在国家层面上建立统一的医学科研大数据平台,汇集国内全部的与健康医疗相关的各类研究数据,如图1。

图1 国家健康医疗大数据中心系统规划

健康医疗大数据类别多、源头广,其不仅需要卫生健康监管及信息部门的参与,也还要市场管理、医学院校以及相关科研院所的配合。国家对不同类别的健康医疗数据源头机构制定信息化规范,发布相应的数据标准,以奠定数据汇交基础。标准化数据经由数据接口汇集到区域大数据平台。根据不同类别数据间的特征及关联性开发交互机制,将数据整合成整体。同时,在区域数据中心内部形成数据管理规范,确立管理和使用数据各方的权限、对数据安全方面加以规制,保证区域数据中心的安全有序运行。除此之外,开发数据统计分析工具和探索制定平台数据的共享使用规范,合理推动大数据的应用挖掘,发挥数据的价值,如图2。

图2 区域健康医疗大数据中心系统规划

4 结语

我国医疗信息化起步较晚,医疗健康系统发展还存在体制机制不健全等方面的原因。而健康医疗大数据涵盖面广,是复杂数据类型的集合,在建设过程中不可避免地面临诸多问题。即是如此,就需要我们化整为零对其细化分类逐个分析,并优化顶层设计和布局。从国家层面上建立各类健康医疗大数据的统一的标准和汇交机制,制定相应法律规范,推进健康医疗数据的一体化共享与应用。

猜你喜欢

组学数据中心规范
规范体检,老而弥坚
来稿规范
来稿规范
关于间接蒸发冷机组在数据中心中应用的节能分析
影像组学在肾上腺肿瘤中的研究进展
基于影像组学的直肠癌术前T分期预测
PDCA法在除颤仪规范操作中的应用
东莨菪碱中毒大鼠的代谢组学
浅析数据中心空调节能发展趋势
影像组学在核医学影像中的应用进展