浅谈医疗大数据采集技术
2018-10-31高扬
高扬
摘 要 随着信息技术、网络技术的发展促进了医院信息化建设,也将医疗领域推向了“大数据”时代。全面建立医院信息系统,在临床工作中产生大量医疗数据,蕴含着极大的社会价值。医疗数据为实现医院精细化管理,需将它进行整合、挖掘、分析,以此建立既能满足医院医疗质量考核需求,又能满足临床科研需求的临床数据。
关键词 医疗大数据 区域医疗 数据采集
中图分类号:R197.32 文献标识码:A
1概述
随着国家医疗制度改革的深化,国家对医疗卫生系统信息化建设的投资不断增加,加强信息化建设成为医疗卫生行业的重要目标。医疗信息化的持续发展,产生并不断积累大量的数据,庞大的数据中汇聚各类信息,只有通过有效的采集及专业化处理,才能为其应用提供有价值的参考和佐证。由于这些数据与生俱来就存在异构、分布式、碎片化等特征,造成数据业务规范符合性不强、上传数据匹配度低、获取数据信息不完整、数据存储不规范等问题。 严重影响了区域卫生信息共享和管理质量。本文探讨在医疗大数据利用过程中的主要问题和解决技术,从根本上解决大数据应用难题。
2医疗大数据利用问题分析
医疗卫生行业作为信息化建设的典型代表,“积累”了大量异构、分布式、碎片化的医疗大数据。各地相关部门为有效的采集、分析,利用医疗大数据提高卫生管理和决策水平,正积极建设区域卫生信息平台。但医疗大数据的特征为区域卫生信息平台的数据采集造成困境,这主要体现在数据复杂性和数据质量参差不齐两个方面。
2.1数据复杂性问题
由于医疗行业的业务特点,医疗大数据具有体量巨大、数据繁杂、敏感信息少、时效性高的特征。同时,多元化的数据来源使医疗大数据中大量充斥着非结构化和半结构化的复杂数据类型。基于上述医疗行业大数据特点,对复杂类型数据的时效性采集是满足实时统计分析的需求基础,是实现从数据中获取数据特征信息及规律的必要条件。因此,如何实现医疗大数据的高效采集、挖掘出有用的信息,以满足对复杂类型数据的高效的采集需求,是医疗大数据应用所需解决的问题。
2.2数据质量参差不齐
由于医疗信息化进程的推进,各医疗卫生机构信息化建设的逐步成熟和发展,能够为区域卫生信息平台提供丰富的结构化和非结构化的业务数据。大量的业务数据所构成的医疗大数据,为区域卫生信息平台提供多元的数据资源,同时也带来数量级不容忽视的“脏”数据,数据质量问题浮出水面。如果没有有价值的数据,再先进的技术、再新的模式也是无效的,价值难以体现。
综上,医疗卫生行业需要一种医疗大数据采集技术,该技术是结合医疗卫生行业业务特征能够解决大数据采集过程中数据复杂性问题,实现低耦合、可复用的医疗数据抽取,完成高效率的数据采集,并可以高效、简便的进行数据处理,解决数据的标准化处理,实现高效率高质量的为区域卫生信息平台上报数据。使得业务数据得到稳定高效的处理和发布,从而推动医疗卫生体系的建设和管理,为区域医疗系统的构建提供有力支撑。
3大数据采集技术分析
大数据采集技术结合医疗卫生行业数据及业务特征,构成了适用于其行业的医疗大数据采集技术该技术是结合大数据采集技术、模糊匹配技术以及规范化数据缓存技术,技術之间彼此协作,实现将区域内所属的医疗卫生机构数据自动、准确、实时、安全、可靠的采集至区域卫生信息平台,解决医疗卫生大数据采集过程中遇到的数据复杂性和质量低下等核心问题。
3.1数据模板化采集技术
基于异构医疗系统数据映射模板的数据采集技术,实现针对区域卫生平台业务标准的数据采集,提升业务数据采集的效率。本技术解决了医疗卫生行业业务数据的规范化采集问题,通过数据采集模板的业务约束实现数据的规范化采集,使得数据采集过程更为高效和规范。数据映射模板的设计基于异构医疗数据系统中医疗数据的特点构建,适应医疗行业数据及业务特征。基于数据映射模板的数据采集技术使得医疗卫生行业的业务数据得到稳定、高效、低成本的采集和处理,推动了医疗卫生体系的建立和管理,为区域卫生信息化建设提供了有力的支撑。
3.2模糊匹配技术
模糊匹配是实现数据转换处理的关键性技术,模糊匹配将自动学习策略融合到数据标准编码映射处理过程中去,实现数据标准化处理的自动化。实现数据的标准化处理是提升数据质量的关键技术之一。通过模糊匹配,根据关联度值的情况完成映射匹配,匹配结果经人工校验后得到正确的匹配关联关系,此关系被系统进行记录和学习。在进行多次固定行业的映射匹配后,匹配的精度和准确性会随着行业实践次数的积累而线性提升,在提升数据处理质量的同时,也大大降低了处理成本。
3.3规范化缓存技术
规范化缓存技术实现对医疗业务数据的规范化处理,提升数据质量,使得数据符合业务归档要求。规范化缓存技术所依赖的业务模板模型的设立是基于医疗业务的标准规范来创建的,该规范包含医疗行业国家标准、医院业务规范,同样包含数据编码规范和数据存储格式规范。由于医疗行业对规范依赖的特殊性,使得医疗数据规范化的价值在实际应用中尤为突出。
医疗大数据采集技术所涵盖的3类关键技术彼此协助,通过大数据采集运行引擎的支撑实现数据的标准化采集及处理,实现各医疗卫生机构结构及非结构化数据的采集及向区域卫生信息平台的上报。
4结语
医疗大数据采集技术,其汇聚统一安全保障以及支持负载均衡与高可用性的技术解决方法,构建出全面支撑面向服务的医疗大数据采集解决方案。可支撑包括各级医院、基层医疗卫生机构、公共卫生数据的采集和上报业务。医疗大数据采集方案的根本目标是解决医疗大数据采集过程中面临的数据类型复杂多样、建设成本高等困境。支持区域卫生信息平台通过医疗大数据方案提供的各项数据实现对区域内各个医疗机构统一的管理与维护,实现统筹决策、疾病预警、业务协同、医疗机构监管等平台应用。平台端利用获取到的各项数据进行各类医疗业务综合处理,实现区域内平台、医疗监管机构与各医疗机构端的数据协同。
高效的数据采集对卫生信息平台至关重要,大数据在提供医疗决策支持和提高卫生管理水平中发挥着重要作用。医疗数据的采集方案的实施有效的简化了工作的难度、缩短了实施周期、降低了项目成本、提高了数据质量,为区域卫生信息平台提供优质数据。实现助力区域卫生信息平台的建设和发展。