大数据在医疗领域的应用
2017-03-17黄海燕
黄海燕
摘 要:随着科技的不断进步,人们处理数据的技术不断增强,大数据的概念被越来越多的人所提及,并广泛应用到各行各业。本文概述了大数据的基本含义,阐述大数据的基本特征,并对大数据在医疗行业的应用问题做了深入挖掘。
关键词:大数据;医疗;大数据挖掘
引言
随着信息时代的不断发展,海量的数据被产生出来。在人们的日常生活中,方方面面都可能产生数据。这些数据反应了社会规律和自然规律,被认为是一笔重要的战略资源,与自然资源等可以相提并论。有统计显示,一般的医疗机构每年会产生1TB到20TB的数据,一些大医院甚至可以产生300TB到1PB的数据。随着技术的不断进步,人们处理数据的能力和技术也不断增强。从前,人们只能看着这些宝贵的数据白白丢失;现在,这些数据有望被运用到智慧医疗方面,即让患者就医更方便、疾病诊断更加高效,以及医疗信息更加准确。
一、大数据概述
(一)大数据的定义
随着智能手机、平板电脑、移动互联网、物联网等各式各样传感器的涌现,数据源呈现指数级增长,信息数量迅速扩大。从这些海量数据中提取有用信息并加以利用,已经成为战略性发展和要求。大数据可以通过在海量数据中提取的有用信息,挖掘新的认知,创造新的价值,从而改变市场关系和组织机构。
关于大数据的定义,目前学术界仍然没有获得统一共识。一般认为,大数据指的是巨量数据结合,是指无法在一定时间范围内用常规软件工具和软件进行捕捉、管理和处理的数据集合,是需要更强的决策力、洞察发现能力才能加以挖掘和应用的数据。大数据不是单纯的海量数据,而是大量种类繁多、价值密度低、处理速度要求快和实效性要求高的数据的集合。目前,大数据在互联网、金融、农业等领域都有广泛的应用。
(二)大数据的特征
通常,用4个V(即Volume, Variety, Value, Velocity)来概括。
一是体积巨大。截止到目前,人类生产的所有印刷材料的数据量是300PB,大企业一年生产出的数据量大多处于TB量级。
二是数据种类繁多。对此,人们把这些数据分为结构化數据和非结构化数据。结构化数据多以文本为主,非结构化数据则包括音频、视频、地理位置信息等。这些数据为数据的挖掘处理能力提出了更高要求。
三是价值密度低。在大量不断生产的数据流中,只有极少数的数据是有价值的,如何在海量数据中挖掘真正有用的数据,进行数据“提纯”成为大数据工作者研究的重点。
四是处理速度快。据统计,预计到2020年,全球数据使用量将达到35.2ZB。在如此海量的数据面前,各国政府及企业能否加快处理数据的效率,将成为成败的关键。
(三)大数据的意义
大数据最重要的意义是预测。比如,商业公司对消费者日常的购买行为和使用商品习惯进行汇总和分析,了解到消费者的需求,从而改进已有商品并适时推出新的、消费者很可能会满意的商品。知名互联网公司谷歌对其用户每天频繁搜索的词汇进行数据挖掘,从而进行相关的广告推广和商业研究。
由于大数据的处理迫在眉睫,近年来各国政府和全球学术界都掀起了一场大数据技术的革命,都在积极研究大数据的挖掘技术和分析手段。很多国家都把大数据技术研究上升到了国家战略高度,提出了一系列的大数据技术研发计划,从而推动政府机构、学术界、相关行业和各类企业对大数据技术进行探索和研究。
可以说大数据是一种宝贵的战略资源,其潜在价值和增长速度正在改变着人类的工作、生活和思维方式。可以想见,在未来,各行各业都会积极拥抱大数据,积极探索数据挖掘和分析的新技术、新方法,从而更好地利用大数据。当然,大数据并不能主宰一切。大数据虽然能够发现“是什么”,却不能说明“为什么”;大数据提供的是一些描述性的信息,而创新还是要人类自己来实现。
二、大数据对医学研究的影响
(一)大数据改变医学诊断手段
大数据分析为许多医学难题的解决提供了新途径,改变了一些疾病诊断方式。大数据可以挖掘出大量以往的相似疾病案例,通过分析这些诊断数据,对疑难杂症进行快速判别。如,在心脏病的诊断过程中,首先采集心脏数据并转化为心脏图谱,然后根据图谱进行建模,模型中的变量包括压力、张力、僵硬度等,最后根据这个模型分析心脏疾病病情,并作出相应的诊疗方案。此外,还可以利用图像处理技术,将心脏数据建模成为一个虚拟实体,通过设置不同的参数,模拟观察各类手术或者药物对心脏机能造成的影响,从而在诊疗之前就对诊疗后心脏疾病可能的走势做出预测,为获取疾病诊治方法提供了手段。
(二)大数据可预测病情的扩散趋势
当流行病发生时,可以对疾病已有的扩散趋势和感染人数进行建模,对每一个时间节点的数据进行分析处理,从而对流行病进行统计研究,预测病情的扩散趋势,为疾病防治提供参考。同时,当下一次疫情发生时,可以调出往年数据进行分析,了解规律,从而有望抑制病情的进一步扩张。
(三)大数据有望决定现代医药学研究成败的关键
当前在我国,优质医疗资源有限,患者往往需要争抢医疗资源,才能获得一个宝贵的治疗机会。然而,患者个体差异巨大,疾病种类繁多,且仍然有很多现代医疗技术无法解释和治疗的疑难杂症,使得诊断很难标准化和自动化。同时,医生在治疗时,治疗手段和方法、治疗进度等并不公开透明,缺少病人的主动参与。此外,医生工作强度大,医疗资源不足,误诊漏诊现象时有发生,使得医患矛盾不断加剧,医患关系已经在近年来成为了一个社会问题。大数据医疗则可以使患者主动参与到医疗过程中。医生可以在海量数据中找到病人的既往病史、体质特征、健康数据等资料作为辅助,从而更好更快地为病人做出准确的判断。
此外,以往医院的医疗数据都是独立的,病人若首次在某家医院就诊,医生还需要花费时间和精力了解病人的既往病史,既降低了诊治效率,也增加了病人就医的时间成本。大数据使得医院之间互通数据成为了可能,可避免患者在多个不同的医院之间进行重复诊治而付出高昂的医疗费用。大数据医疗有望构建一个以患者为中心的个性化平台,为患者提供疾病治疗、疾病管理、挂号预约、健康数据查询等多方面的服务,充分尊重患者的价值观和需求,协调不同专业的医疗服务。可以说,大数据有望带来医学研究、临床决策、疾病管理、医疗卫生决策等方面的改变甚至革新,从而带来整个医疗模式的转变。
三、大数据在医疗行业的应用
(一)疾病预防
大数据可以帮助研究者比之前任何时候都更了解健康影响因素。有统计显示,大约只有10%到15%的健康影响因素已经被现代医学确定,而剩下的85%到90%的影响因素,包括基因、健康行为、自然和社会环境均未被确定。利用大数据,研究者可以将患者的家族病史、医疗记录等与平日的生活习惯、饮食习惯、收入、教育等方面联系起来,通过对海量的数据进行分析比对,研究这些健康影响因素相互之间的关联。通过对不同区域、不同年龄的人群进行评选,筛选健康相关危险因素,并制作健康监测评估图谱数据库和知识库,提出有针对性的疾病预防计划,以促进居民健康水平的提高,降低患病风险。这样一来,大数据可以显著提高医疗和健康服务,且对不同的人群提供不同的干预措施和针对性的解决方案。
大数据还可以整合和分析公共卫生数据,提高疾病预报能力,加强对疾病的监测。例如,Asthmapolis公司为哮喘患者研发了一种追踪器,记录患者吸入器的使用,并將数据传输到中央数据库进行分析,用来了解个人患者的疾病进程和使用习惯。将这些数据与疾病预防中心的哮喘危险因素数据结合,能够有助于医生为患者制定更加个性化的预防、治疗计划。
(二)临床应用
在医学临床方面,大数据有着广泛的应用天地,包括相对疗效研究、医疗资料的透明化、病人病历的进阶分析、药物副作用分析和远距离监测病患。
1.相对疗效研究
信息时代使得电子病历的普及成为可能。目前,电子病历结构化数据已逐渐成熟,通过大数据分析海量的医疗数据,比较分析不同的干预措施的有效性。这为临床治疗决策提供了非常有用的参考信息。在医疗护理系统中利用大数据实现相对疗效研究,将大大提高疾病诊疗的效率,减少过度治疗以及治疗不足。
2.医疗资料的透明化
大数据分析可以对不同医院的治疗费用、治疗质量与绩效进行评估和比对,并快速呈现出来,让患者一目了然。此外,大数据有望精简业务流程,从而降低成本,提高医疗护理质量并给患者带来更好的就诊体验。
3.患者病历的进阶分析
目前,电子病历系统包括三部分数据,即电子病例数据、医学检验数据和医学影像数据。电子病历是病人自述病症、医生记录产生的以文字标书为主体的数据,是一种非结构化的数据。医学检验数据来自于医学检验设备,主要包括各种数据,具有标准性和规范性的特点,是一种结构化数据。医学影像数据则包括X光片、B超影像等来自医学影像设备的数据,由于这些数据以图像为主,因此是一种非结构化数据。构建电子病历系统,可以全面掌握患者的病情演进情况。大数据可以对海量的患者病历和档案进行进阶分析,确定哪些人是某类疾病的高危感染人群,并按照不同患者的既往病史为其提供不同的治疗模式和不同的预防性保健方案,才能达到最佳治疗效果。
4.药物副作用分析
在临床用药的过程中,药物使用可能会引起患者的不良反应。这种不良反应会导致药物不能发挥原本的作用,治疗效果减弱,严重时甚至导致患者死亡,同时不合理的用药也可能大大集中患者的经济负担。来自美国的统计显示,每年美国有70度万人因为药物副作用受到伤害或者死亡。通过对产生药物副作用的患者病情进行分析,挖掘出不同药物的副作用可能产生的情况,从而提高患者疾病的治疗质量,指导临床用药,减少药物副作用或不当用药对患者的伤害,并指导新药研发。
5.远距离监测病患
随着传感器的进步和物联网的发展,大量可穿戴设备、各类App等出现,能够实时获取病人的健康信息。许多高血压、心脏病、糖尿病患者在家中测量的血压、心率、体重、血氧、吐气流量等健康指标和数据都可以传回医院或健康管理中心,给医疗人员提供诊断参考,便于给患者提供饮食和生活建议。
(三)互联网医疗
互联网的发展与大数据技术的进步使得在线医疗成为了可能。在互联网医疗网站上,患者提供病症相关数据,医生根据这些病症数据,对患者的病症情况进行初步判断。该方法能够在一定程度上环节医疗资源不足和分布不均的情况,但是无法从根本上解决这一难题。由于常常有非专业人员给出诊断答案以及缺乏详尽的病理数据,通过互联网医疗网站很难得到准确的医疗治疗。此外,网络药房也在近年来逐渐兴起。通过网络药房,患者可以购买非处方药,或是提供医生的处方购买处方药,等待药品送货上门的。这种方式减少了患者去药房或者医院的时间成本,有一定的发展空间。
四、大数据在医疗领域应用的几个关键问题
将大数据全面应用于医疗领域中,构建医疗大数据系统,除了国家政府从政策层面鼓励支持和加强引导之外,各级政府及医院等相关机构也需要行动起来,积极迎接大数据。
(一)推广电子病历,实现数据标准化采集
各级政府应鼓励医院使用电子病历。在使用电子病历的医院中对医生作出一些规范性的要求,使电子病历记录规范。此外,医学检验数据和影像检验数据的采集和存储也需要规范,同事要建立统一的数据库存储系统来分门别类的存储这些信息。在推广电子病历和构建医疗大数据系统中,数据标准化十分重要,是技术实现的关键问题。
(二)确保数据库的安全性
病历是患者的个人隐私。将这些隐私信息被转移到线上时,应该注意数据库的安全性,保障患者的个人隐私。技术部门要持续更新病毒库,定时对数据库系统进行查漏补缺,同时不断攻克技术难关,加强数据库的安全性,确保患者隐私信息得到保障。
(三)大数据挖掘分析方法
要想真正将大数据为己所用,适当的大数据挖掘分析方法必不可少。大数据挖掘的核心内容是数据的特征与属性提取,并依据特征和属性进行分类。在此基础上,对不同属性的数据类型进行关联分析,从而获得有价值的信息。目前,大数据挖掘分析方法包括分类、估计、预测、聚变等。大数据相关从业人员有必要不断学习理论知识,同时在实践中积累大数据挖掘分析经验,从而提高大数据分析能力。
五、结语
大数据分析是当前计算机科学与技术领域的热点。各个领域都认识到了大数据可能带来的好处,获得大数据并挖掘其中有价值的信息对于领域发展十分重要,也是未来科学发展的必然方向。在医疗领域,大数据有着广泛的应用空间,可以用在包括疾病预防、临床应用、互联网医疗等方面。可以说,医疗大数据是未来医疗领域的发展趋势。目前,在医疗行业应用大数据方面,我国还处于初级阶段,政府、医院及数据挖掘技术人员需要共同努力,才能让大数据在医疗领域发挥作用。
参考文献:
[1]邹北骥.大数据分析及其在医疗领域中的应用[J].计算机教育.2014(7):25-27
[2]周光华,辛英,张雅洁,胡婷,李岳峰.医疗卫生领域大数据应用探讨[J].中国卫生信息管理杂志.2013(4):74-76
[3]王潇,张爱迪,严谨.大数据在医疗卫生中的应用前景[J].中国全科医学.2015(1):102-106
[4]罗旭,刘友江.医疗大数据研究现状及其临床应用[J].医学信息学杂志.2015(5):18-19